Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于代码有些疑问 #5

Open
chenzean opened this issue Jul 29, 2024 · 7 comments
Open

关于代码有些疑问 #5

chenzean opened this issue Jul 29, 2024 · 7 comments

Comments

@chenzean
Copy link

image
其中这两个变量似乎在后面没有用到。请问作者是这样吗

@Yaziwel
Copy link
Owner

Yaziwel commented Jul 29, 2024

image 其中这两个变量似乎在后面没有用到。请问作者是这样吗

n_layer和layer_id我没有用,vision-rwkv初始化使用了这两个参数

@chenzean
Copy link
Author

哦哦哦好滴

@chenzean
Copy link
Author

}@57HAU0B_FA (236CX09Y8
作者,你好!我对于RWKV不是很了解。所以我想问一下。进行Bi-WKV计算的时候必须要以同样的方式扫描才可以吗?
可以用不同的方式去扫描再去计算Bi-WKV吗?

@Yaziwel
Copy link
Owner

Yaziwel commented Jul 30, 2024

}@57HAU0B_FA (236CX09Y8 作者,你好!我对于RWKV不是很了解。所以我想问一下。进行Bi-WKV计算的时候必须要以同样的方式扫描才可以吗? 可以用不同的方式去扫描再去计算Bi-WKV吗?

K和V必须严格对齐的,Bi-WKV的公式里有

@chenzean
Copy link
Author

作者,你好!
关于K和V必须是以相同的方式进行扫描。这是为什么呢?
image
作者可以解释一下吗?

@Yaziwel
Copy link
Owner

Yaziwel commented Jul 30, 2024

k_i影响v_i的加权权重,对齐的情况很好理解,当前token的value的权重由当前key决定,这是完全没问题的;如果不对齐,当前token的value的权重由其他某个位置的key决定,直觉上是不合理的,不过你可以试试。

@chenzean
Copy link
Author

好的,感谢作者的解答,我有点明白了

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants