可视化
⾼维矩阵或者向量的运算,是⼀个困扰着我很久的问题;在NLP⾥⾯经常就会碰到三维,四维的向量运算,矩阵相乘时相当头痛,⽐如著名的Attention中Q、K、V相乘,实在想不出来四维的到底长什么样,⼜是怎么相乘的。于是特地写下此⽂章,记录下个⼈的学习路程,也希望帮到⼤家。 1、⾼维矩阵可视化
⼀维:⾸先⼀维的矩阵⾮常简单,⽐如[1,2,3,4],可以⽤下图表⽰
JY改造系统⼀维:
⼆维:接着来看⼆维,可⽤以下代码⽣成⼀个⼆维矩阵,采⽤keras框架
⼆维:
import keras.backend as K
点火时间import numpy as np
磷酸肌酸激酶a = K.constant(np.arange(1, 7), shape=[2,3])
print(K.eval(a))
输出为:
[[1. 2. 3.]中学数理化
[4. 5. 6.]]
林麝看维度的⼩技巧:想知道⼀个矩阵的维度是⼏维的,只需要看开头有⼏个“[”,有1个即为1维,上⾯的两个就是两维,后⾯举到的三维和四维的例⼦,分别是有三个“[”、四个“[”的。
上