GloVe模型新数据预训练方法

tamoadmin 球队新闻 2024-04-27 67 0

GloVe模型新数据预训练方法

理解GloVe模型

GloVe（Global

Vectors

for

Word

Representation）是一种基于全局词频统计的词表征工具，它可以将一个单词表达成一个由实数组成的向量，这些向量能够捕捉到单词之间的语义特性，比如相似性、类比性等。通过对向量的运算，比如欧几里得距离或者cosine相似度，可以计算出两个单词之间的语义相似性。

GloVe模型的训练过程

GloVe的共现矩阵是对称的，矩阵中的每一个元素Xij代表单词i和上下文单词j在特定大小的上下文窗口内共同出现的次数。GloVe通过一个衰减函数来计算权重，距离越远的两个单词所占总计数的权重越小。GloVe的训练方式本质上跟监督学习的训练方法没什么不一样，都是基于梯度下降的，具体地,这篇论文里的实验是采用了AdaGrad的梯度下降算法，对矩阵X中的所有非零元素进行随机采样，学习曲率设为0.05，在vectorsize小于300的情况下迭代了50次，其他大小的vectors上迭代了100次，直至收敛。