标签:: Word Vector

0

Efficient Estimation of Word Representations in Vector Space

Abstract提出两个创新的模型架构,用于在非常大的数据集上计算连续型的词向量表示。这些表示的好坏的用词相似性任务来测量。计算复杂度下降了,同时在准确度上还有巨大的提升。在当时是state-of-the-art的做法。 1 Introduction许多现在的系统将词表示在词库中的索引,并不包含词的相似性的概念。这个选择的原因是:简单、鲁棒以及一个观察到的现象:在大量数据上训练出来的简单模型要比在