Semantic Specialisation of Distributional Word Vector Spaces using Monolingual and Cross-Lingual Constraints
这篇文章想用同一语言和跨语言资源中获得的约束来增强词向量的质量。
这篇文章想用同一语言和跨语言资源中获得的约束来增强词向量的质量。
Sentence ClassificationCNN sentence classification for sentiment analysishttps://github.com/yoonkim/CNN_sentence.gitKim, Yoon. “Convolutional neural networks for sentence classification.” arXiv prepri
这篇文章挺有意思的,在已有的word embeddings上学习一个从字符级别的序列上建立一个word embedding。模型使用的是RNN,双向的,输入是一个单词,输出就是一个向量。训练的时候输入都是已有word embedding中lexicon的单词,输入的ground truth是原始的向量。 这么做的目的是希望能够解决UNK(未登录词)的表示,它的理论假设是从字母组成语义是要遵循一系列
IntroductionThis paper is going to show that a discrimininatively trained, multi-layer capsule system achieves state-of-the-art performance on MNIST and isconsiderably better than a convolutional net
编码问题之前听说python 3.6极其的好,在编码上面都是UTF-8的,这样可以解决很多自然语言处理中的常见编码问题。事实证明还是会有编码问题,只是解决的方法不像python 2.7那样感觉有点dirty。 以下是python 2.7的环境下解决编码问题的方法123import sysreload(sys)sys.setdefaultencoding('UTF-8') 但是我在使用“高大上”的p
今天发现打开腾讯NBA和斗鱼的时候,页面非常卡,而且打开Activity Monitor之后,发现Safari里的Flash插件经常CPU 100%,并且会出现未响应。 上网看到一个方法是或者自己手动把 RTMFPP2PDisable=1 这行添加到 /Library/Application\ Support/Macromedia/mms.cfg 这个里面去都可以。 在新 osx 系统里面, sa
A dependency measure based on Jensen-ShannonThey define a dependency measure between two random variables, which is based on the Jensen-Shannon divergence. The Kullback-Leibler (KL) divergence of a d
MethologyHowNetHowNet annotates precise senses to each word, and for each sense, HowNet annotates the significance of parts and attributes represented by sememes.