Active Sentiment Domain Adaptation
Introduction本文提出的一个active sentiment domain adaptation方法来解决negative transfer的问题。利用的是general sentiment information和少量的从target domain中的actively selected labeled samples。general sentiment information是从sen
Introduction本文提出的一个active sentiment domain adaptation方法来解决negative transfer的问题。利用的是general sentiment information和少量的从target domain中的actively selected labeled samples。general sentiment information是从sen
Introduction这篇论文想提出一个新的CNN使用范式,能够解决对graph的建模。常规的图有图像、视频和语音,非常规的有社交网络、脑连接体或者词嵌入。其中的难点在于convolution和pooling都是针对常规图结果做的定义。 Hard Termsspectral graph theoryspectral graph theory研究graph的graph matrics的特征值和特征
clustering words for intensity ordering首先需要从Google N-gram中抽取形容词的程度顺序信息。使用的方法是基于模版匹配的方法。比如从good but not great我们可以总结出一个规则xx but not xx,然后可以发现后者比前者的程度深。然后使用mixed integer linear programming (MILP)来进行最优化排序
他们想增强一些能够明显区分同义词和反义词的特征。
IntroductionIn this paper thye propose two novel and general approaches for generating sense-specific word embeddings that are grounded in an ontology. 但是通用的词向量只为一个词分配一个词向量,无法解决解决一词多义的问题。 虽然Yu and Dre
Introduction这篇文章提出了一个叫做AutoExtand的方法,来运用其他的信息来增强word embedding的性能。用于学习用来表示synsets和lexemes。用于一些公开的知识库上,比如WordNet, Wikipedia和Freebase。 synset是指一个词语集合,这里面的词可以在一定的条件下相互替换。lexeme会将一个特定的拼写和发音和一个特定的意思匹配在一起。也
这篇文章想用同一语言和跨语言资源中获得的约束来增强词向量的质量。
Sentence ClassificationCNN sentence classification for sentiment analysishttps://github.com/yoonkim/CNN_sentence.gitKim, Yoon. “Convolutional neural networks for sentence classification.” arXiv prepri
这篇文章挺有意思的,在已有的word embeddings上学习一个从字符级别的序列上建立一个word embedding。模型使用的是RNN,双向的,输入是一个单词,输出就是一个向量。训练的时候输入都是已有word embedding中lexicon的单词,输入的ground truth是原始的向量。 这么做的目的是希望能够解决UNK(未登录词)的表示,它的理论假设是从字母组成语义是要遵循一系列