标签:: Papers
How NOT To Evaluate Your Dialogue System An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation
如何评价对话生成的质量而不使用人工标注是一个还未解决的问题。这篇文章将证明现在已有的这些评测指标和Twitter domain的人工评测质量只有一点点的相关性,而在Ubuntu domain上则是毫不相关。这些评测值通常来自于机器翻译、文本摘要,比如BLEU、METEOR和ROUGE。这些指标都假设了合法的回复都有明显特殊的词是和ground truth的回复有重复的。这是一个在对话领域中相当强的
Active Sentiment Domain Adaptation
Introduction本文提出的一个active sentiment domain adaptation方法来解决negative transfer的问题。利用的是general sentiment information和少量的从target domain中的actively selected labeled samples。general sentiment information是从sen
Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering
Introduction这篇论文想提出一个新的CNN使用范式,能够解决对graph的建模。常规的图有图像、视频和语音,非常规的有社交网络、脑连接体或者词嵌入。其中的难点在于convolution和pooling都是针对常规图结果做的定义。 Hard Termsspectral graph theoryspectral graph theory研究graph的graph matrics的特征值和特征
Adjusting Word Embeddings with Semantic Intensity Orders
clustering words for intensity ordering首先需要从Google N-gram中抽取形容词的程度顺序信息。使用的方法是基于模版匹配的方法。比如从good but not great我们可以总结出一个规则xx but not xx,然后可以发现后者比前者的程度深。然后使用mixed integer linear programming (MILP)来进行最优化排序
Mimicking Word Embeddings using Subword RNNs
这篇文章挺有意思的,在已有的word embeddings上学习一个从字符级别的序列上建立一个word embedding。模型使用的是RNN,双向的,输入是一个单词,输出就是一个向量。训练的时候输入都是已有word embedding中lexicon的单词,输入的ground truth是原始的向量。 这么做的目的是希望能够解决UNK(未登录词)的表示,它的理论假设是从字母组成语义是要遵循一系列
Dynamic Routing Between Capsules
IntroductionThis paper is going to show that a discrimininatively trained, multi-layer capsule system achieves state-of-the-art performance on MNIST and isconsiderably better than a convolutional net
Linguistically Regularized LSTMs for Sentiment Classification
Abstract本文主要目的是为了产生linguistically coherent representations,其中使用了sentiment lexicons, negation words, 和intensity words。 Introduction让计算机能够理解情感一直是AI的核心任务,有许多方法来实现,比如lexicon-based classification以及早期的machi
Adaptive Joint Learning of Compositional and Non-Compositional Phrase Embeddings
Introduction这篇论文主要是要解决英文短语的词向量表示问题,英语的词向量可以分成两种,一种是compositional,另一种是non-compositional。前者的短语语义就是组成单词的叠加,而后者则会产生完全不同的意思。本文引入了一个score function来度量一个短语的compositional的程度。 完全依赖non-compositional embedding会产生
Dont Count Predict An Automatic Approach to Learning Sentiment Lexicons for Short Text
Abstract这是一片发表在ACL2016上的短文,看名字就知道是关于如何自动化构建情感词表的文章。使用了一个神经网络的方法,并且不使用任何人工标注的资源。这个方法的灵感来自于NRC方法,NRC方法在SemEval13中利用了大量推特中的emoticons来获得了最好的结果,这个文章中的方法使用了词和推特情感的互信息来定义词的情感属性。 Introduction在所有的自动化方法中,Mohamm