归档: 2017/10

0

Mimicking Word Embeddings using Subword RNNs

这篇文章挺有意思的,在已有的word embeddings上学习一个从字符级别的序列上建立一个word embedding。模型使用的是RNN,双向的,输入是一个单词,输出就是一个向量。训练的时候输入都是已有word embedding中lexicon的单词,输入的ground truth是原始的向量。 这么做的目的是希望能够解决UNK(未登录词)的表示,它的理论假设是从字母组成语义是要遵循一系列

0

Dynamic Routing Between Capsules

IntroductionThis paper is going to show that a discrimininatively trained, multi-layer capsule system achieves state-of-the-art performance on MNIST and isconsiderably better than a convolutional net

0

升级使用python3.6遇到的一些小事

编码问题之前听说python 3.6极其的好,在编码上面都是UTF-8的,这样可以解决很多自然语言处理中的常见编码问题。事实证明还是会有编码问题,只是解决的方法不像python 2.7那样感觉有点dirty。 以下是python 2.7的环境下解决编码问题的方法123import sysreload(sys)sys.setdefaultencoding('UTF-8') 但是我在使用“高大上”的p

0

macOS Flash 卡顿问题

今天发现打开腾讯NBA和斗鱼的时候,页面非常卡,而且打开Activity Monitor之后,发现Safari里的Flash插件经常CPU 100%,并且会出现未响应。 上网看到一个方法是或者自己手动把 RTMFPP2PDisable=1 这行添加到 /Library/Application\ Support/Macromedia/mms.cfg 这个里面去都可以。 在新 osx 系统里面, sa