2018

2018-08-01

EM算法

EM算法的全称是Expectation Maximization algorithm。它主要是为了解决存在隐变量Z的情况下如何去估计$P(Y|\theta)$。在实际中可能是对模型做极大思然估计，也可能是做极大后验概率的估计。资料来自李航的小蓝书的第九章，EM算法及其推广，因为在VAE模型中，如何去估计参数，也是参照了EM算法的思想。去优化对数似然函数的一个下界。三硬币模型首先先看Bernoul

Papers

2018-07-16

How NOT To Evaluate Your Dialogue System An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

如何评价对话生成的质量而不使用人工标注是一个还未解决的问题。这篇文章将证明现在已有的这些评测指标和Twitter domain的人工评测质量只有一点点的相关性，而在Ubuntu domain上则是毫不相关。这些评测值通常来自于机器翻译、文本摘要，比如BLEU、METEOR和ROUGE。这些指标都假设了合法的回复都有明显特殊的词是和ground truth的回复有重复的。这是一个在对话领域中相当强的

Learning

2018-07-10

Logistics Regression and Softmax

Softmax and Log-Softmax机器学习中为了求导和计算方便，会对probability做取对数的操作，比如softmax和log-softmax的关系。log-softmax看似等价于先做一个softmax的操作，然后再做一个log的操作。可是如果有些prob在做了softmax之后无限接近于0，那么就会导致计算机出现log(0)的问题。在Deep Learning书中的第四章，这

Papers

2018-06-21

Pointer Networks CopyNet and Pointer Generator

Papers以下三篇论文都是通过copy机制，想要能够在生成阶段生成输入中的词语，这样就可以组合出更多的句式。我们想看看这个方法能否应用到对话生成中去。第一篇论文是后两篇的基础。 Pointer Networks Incorporating Copying Mechanism in Sequence-to-Sequence Learning Get To The Point: Summariza

Papers

2018-06-07

Deep contextualized word representations

Abstract这篇文章是NAACL2018的Outstanding Paper。这篇文章的测试任务包括了情感分析。

Papers

2018-06-04

Toward Controlled Generation of Text

这篇paper是被Goldberg顺带怼过的一篇文章，也算是走红了。已有的文本生成工作具有不可控的属性，比如我不知道我下一句话生成的会是一个什么情感的句子。或者是什么时态的句子，这是机器人必须突破的限制。我的前端语义理解系统理解出来了用户可能需要一个positive的回复，但是我如何给呢？这篇文章的主要思路是用类似GAN的方式，互相促进，同时把这个学习信号嵌入到Generator的一个位上。 C

Howto

2018-04-15

gensim topic model

安装ltp分词1pip install pyltp 下载最新的模型放到机器上，比如放在了~/data/ltp_data下12345from pyltp import Segmentorsegmentor = Segmentor()segmentor.load("~/data/ltp_data/cws.model")text = "我爱看电影"print(list(segmentor.segment

Howto

2018-03-26

windows常用命令

查看文件的md5值123certutil -hashfile filename MD5 certutil -hashfile filename SHA1 certutil -hashfile filename SHA256 在powershell下使用condaPowershell是不支持activate操作的，一个方法是先切到cmd中，激活环境，然后再执行powershell123cmdac

Howto

2018-03-26

Conditional Random Fields Notes

CRF Representation条件随机场的建模目标是$P(Y|X)$，而不是联合分布$P(X,Y)$以及$P(X)$。因此可以忽略特征$X$之间的独立性条件。 $$\Phi = {\phi_1(\boldsymbol{D}_1), ..., \phi_k(\boldsymbol{D}_k)} \\\\ P_{\Phi}(\boldsymbol{X}, \boldsymbol{Y}) = \p

Howto

2018-03-21

Deep Learning 环境配置

For ubuntu 16.04我的情况是我的CPU有核显，同时我希望能装一个有桌面的ubuntu，这样平时维护起来更方便，但输出视频会占用独显的内存，因此我希望用核显输出图像，Nvidia的显卡只用于CUDA运算。于是我们需要加上-no-opengl-files，表示我们不需要图形输出。同时安装程序会检查X Server是否已关闭了，如果没关闭则会安装失败，因此需要加上-no-x-check来忽

Blog

主页

EM算法

How NOT To Evaluate Your Dialogue System An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

Logistics Regression and Softmax

Pointer Networks CopyNet and Pointer Generator

Deep contextualized word representations

Toward Controlled Generation of Text

gensim topic model

windows常用命令

Conditional Random Fields Notes

Deep Learning 环境配置