主页

0

EM算法

EM算法的全称是Expectation Maximization algorithm。它主要是为了解决存在隐变量Z的情况下如何去估计$P(Y|\theta)$。在实际中可能是对模型做极大思然估计,也可能是做极大后验概率的估计。资料来自李航的小蓝书的第九章,EM算法及其推广,因为在VAE模型中,如何去估计参数,也是参照了EM算法的思想。去优化对数似然函数的一个下界。 三硬币模型首先先看Bernoul

0

How NOT To Evaluate Your Dialogue System An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

如何评价对话生成的质量而不使用人工标注是一个还未解决的问题。这篇文章将证明现在已有的这些评测指标和Twitter domain的人工评测质量只有一点点的相关性,而在Ubuntu domain上则是毫不相关。这些评测值通常来自于机器翻译、文本摘要,比如BLEU、METEOR和ROUGE。这些指标都假设了合法的回复都有明显特殊的词是和ground truth的回复有重复的。这是一个在对话领域中相当强的

0

Logistics Regression and Softmax

Softmax and Log-Softmax机器学习中为了求导和计算方便,会对probability做取对数的操作,比如softmax和log-softmax的关系。log-softmax看似等价于先做一个softmax的操作,然后再做一个log的操作。可是如果有些prob在做了softmax之后无限接近于0,那么就会导致计算机出现log(0)的问题。在Deep Learning书中的第四章,这

0

Pointer Networks CopyNet and Pointer Generator

Papers以下三篇论文都是通过copy机制,想要能够在生成阶段生成输入中的词语,这样就可以组合出更多的句式。我们想看看这个方法能否应用到对话生成中去。第一篇论文是后两篇的基础。 Pointer Networks Incorporating Copying Mechanism in Sequence-to-Sequence Learning Get To The Point: Summariza

0

Toward Controlled Generation of Text

这篇paper是被Goldberg顺带怼过的一篇文章,也算是走红了。已有的文本生成工作具有不可控的属性,比如我不知道我下一句话生成的会是一个什么情感的句子。或者是什么时态的句子,这是机器人必须突破的限制。我的前端语义理解系统理解出来了用户可能需要一个positive的回复,但是我如何给呢? 这篇文章的主要思路是用类似GAN的方式,互相促进,同时把这个学习信号嵌入到Generator的一个位上。 C

0

gensim topic model

安装ltp分词1pip install pyltp 下载最新的模型放到机器上,比如放在了~/data/ltp_data下12345from pyltp import Segmentorsegmentor = Segmentor()segmentor.load("~/data/ltp_data/cws.model")text = "我爱看电影"print(list(segmentor.segment

0

windows常用命令

查看文件的md5值123certutil -hashfile filename MD5 certutil -hashfile filename SHA1 certutil -hashfile filename SHA256 在powershell下使用condaPowershell是不支持activate操作的,一个方法是先切到cmd中,激活环境,然后再执行powershell123cmdac

0

Conditional Random Fields Notes

CRF Representation条件随机场的建模目标是$P(Y|X)$,而不是联合分布$P(X,Y)$以及$P(X)$。因此可以忽略特征$X$之间的独立性条件。 $$\Phi = {\phi_1(\boldsymbol{D}_1), ..., \phi_k(\boldsymbol{D}_k)} \\\\ P_{\Phi}(\boldsymbol{X}, \boldsymbol{Y}) = \p

0

Deep Learning 环境配置

For ubuntu 16.04我的情况是我的CPU有核显,同时我希望能装一个有桌面的ubuntu,这样平时维护起来更方便,但输出视频会占用独显的内存,因此我希望用核显输出图像,Nvidia的显卡只用于CUDA运算。于是我们需要加上-no-opengl-files,表示我们不需要图形输出。同时安装程序会检查X Server是否已关闭了,如果没关闭则会安装失败,因此需要加上-no-x-check来忽