GitHub Projects Collection
Sentence ClassificationCNN sentence classification for sentiment analysishttps://github.com/yoonkim/CNN_sentence.gitKim, Yoon. “Convolutional neural networks for sentence classification.” arXiv prepri
Sentence ClassificationCNN sentence classification for sentiment analysishttps://github.com/yoonkim/CNN_sentence.gitKim, Yoon. “Convolutional neural networks for sentence classification.” arXiv prepri
Ridge Regression 岭回归式子3.41 ^βridge=argminβ{∑N1(yi−β0−∑pj=1xijβj)2+λ∑pj=1β2j} 其中的λ是用来控制shrinkage的量的。这种用参数的二次型来控制预测出来的
推荐的一个关于深度学习的参考资料声明这个文章的内容转载自a link Deep Learning Papers Reading Roadmap If you are a newcomer to the Deep Learning area, the first question you may have is “Which paper should I start reading from?”
《Deep Learning》by LeCun&Bengio&Hinton介绍这是自然杂志上的一篇关于深度学习的论文,主要讲了深度学习如何替代传统的机器学习方法来实现人工智能的系统。 而文章的三个作者都是DL领域的鼻祖级人物。 有监督的学习“浅层”的分类器在面对一个分辨图片中狼的种类的任务的时候,可能会因为狼在图片中的位置、姿势相近而导致分类错误。这也是为什么一个“浅层”的分类器需
Hopefield网络简介Hopefield网络是一个非同步的神经网络,是一个异步的,跟BP网络不同。同时它分为两种类型,离散型和连续型。 同步与异步网络正确设计一个递归神经网络的问题在于所有计算元素之间的充分的同步。在MP模型的网络中,我们假设每个计算元素被激活都需要消耗一定的时间。这里将要讨论的是没有全局同步的神经网络。计算节点会在不同的时间被激活,并且会在一定的时间后提供计算,这个网络是随机
最大熵模型解决的两个问题 What exactly is meant by “uniform”, and how can we measure the uniformity of a model Having determined a suitable answer to these questions, how do we go about finding the most uniform mo
神经网络5.1 神经元模型M-P神经元模型:y=f(∑ni=1wixi−θ) 最后还需要一个激活函数来处理并产生神经元的输出。因为以阶跃函数作为激活函数的话,其具有不连续、不光滑等不太好的性质,因此通常使用Sigmoid函数作为激活函数。它把可能在较大范围内变化的输入值挤压到(0,1)输出值范围内,因此有时也称为挤压函数(squashing functio
词性标注10.1标记中的信息源 观察感兴趣词的邻近上下文的其它词的词性 利用词本身提供的信息,有人做了一个词性标注起dumb,这个标注器只是将所有词最常用的词性标注给这个词,就取得了90%的准确率。 因此词之间用法及其不平均,因此用统计的方法会更甚一筹。 10.2马尔可夫模型标注器10.2.1概率模型马尔可夫链的两个特性 有限视野(limited horizon)$P(X_{i+1}=t^j|
Introduction本来是在看一些关于NLP的一本老教材,但是鉴于现在组里RNN、CNN满天飞,忍不住先来窥探一下Deep Learning在NLP一些传统问题上有什么魔法。 The neural word embedding approach的优势相比于LSA方法,neural word embeddings 可以变得更有意义,通过对一个或多个任务增加监督。 无监督的词向量学习主要思想:一个
马尔可夫模型9.3 隐马尔可夫模型的三个基本问题 给出一个模型μ=(A,B,π),怎样有效地计算某个观测序列发生的概率,即P(O|μ)? 给出观测序列O和模型μ,我们怎样选择一个状态序列(X1,...,XT+1),以便能够最好地解释观测序列? 给定观测序列O,以及通过改变模型μ=(A,B,π)的参数而得到的模型空间,我们怎样才能找到一
I want to use vscode as my main code editor.I need to sync my code from local to the remote GPU server.I choose to use sftp extensions in vscode.After
I want to give up texstudio in my Mac due to its ugly GUI. OS macOS 10.14.2 Setup Steps Install MacTex. Do not update package in default setting espec
文章总结的两点还挺有意思的 用基于连接的方法来做对话是因为有大规模的语料 之前几年的对话系统研究都集中在把所有的组件都替换一遍。 工作中用了 wikipedia summaries NELL knowledge base related work中列觉了很多利用外部知识的对话系统的工作 这个工作中把
在写CVAE模型的过程中,遇到一个loss突然变大的过程,看到网络上说由于Adam的原因,所以会导致收敛不稳定。可以把amdgrad参数打开。1optimizer = Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=arg
这是一篇发表在NIPS2017上的工作,提出了一个模型叫做GraphSAGE,用来解决图表示的。提出了一个问题However, most existing approaches require that all nodes in the graph are present during traini
E-mail: yezhejack at gmail.comGitHub: https://github.com/yezhejack Current self-motived Plan Every week two papers PRML cs224n Details of every weekMa