主页

0

LSTM

参考资料DeepLearning Bengio Chapter 10 Sequence Modeling: Recurrent and Recursive Nets从multi-layer networks到recurrent network需要用到早期在机器学习中发现的想法:共享参数。共享参数使得网络可以运用到多种形式的数据上,并且在它们之间产生泛化。卷积网络也是一个共享参数的网络,只是它的共享

0

matplotlib教程

散点图我有两组数据,需要不同颜色的点将他们表示在一个二维空间中。12345678910111213#plot trainning curvef1=plt.figure(1)#plot real training datap1=plt.scatter(x_train[:,0]*x_max,y_train*y_max,marker='.',color='b',label='real price')#p

0

Hadoop IO

Hadoop IOhadoop提供了多种的解压缩方式,但是由于license的问题,得单独下载。 hadoop同时也对文件读写有校验,一旦出现文件错误,就会报告给namenode,namenode则不会再给别的任务派送这个文件块,同时调度其他的replica来恢复。 每个datanode会定期地检查自己的数据。 使用本地的库来进行压缩或解压可以节省很多时间,相对于通过Java实现的来说。几乎所有的

0

Vector-space topic models for detecting Alzheimers's disease

Abstract本文主要是想检测老年痴呆症,因为语义的缺失是一大症状。获得了96.8%的召回率。通过训练随机森林的分类器获得了0.74的F值(二元分类)。并且仅用了12个特征。 IntroductionAD在病情发展的过程中会出现语言的转变,并且这是可以检测得到的。这些变化包括句法复杂度的下降、找词困难和语义内容缺失,信息密度低(有语义的词在所有词中的比例),效率低。 结合上lexicosynta

0

Tensorflow 基本教程

Tensorflow 是什么Tensorflow是Google开源的一个深度学习库,可以建立计算的图模型和利用tensor结构在途中流动,这大概也是叫做tensorflow的主要原因。 Deep MNIST for Experts1tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=N

0

iptables

iptables 设置使用的方法将输出的包重定向1iptables -t nat -A OUTPUT -p tcp -d 192.168.1.107 --dport 5001 -j DNAT --to-destination 192.168.1.107:5000 这是把本来发往192.168.1.107:5001端口的包发往192.168.1.107:5000 这里是为了解决一个问题,就是一个NA

0

ffmpeg用于视频转换

1ffmpeg -i input.mkv -vf "ass=sub.ass" -t 00:01:00 out.mp4 1ffmpeg -hwaccel cuvid -c:v h264_cuvid -i input -c:v h264_nvenc -preset slow output.mkv

0

SSH Reversal Tunnel 反向隧道

使用ssh进行反向代理我在实验室的内网里有一个工作站,安装的Linux系统,具体版本是Ubuntu 16.04。此外,我还有一个aliyun的ECS主机,这样我就有了一个公网IP。现在需要做的就是让我们的22端口能够绑定到aliyun主机的2221端口上。22端口是默认的ssh登陆端口。 1ssh -v -N -R 2221:127.0.0.1:22 aliyun.ip 使用autossh进行反向

0

Shrinkage Methods

Ridge Regression 岭回归式子3.41 $\hat{\beta^{ridge}}=argmin_{\beta}\{\sum_1^N (y_i-\beta_0-\sum_{j=1}^p x_{ij}\beta_j)^2 + \lambda \sum_{j=1}^p \beta_j^2\}$ 其中的$\lambda$是用来控制shrinkage的量的。这种用参数的二次型来控制预测出来的

0

Efficient Estimation of Word Representations in Vector Space

Abstract提出两个创新的模型架构,用于在非常大的数据集上计算连续型的词向量表示。这些表示的好坏的用词相似性任务来测量。计算复杂度下降了,同时在准确度上还有巨大的提升。在当时是state-of-the-art的做法。 1 Introduction许多现在的系统将词表示在词库中的索引,并不包含词的相似性的概念。这个选择的原因是:简单、鲁棒以及一个观察到的现象:在大量数据上训练出来的简单模型要比在