雪域冰泉
雪域冰泉
全部文章
未归档
ACM学习(21)
AI小白入门(32)
Java(2)
markdown(1)
nlp(3)
PyTorch(1)
PyTorch学习(11)
Tensorflow(2)
word embedding(1)
机器学习(8)
环境搭建(2)
自然语言处理(4)
归档
标签
去牛客网
登录
/
注册
您好,陌生人~
学习、记录、分享~
全部文章
/ 未归档
(共120篇)
TF-IDF试用
记录一次生成文本tf-idf过程。 tf-idf资料网上很多,这里就不介绍了。 这里使用Python的sklearn封装的tf-idf,代码如下: # coding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') _...
2017-06-18
0
439
storm单机环境搭建
记录一下storm单机环境搭建过程 1.安装jdk 2. 安装zookeeper,首先去官网上下载安装包,然后解压 (1)配置zookeeper环境变量: 在/etc/profile文件下加入: #Set ZooKeeperEnviroment exportZOOK...
2017-06-17
0
371
fasttext使用笔记
这里记录使用fastText训练word vector笔记 github地址:https://github.com/facebookresearch/fastText 下载到本机: $ gitclone https://github.com/facebookresearch/fas...
2017-06-01
0
410
我的学习网址收藏
1.将门分享 https://mp.weixin.qq.com/s?__biz=MzAxMzc2NDAxOQ==&mid=502876225&idx=1&sn=25894a894cc2c58214ddde13e0a8ef93&chksm=03907c9d34e7f58...
2017-05-26
0
472
GloVe学习笔记
GloVe是一种用于获取词汇向量表示的无监督学习算法。 对来自语料库的聚合全局字词同现统计进行训练,并且所得到的表示展示了词向量空间的有趣的线性子结构。 官网主页地址:https://nlp.stanford.edu/projects/glove/ Github:htt...
2017-05-24
0
1133
cips2016-中文信息处理发展阅读笔记
第一章 词法和句法分析研究进展、现状及趋势 1.自然语言处理中的自然语言句子级分析技术,可以大致分为词法分析、句法分析、语义分析三个层面。 第一层面的词法分析(lexical analysis)包括汉语分词和词性标注两部分。 第二个层面的句法分析(syntactic...
2017-05-21
0
990
wordembedding评价
1.第一类指标为评价词向量的语言学特性 标准的WordSim353 数据集(语义相关性)(ws) TOEFL 数据集(同义词检测)(tfl) 单词类比(sem,syn) 单词语义: (sem): 9000 个问题。 queen-king+man=women 。...
2017-05-21
0
828
维基百科数据库处理,用于训练word2vec
维基百科中文数据 1.在维基百科上下载中文数据,实时的 2.使用 Wikipedia Extractor抽取文本(http://medialab.di.unipi.it/wiki/Wikipedia_Extractor)(半小时内完成) 命令:python Wik...
2017-05-21
0
743
word embedding简要介绍
最早的文章是hinton在1986年发表的Learning distributed representations of concepts,Bengio2003年的论文Neural probabilistic language models也提到了word embedding。这是我找到...
2017-05-15
0
577
yuquanle的第一篇文章
2017年4月27日,开通个人CSDN,专注nlp领域学习。
2017-04-27
0
439
首页
上一页
3
4
5
6
7
8
9
10
11
12
下一页
末页