课程资源
CS224n: Natural Language Processing with Deep Learning
CS224U: Natural Language Understanding
pytorch
github-pytorch-handbook
github-practical-pytorch
pytorch-tutorial
pytorch-book
github-Pytorch模型训练实用教程
github-Pytorch实现的cnn,lstm,bilstm,deepcnn等模型
torchtext
github-torchtext
torchtext官方文档
github-使用pytorch和torchtext进行情感分析的简易教程
github-torchtext的使用总结,并结合Pytorch实现LSTM
torchtext学习总结
Bert
BERT finetuning tasks in 5 minutes with Cloud TPU(官方教程,可直接在Colab运行)
The Annotated Transformer(对Transformer论文的讲解和pytorch复现)
github-bert-as-service(Using BERT model as a sentence encoding service, i.e. mapping a variable-length sentence to a fixed-length vector.)
github-pytorch-pretrained-BERT(PyTorch pretrained models for Google’s BERT, OpenAI GPT & GPT-2 and Google/CMU Transformer-XL.)
github-bert language understanding(Ideas from google’s bert for language understanding: Pre-train TextCNN)
BERT相关论文、文章和代码资源汇总
机器学习
《统计学习方法》的代码实现
统计学习方法 [笔记, 代码, notebook, 参考文献, Errata]
VIP cheatsheets for Stanford’s CS 229 Machine Learning
CS229讲义中文翻译
吴恩达老师的深度学习课程笔记及资源
Flair
Flair是由Zalando Research开发的一个简单的自然语言处理(NLP)库。 Flair的框架直接构建在PyTorch上。Zalando Research团队还为以下NLP任务发布了几个预先训练的模型:
- 命名实体识别(NER):它可以识别单词是代表文本中的人,位置还是名称。
- 词性标注(PoS):将给定文本中的所有单词标记为它们所属的“词性”。
- 文本分类:根据标准对文本进行分类(标签)。
- 训练定制模型:制作我们自己的定制模型。
tqdm
语料及词向量
github-nlp chinese corpus(大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP)
github-nlp-datasets
腾讯 AI Lab 中文词向量
(持续更新。。。)