课程资源

CS224n: Natural Language Processing with Deep Learning
CS224U: Natural Language Understanding

pytorch

github-pytorch-handbook
github-practical-pytorch
pytorch-tutorial
pytorch-book
github-Pytorch模型训练实用教程
github-Pytorch实现的cnn,lstm,bilstm,deepcnn等模型

torchtext

github-torchtext
torchtext官方文档
github-使用pytorch和torchtext进行情感分析的简易教程
github-torchtext的使用总结,并结合Pytorch实现LSTM
torchtext学习总结

Bert

BERT finetuning tasks in 5 minutes with Cloud TPU(官方教程,可直接在Colab运行)
The Annotated Transformer(对Transformer论文的讲解和pytorch复现)
github-bert-as-service(Using BERT model as a sentence encoding service, i.e. mapping a variable-length sentence to a fixed-length vector.)
github-pytorch-pretrained-BERT(PyTorch pretrained models for Google’s BERT, OpenAI GPT & GPT-2 and Google/CMU Transformer-XL.)
github-bert language understanding(Ideas from google’s bert for language understanding: Pre-train TextCNN)
BERT相关论文、文章和代码资源汇总

机器学习

《统计学习方法》的代码实现
统计学习方法 [笔记, 代码, notebook, 参考文献, Errata]
VIP cheatsheets for Stanford’s CS 229 Machine Learning
CS229讲义中文翻译
吴恩达老师的深度学习课程笔记及资源

Flair

Flair是由Zalando Research开发的一个简单的自然语言处理(NLP)库。 Flair的框架直接构建在PyTorch上。Zalando Research团队还为以下NLP任务发布了几个预先训练的模型:

  1. 命名实体识别(NER):它可以识别单词是代表文本中的人,位置还是名称。
  2. 词性标注(PoS):将给定文本中的所有单词标记为它们所属的“词性”。
  3. 文本分类:根据标准对文本进行分类(标签)。
  4. 训练定制模型:制作我们自己的定制模型。

Flair教程

tqdm

github-tqdm
tqdm介绍及常用方法

语料及词向量

github-nlp chinese corpus(大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP)
github-nlp-datasets
腾讯 AI Lab 中文词向量
(持续更新。。。)