自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
28 182 87

Q 其中thulac用于分词,gensim用于word2vec 这两个库只用于第一篇文章的分析。如果您只关心如何构建诗人关系网络,那么不需要安装这个两个库。
 
0.6 0.0
  1年前
22 179 59

F FastNLP是一个基于PyTorch的模块化自然语言处理系统,专为快速开发NLP模型而构建。
 
0.6 10.0
18 167 60

P python3利用互信息和左右信息熵的中文分词新词发现
 
0.5 0.0
  2月前

G 各种nlp 工具的使用包括 word2vec nltk textblob crf++ 等
 
0.5 0.0
  1年前
13 149 33

N nnmnkwii 用于构建语音合成系统的快速原型库
 
0.5 3.7
12 145 41

K Keras BERT - BERT的Keras实现,可以加载官方预训练模型进行特征提取和预测
 
0.5 3.8
  昨天
17 144 24

J 在Tensorflow中实现的常用深度学习块的集合。 它涵盖了NLP中的核心任务,如嵌入,编码,匹配和池化。 所有实现都遵循模块化的设计模式,称之为“块设计”。
 
0.5 0.0
  2月前
12 124 38

Z 中文自然语言处理的语料集合,包括语义词、领域共时、历时语料库、评测语料库等。
 
0.5 3.3000000000000003
  1月前
200 4.4k 881

Z 中华新华字典数据库和API。收录包括 14032 条歇后语,16142 个汉字,31648 个成语。 对性能没需求的话,可以用我的新华字典API。所有的数据放在 data/ 目录。
 
0.4 0.5
  1月前

J 今日头条中文新闻(文本)分类数据集
 
0.4 0.0
  4月前
17 132 31

Fonduer - 知识库构建引擎
 
0.4 5.2
  9天前

Z 该库搜集了包含 chatterbot 豆瓣多轮 PTT八卦语料 青云语料 电视剧对白语料 贴吧论坛回帖语料 微博语料 小黄鸡语料
 
0.4 0.0
  2月前
15 125 26

T THUOCL(THU Open Chinese Lexicon)是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。
 
0.4 0.5
  2月前

T text-similarity:用TF特征向量和simhash指纹计算中文文本的相似度
 
0.4 0.0
  2年前
186 3.8k 876

1 100+ Chinese Word Vectors 上百种预训练中文词向量
 
0.3 0.2
  1月前