自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
262 5.7k 930

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
10.0 3.8
79 763 163

F 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率 用户自定义词典
 
4.3 8.299999999999999
  昨天
50 952 168

L langid.py:独立的语言识别系统
 
2.9 0.0
  6月前
52 783 64

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
2.6 0.0
  4月前
22 735 32

B Bounter:Python高性能大规模数据集(词频)计数
 
2.5 0.2
47 684 105

NLI的句子嵌入(InferSent)和训练代码
 
2.3000000000000003 0.3
  1月前
71 720 335

T TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
 
2.2 0.0
  1年前
61 539 142

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
1.9 5.5
  4天前
45 510 172

T TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba
 
1.6 0.0
46 422 96

S synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
 
1.6 4.0
162 1.7k 252

Z 自然语言处理(NLP)任务与参考资源精选
 
1.5 0.0
  2月前
20 405 203

M 基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块
 
1.2 0.0
  3年前
20 364 39

M Makes famous people speak whatever you wish by linking their words
 
1.2 0.0
  11月前
50 219 67

中文文本标注工具
 
1.0 10.0
  23天前
23 300 31

使用字向量的在线自然语言处理
 
0.8999999999999999 2.5
  17天前
35 277 108

T ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。
 
0.8999999999999999 3.5
16 276 43

W WikiData上的一个自然语言查询引擎
 
0.8999999999999999 0.0
  1年前
23 255 49

R rake-nltk:Python实现使用NLTK的快速自动关键字提取算法
 
0.8 0.0
  4月前
39 217 56

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
0.8 10.0