自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
294 6.5k 1.1k

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
10.0 0.3
Popular
485 4.9k 559

Z Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
 
10.0 10.0
  4天前
1.1k 14.3k 4k

J jieba:“结巴”中文分词:做最好的 Python 中文分词组件
 
9.0 0.2
131 2.1k 433

1 100+ Chinese Word Vectors 上百种预训练中文词向量
 
8.8 6.0
  5天前
66 892 151

D 自然语言十项全能挑战(decaNLP),涉及十个任务:问答,机器翻译,摘要,自然语言推理,情感分析,词性标注,关系抽取,目标导向对话,数据库查询生成和代词解析
 
3.5999999999999996 2.8000000000000003
  20天前
78 999 411

T TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
 
3.0 0.2
  15天前
58 855 76

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
2.6 0.0
  5月前
23 790 41

B Bounter:Python高性能大规模数据集(词频)计数
 
2.4 0.0
43 740 136

G GluonNLP是一个工具包,可以轻松进行文本预处理,数据集加载和神经模型构建,以帮助您加速自然语言处理(NLP)研究。
 
2.4 10.0
65 667 177

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
2.1 0.3
  12天前
47 559 179

T TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba
 
1.7000000000000002 0.0
25 556 252

M 基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块
 
1.7000000000000002 0.0
  3年前
58 491 88

Y 这是一份英文->中文字典的双解词典数据库,根据各类考试大纲和语料库词频收录数十万条各类单词的英文和中文释义,并按照各类考试大纲和词频进行标注。
 
1.5 0.3
71 445 117

中文文本标注工具
 
1.4000000000000001 0.0
  4月前
52 440 155

T ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。
 
1.3 0.2
53 394 92

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
1.2 10.0
27 393 77

R rake-nltk:Python实现使用NLTK的快速自动关键字提取算法
 
1.2 2.5
  1月前
19 366 41

M Makes famous people speak whatever you wish by linking their words
 
1.1 0.0
  1年前
18 311 50

W WikiData上的一个自然语言查询引擎
 
0.8999999999999999 0.0
  1年前
24 306 33

使用字向量的在线自然语言处理
 
0.8999999999999999 0.0
  6月前