自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
Popular
693 7.3k 1.1k

Z Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
 
10.0 10.0
  昨天
Popular
478 7.1k 2k

N NLTK 一套开源Python模块,数据集和教程,支持自然语言处理的研究和开发
 
10.0 10.0
  昨天
322 7.1k 1.2k

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
10.0 1.3
277 5.7k 743

T TextBlob 是一个用于处理文本数据的Python(2和3)库。它为潜入常见的自然语言处理(NLP)任务提供了一个简单的API,例如词性标注,名词短语提取,情感分析,分类,翻译等。
 
10.0 1.3
172 3.2k 731

1 100+ Chinese Word Vectors 上百种预训练中文词向量
 
10.0 2.2
  27天前
Popular
134 2.5k 500

P Python编写的Facebook AI Research Sequence-to-Sequence工具包
 
10.0 10.0
134 2.5k 755

S 使用 Python 开发的基于 NLP 技术, 自动化提取论文仓库核心内容搜索服务,以便大家快速定位对自己有用的论文
 
10.0 0.5
  23天前
62 898 79

D 对齐78种语言FastText向量,FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,性能比肩深度学习而且速度更快。
 
2.8000000000000003 0.0
  9月前
24 815 42

B Bounter:Python高性能大规模数据集(词频)计数
 
2.5 0.0
75 755 136

Y 这是一份英文->中文字典的双解词典数据库,根据各类考试大纲和语料库词频收录数十万条各类单词的英文和中文释义,并按照各类考试大纲和词频进行标注。
 
2.3000000000000003 0.0
70 716 187

J 我们将机器之心在编译技术文章和论文过程中所遇到的专业术语记录下来,希望有助于大家查阅和翻译。同时也希望大家能积极指出我们编译的不当之处,共同推进知识更高效和客观地传播。
 
2.2 0.7000000000000001
  1月前
29 634 287

M 基于某 1w 词敏感词库,用 Python 实现几种不同的过滤方式。用于过滤敏感词的实用模块
 
1.9 0.0
  4年前
49 581 185

T TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba
 
1.7999999999999998 0.0
89 574 141

中文文本标注工具
 
1.7999999999999998 0.0
  8月前
57 533 190

T ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。
 
1.6 0.3
29 495 112

Z HanLP的Python接口,支持自动下载与升级HanLP,兼容py2、py3。
 
1.6 0.2
32 485 92

R rake-nltk:Python实现使用NLTK的快速自动关键字提取算法
 
1.5 0.0
  5月前
55 481 118

S spark-nlp:面向Spark的自然语言处理(NLP)库
 
1.5 10.0
49 471 175

中文自然语言理解
 
1.5 0.0
  3月前