自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序

J jieba_fast 使用cpython重写了jieba分词库中计算DAG和HMM中的vitrebi函数,速度得到大幅提升
 
0.4 0.0
  5月前
1.1k 14.7k 4.1k

J jieba:“结巴”中文分词:做最好的 Python 中文分词组件
 
0.3 0.2

N nnmnkwii 用于构建语音合成系统的快速原型库
 
0.3 0.7000000000000001
  10天前
301 6.6k 1.1k

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
0.2 0.3
112 1.9k 353

P Python编写的Facebook AI Research Sequence-to-Sequence工具包
 
0.2 10.0
98 1.2k 288

S synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
 
0.2 0.3
96 1.1k 256

F 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率 用户自定义词典
 
0.2 0.2
  1月前
321 3.4k 908

S SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的。
 
0.1 0.0
  1年前
118 2.2k 670

S 使用 Python 开发的基于 NLP 技术, 自动化提取论文仓库核心内容搜索服务,以便大家快速定位对自己有用的论文
 
0.1 0.0
  1年前
60 1.6k 167

M markovify-Pythonic 的可扩展的 马尔可夫链发生器. 主要用以构建 Markov 模式的大型语料库, 生成随机的句子, 当然,理论上,可以用以其它应用
 
0.0 0.2
  16天前
99 1.6k 306

Y 一个简单的库和命令行实用程序,用以从HTML页面或者明文中抽取摘要。该包也包含用于文本摘要的简单评价框架。
 
0.0 0.0
52 1.1k 194

L langid.py:独立的语言识别系统
 
0.0 0.0
  1年前
79 1.1k 426

T TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
 
0.0 0.2
  1月前

T text-similarity:用TF特征向量和simhash指纹计算中文文本的相似度
 
0.0 0.0
  2年前