自然语言处理 - 用来处理人类语言的Python库

分类 - 设置更多关注

排序

按热度排序
68 1.7k 172

M markovify-Pythonic 的可扩展的 马尔可夫链发生器. 主要用以构建 Markov 模式的大型语料库, 生成随机的句子, 当然,理论上,可以用以其它应用
 
0.1 0.0
  2月前
69 1.2k 226

NLI的句子嵌入(InferSent)和训练代码
 
0.1 1.7000000000000002
  14天前

J 在Tensorflow中实现的常用深度学习块的集合。 它涵盖了NLP中的核心任务,如嵌入,编码,匹配和池化。 所有实现都遵循模块化的设计模式,称之为“块设计”。
 
0.1 0.0
  2月前
102 1.6k 320

Y 一个简单的库和命令行实用程序,用以从HTML页面或者明文中抽取摘要。该包也包含用于文本摘要的简单评价框架。
 
0.0 0.0
53 1.3k 235

H 将汉字转为拼音。可以用于汉字注音、排序、检索
 
0.0 0.7000000000000001
  25天前
79 1.1k 449

T TextRank4ZH可以从文章中提取摘要和关键字, TextRank4ZH 则是能用 TextRank 的算法处理中文文章
 
0.0 0.0
  3月前
55 1.1k 193

L langid.py:独立的语言识别系统
 
0.0 0.0
  1年前
13 100 23

Fonduer - 知识库构建引擎
 
0.0 10.0
  今天

J 今日头条中文新闻(文本)分类数据集
 
0.0 0.2
  1月前

S 该程序将文本文件作为输入,并通过分析每个句子来生成问题
 
0.0 0.0
  9月前

A Automatic Korean word spacing with Python
 
0.0 0.3
  28天前

S 使用word2vector,doc2vector,lstm和其他方法进行语义分析。 主要用于文本相似度分析。
 
0.0 0.0
  10月前

P PyLex是一个Python3库,用于对单词进行词法分析,一次一个单词
 
0.0 0.0
  4月前

Y 一个微型的中文分词器,能够按照词语的频率(概率)来利用构建 DAG(有向无环图)来分词
 
0.0 10.0
  前天

S Using pre trained word embeddings (Fasttext, Word2Vec)
 
0.0 0.0
  3月前