rockyzhengwu

FoolNLTK:中文处理工具包,号称可能不是最快的开源中文分词

可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率 用户自定义词典

相关的项目 - 更多比较

318 7k 1.2k

N Newspaper可以用来提取新闻、文章和内容分析。使用多线程,支持10多种语言等。 作者从requests库的简洁与强大得到灵感,使用python开发的可用于提取文章内容的程序。
 
10.0 5.5
  6天前
Popular
585 6.4k 877

Z Repository to track the progress in Natural Language Processing (NLP), including the datasets and the current state-of-the-art for the most common NLP tasks.
 
10.0 10.0
  5天前
268 5.6k 735

T TextBlob 是一个用于处理文本数据的Python(2和3)库。它为潜入常见的自然语言处理(NLP)任务提供了一个简单的API,例如词性标注,名词短语提取,情感分析,分类,翻译等。
 
10.0 5.0
  6天前