crownpku - I train myself to train machines.

中文文本标注工具

自然语言处理的大部分任务是监督学习问题。序列标注问题如中文分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。深度学习大行其道的今天,基于深度学习的NLP模型更是数据饥渴。

相关的项目 - 更多比较

93 916 217

F 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 基于BiLSTM模型训练而成 包含分词,词性标注,实体识别, 都有比较高的准确率 用户自定义词典
 
3.3000000000000003 0.5
  1月前
91 961 291

MatchZoo是一个文本匹配的工具包
 
3.2 3.3000000000000003
  1月前
73 955 231

S synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等。
 
3.2 0.7000000000000001
  23天前