文本解析和操作 - 用于解析和操作文本与特殊文本格式的Python库

分类 - 设置更多关注

排序

按热度排序
271 5.6k 738

T TextBlob 是一款 Pythonic 的文本处理工具,用于处理文本数据,它提供了一个简单的 API,用于潜入常见的自然语言处理(NLP)任务,如词性标注、名词短语提取、情感分析、分类等
 
10.0 1.7000000000000002
130 3.5k 462

C CSV csvkit:用于转换和操作 CSV 的工具
 
10.0 0.7000000000000001
  10天前
139 3.1k 476

T tablib:Python模块处理在XLS, CSV, JSON, YAML中的数据集
 
10.0 1.3
  1月前

F ftfy:让Unicode文本更完整更连贯
 
9.6 4.699999999999999
  9天前

M Markdown -> PDF/HTML简历生成器
 
3.1 0.2
  1月前

S shortuuid:一个生成器库,用以生成简洁的,明白的,URL 安全的 UUID
 
3.0 1.0

S safemd 一个专注于安全性优先的markdown渲染器
 
2.9 6.2

P python-user-agents:浏览器的user agent 解析器用于判断来源是电脑、手机、平板
 
2.5 0.0
  2月前

L Lark - 一个Python的现代通用解析库
 
2.5 10.0

I img2txt - 将图片转成带颜色的Ascii,可输出到html或ansi终端
 
2.2 0.0
  5月前

J 解析字符串使用基于Python format() 语法的规范
 
1.9 0.8
  16天前

X xpinyin:一个用于把汉字转换为拼音的库
 
1.7999999999999998 3.3000000000000003
  5天前

P python-slugify:Python slug 化库,可以把 unicode 转化为 ASCII。
 
1.7999999999999998 1.0
  1月前

M macro_pack是用于自动化混淆和生成MS Office文档的工具。macro_pack的目标是简化反恶意软件解决方案,绕过并自动化从vba生成到最终Office文档生成的过程。
 
1.7999999999999998 7.7

L Levenshtein:快速计算编辑距离以及字符串的相似度
 
1.7000000000000002 0.0
  2年前

S Slug化 awesome-slugify:一个 Python slug 化库,可以保持 Unicode
 
1.3 0.0

Y yarl 这个模块提供了用于url解析和更改的便捷的URL类
 
1.2 8.299999999999999

M meza 是个 Python 库, 专门读取和处理表格数据 ; 函式型接口,擅长读写大文件, 并支持十数种文件格式
 
1.1 0.0
  5月前

Y yfiglet-figlet:pyfiglet -figlet 的 Python实现
 
1.0 3.3000000000000003