HTML操作 - 处理 HTML和XML的库。

分类 - 设置更多关注

排序

按热度排序
Popular
238 8.5k 462

R 该库旨在尽可能简单直观地解析HTML(例如,抓取网页)
 
10.0 8.0
  28天前
51 811 162

D generator.py包含主脚本。 它使用grammar.py作为库,并包含DOM fuzzing的其他辅助程序代码
 
2.9 0.0
  3月前
49 722 215

H html5lib:一个兼容标准的 HTML 文档和片段解析及序列化库
 
2.3000000000000003 0.7000000000000001
  18天前
11 549 16

H html5-parser一个用于Python基于C的快速HTML5解析
 
1.9 0.5
  10天前
15 349 53

T tomd:将HTML转换为Markdown
 
1.2 0.0
  9月前
15 349 53

J 将HTML转换为Markdown的工具,用Python编写
 
1.2 0.0
  9月前
30 353 53

U untangle:将XML文档转换为Python对象,使其可以方便的访问
 
1.1 0.0
19 226 70

M MarkupSafe:为Python 实现 XML/HTML/XHTML 标记安全字符串
 
0.7000000000000001 0.0
  3月前
6 139 2

H Harser:对HTML解析和构建XPath的简单方法
 
0.5 0.0
  1年前
98 2.9k 217

M 一个用于自动与网站交互的Python库, MechanicalSoup自动存储和发送cookie,遵循重定向,并可以跟随链接并提交表单。
 
0.4 2.8000000000000003
116 3.2k 298

X xmltodict:像处理 JSON 一样处理 XML
 
0.3 0.7000000000000001
  1月前
69 1.6k 142

P pyquery:一个解析 HTML 的库,类似 jQuery
 
0.2 0.3
  1月前
74 1.5k 470

X xhtml2pdf:HTML/CSS 转 PDF 工具
 
0.1 0.5
6 84 3

S 使用Modest引擎(快速HTML5解析器和CSS选择器)的一个Python绑定
 
0.1 2.0
  19天前
3 84 5

M 利用正则表达式,筛选出我们想要的目标,将该目标替换成Html的语法
 
0.0 0.0
  1年前
12 81 12

D Demiurge:基于PyQuery 的爬虫微型框架
 
0.0 0.0
0 56 2

H 这个包提供了一组函数来度量网页之间的相似度
 
0.0 0.0
  5月前
1 16 2

Z zhihu_Backup 知乎个人回答备份,获取html并打印到pdf
 
0.0 0.0
  11月前