jsoup:一款Java开源的HTML解析库

jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
热门度(没变化) 10.0 活跃度(上升) 5.0
Watchers:820
Star:8984
Fork:3767
创建时间: 2013-04-23 20:57:36
最后Commits: 8天前
WebMagic是一个简单灵活的Java爬虫框架。基于WebMagic,你可以快速开发出一个高效、易维护的爬虫
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 10.0 活跃度(没变化) 0.2
Watchers:336
Star:2641
Fork:1419
创建时间: 2014-07-12 11:16:12
最后Commits: 30天前
WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 8.5 活跃度(没变化) 8.2
Watchers:243
Star:2074
Fork:1152
创建时间: 2009-05-21 09:17:48
最后Commits: 22天前
Apache Nutch:可用于生产环境的高度可扩展、可伸缩的网络爬虫
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 3.1 活跃度(没变化) 0.0
Watchers:124
Star:914
Fork:481
创建时间: 2016-11-24 09:48:03
最后Commits: 3年前
Gather Platform 数据抓取平台是一套基于Webmagic内核的,具有Web任务配置和任务管理界面的数据采集与搜索平台.
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.7 活跃度(没变化) 0.0
Watchers:43
Star:487
Fork:225
创建时间: 2017-10-17 11:39:46
最后Commits: 5月前
XXL-CRAWLER 是一个灵活高效、面向对象的分布式爬虫框架。一行代码开发一个分布式爬虫
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.7 活跃度(没变化) 0.0
Watchers:43
Star:484
Fork:224
创建时间: 2017-10-17 11:39:46
最后Commits: 5月前
An object-oriented crawler framework(面向对象的爬虫框架)
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.2 活跃度(没变化) 0.0
Watchers:12
Star:353
Fork:91
创建时间: 2018-01-04 17:32:32
最后Commits: 1年前
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.2 活跃度(下降) 4.5
Watchers:7
Star:127
Fork:50
创建时间: 2020-03-27 19:07:15
最后Commits: 20天前
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.1 活跃度(没变化) 0.0
Watchers:24
Star:306
Fork:84
创建时间: 2018-01-11 21:41:16
最后Commits: 2年前
说起爬虫,大家能够想起 Python 里赫赫有名的 Scrapy 框架, 在本文中我们参考这个设计思想使用 Java 语言来实现一款自己的爬虫框(lun)架(zi)。 我们从起点一步一步分析爬虫框架的诞生过程。
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.1 活跃度(没变化) 0.0
Watchers:28
Star:304
Fork:143
创建时间: 2017-10-25 16:09:44
最后Commits: 2年前
基于webmagic + springboot + mybatis的Java爬虫,使用Echarts进行数据可视化分析,提供了从爬虫获取数据到数据持久化、数据可视化分析以及构建简单的代理池等一整套解决方案模板。
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 1.0 活跃度(没变化) 0.0
Watchers:13
Star:277
Fork:79
创建时间: 2018-02-23 16:11:46
最后Commits: 1年前
🏡🏡🏡 房源数据爬虫。支持断点续爬,价格变更通知,提供数据的分析统计服务。
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:8
Star:245
Fork:19
创建时间: 2017-05-07 23:17:18
最后Commits: 3年前
Java JSOUP 标注方案,不用自己费劲解析了
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.7 活跃度(没变化) 0.0
Watchers:329
Star:2896
Fork:711
创建时间: 2015-10-27 08:42:01
最后Commits: 4年前
Anthelion是Apache Nutch的一个插件用于爬取在HTML页面中的语义标注
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.7 活跃度(没变化) 0.0
Watchers:216
Star:2320
Fork:792
创建时间: 2016-11-24 12:44:44
最后Commits: 3年前
webporter 是一个基于垂直爬虫框架 webmagic 的 Java 爬虫应用,旨在提供一套完整的数据爬取,持久化存储和可视化展示的实践样例。
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.7 活跃度(没变化) 0.0
Watchers:6
Star:221
Fork:51
创建时间: 2017-09-12 17:32:34
最后Commits: 3月前
免登录下载微博图片 爬虫 Download Weibo Images without Logging-in
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.7 活跃度(没变化) 0.5
Watchers:6
Star:202
Fork:35
创建时间: 2018-10-31 00:32:26
最后Commits: 1月前
多来源小说爬虫下载框架,并发下载,不限速度
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.6 活跃度(没变化) 0.0
Watchers:314
Star:3908
Fork:1820
创建时间: 2012-01-01 06:49:18
最后Commits: 4月前
crawler4j是Java实现的开源网络爬虫。提供了简单易用的接口,可以在几分钟内创建一个多线程网络爬虫。
访问GitHub主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.6 活跃度(没变化) 0.2
Watchers:23
Star:184
Fork:36
创建时间: 2017-03-10 11:56:21
最后Commits: 27天前
webBee 🐝基于jdk8 是一个持续成长的垂直爬虫框架项目
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.5 活跃度(没变化) 0.0
Watchers:137
Star:1934
Fork:758
创建时间: 2015-12-12 20:41:00
最后Commits: 10月前
Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页
热门度(没变化) 0.5 活跃度(没变化) 0.0
Watchers:14
Star:153
Fork:70
创建时间: 2017-04-10 23:35:43
最后Commits: 1年前
自主研发的一个java版本的分布式的通用爬虫,可以热插拔各个组件(提供默认的),自动切换代理,自动结构化数据与存储。使用redis,分布式调度等技术。
访问GitHub主页 访问主页

VS

热门度(没变化) 0.8 活跃度(没变化) 0.0
Watchers:398
Star:7944
Fork:1777
创建时间: 2009-12-19 09:29:58
最后Commits: 2月前
jsoup 是一个用于解析HTML的Java 类库。它提供了一套非常方便快捷的API,通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。
访问GitHub主页 访问主页