Web爬虫 - Web爬虫

按热度排序
22 373 35

K Kimura - 用Ruby编写的现代Web抓取框架,与Headless Chromium / Firefox,PhantomJS或简单的HTTP请求一起开箱即用,并允许抓取用交互JavaScript呈现的网站
 
4.0 0.3
  1月前
90 3.9k 442

M Mechanize 一个让自动化web交互变得容易的ruby库
 
2.4 0.0
  5月前
83 1.6k 118

U Upton - 一个简单的Web爬虫框架拥有一个实用的调试模式
 
1.8 0.0
  6月前
50 1.2k 115

W Wombat - 轻量级的Ruby Web爬虫拥有一个优雅的DSL能够解析网页上的结构化数据
 
1.1 1.0
  9天前
6 129 23

R RubyRetriever - 异步Web爬虫。可以作为命令行可执行和爬虫框架使用
 
0.5 0.0
  3年前
6 46 6

D 豆瓣小组顶帖机器人是一个电脑程序,用于豆瓣小组特定作者特定话题的自动化顶帖。该脚本通过约 30 行核心 JavaScript 代码,可以实现无人值守全自动化顶帖,并可以根据个人需要控制发帖频率和发帖内容;利用浏览器的 Cookie/Session,大多数时候可以避免触发豆瓣的验证码;
 
0.1 0.0
  2年前