Web爬虫 - Web爬虫

按热度排序
9 181 18

K Kimura - 用Ruby编写的现代Web抓取框架,与Headless Chromium / Firefox,PhantomJS或简单的HTTP请求一起开箱即用,并允许抓取用交互JavaScript呈现的网站
 
5.1 4.3
  1月前
90 3.8k 438

M Mechanize 一个让自动化web交互变得容易的ruby库
 
2.1 0.0
  5月前
85 1.6k 121

U Upton - 一个简单的Web爬虫框架拥有一个实用的调试模式
 
1.7000000000000002 0.3
  1月前
53 1.1k 113

W Wombat - 轻量级的Ruby Web爬虫拥有一个优雅的DSL能够解析网页上的结构化数据
 
0.8999999999999999 0.0
  3月前
6 123 21

R RubyRetriever - 异步Web爬虫。可以作为命令行可执行和爬虫框架使用
 
0.5 0.0
  2年前
6 36 5

D 豆瓣小组顶帖机器人是一个电脑程序,用于豆瓣小组特定作者特定话题的自动化顶帖。该脚本通过约 30 行核心 JavaScript 代码,可以实现无人值守全自动化顶帖,并可以根据个人需要控制发帖频率和发帖内容;利用浏览器的 Cookie/Session,大多数时候可以避免触发豆瓣的验证码;
 
0.1 0.0
  1年前