HTTP和网站爬取 - 用于HTTP和网站爬取的PHP库

按热度排序
187 4k 744

P php-webdriver – 用于PHP的Selenium WebDriver绑定
 
10.0 5.8
  27天前
239 3.1k 1.2k

P 《我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言 》所使用的程序
 
10.0 0.2

H HttpClient组件提供了同步或异步获取HTTP资源的强大方法
 
2.9 10.0

S HTTP军刀(呆毛王), Swoole人性化组件库之PHP高性能HTTP客户端, 基于Swoole原生协程, 支持多种风格操作, 底层提供高性能解决方案, 让开发者专注于功能开发, 从传统同步阻塞且配置繁琐的Curl中解放.
 
2.5 0.0

P PuPHPeteer 一个Puppeteer与PHP的桥接,支持完整的API。基于Rialto,一个从PHP管理来自Node资源的软件包。
 
2.4 0.0
  3月前
472 19k 2.1k

G Guzzle:一个可扩展的HTTP客户端
 
472 19k 2.1k

G Guzzle 一款流行可扩展的PHP HTTP Client客户端
 

X 极易上手,具备完善的文档和示例 支持多并发爬取 支持失败重试、代理、断点续爬 完善的爬取进度日志 支持基于xpath、css选择器解析内容 支持模拟浏览器行为,如user-agent、cookie、提交表单
 
1.2 0.0

H HTML5DOMDocument 一个PHP的更好的HTML5解析器
 
1.0 1.5

L Laravel 5 Facade for Goutte 一个简单的PHP Web爬虫
 
0.9 1.0

W 微博爬虫,模拟登录,数据抓取
 
0.9 0.7
  24天前
40 265 116

C 这是最近使用纯 php 代码开发的并行抓取(爬虫)框架,基于 hightman\httpclient 组件。
 
0.8 0.0
  4年前

P php实现的dht爬虫
 
0.8 0.0
  8月前

J 基于swoft-cloud的微服务架构,最小化拆分粒度,PHP7、多进程、协程、异步任务、mysql连接池、redi连接池、rpc连接池、服务治理、服务注册与发现、Aop切面、全注解
 
0.6 0.0
358 7.8k 930

G Goutte:一个简单的PHP web爬取器
 
0.5 0.0

Y 一个基于PHP cURL的开源HTTP类库,支持链式操作,省去繁杂的cURL使用方法。
 
0.5 7.2