HTTP和网站爬取 - 用于HTTP和网站爬取的PHP库

按热度排序
349 6.5k 828

G Goutte:一个简单的PHP web爬取器
 
10.0 0.3
216 2.4k 978

P 《我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言 》所使用的程序
 
10.0 4.0
498 13.2k 1.8k

G Guzzle 一款流行可扩展的PHP HTTP Client客户端
 
9.0 1.2
497 13.2k 1.8k

G Guzzle:一个可扩展的HTTP客户端
 
9.0 1.2

Z Zttp 针对大多数常见用例进行优化的基于开发人员体验的HTTP客户端
 
3.1 0.0
62 881 131

Z zend-diactoros - PSR-7 HTTP 消息实现
 
2.8000000000000003 8.5
57 720 163

B Beanbun 是用 PHP 编写的多进程网络爬虫框架,具有良好的开放性、高可扩展性,基于 Workerman。
 
2.6 0.0
27 623 100

C Crawl links on a website 此软件包提供了一个类来爬网站上的链接
 
2.0 3.3000000000000003

X 极易上手,具备完善的文档和示例 支持多并发爬取 支持失败重试、代理、断点续爬 完善的爬取进度日志 支持基于xpath、css选择器解析内容 支持模拟浏览器行为,如user-agent、cookie、提交表单
 
1.4000000000000001 3.0

P PuPHPeteer 一个Puppeteer与PHP的桥接,支持完整的API。基于Rialto,一个从PHP管理来自Node资源的软件包。
 
1.2 5.699999999999999
  前天
38 247 115

C 这是最近使用纯 php 代码开发的并行抓取(爬虫)框架,基于 hightman\httpclient 组件。
 
0.8 0.0
  2年前

P php实现的dht爬虫
 
0.7000000000000001 0.0
  7月前

L Laravel 5 Facade for Goutte 一个简单的PHP Web爬虫
 
0.6 0.0
  5月前

R Retrofit - PHP的REST API 客户端创建库
 
0.4 0.0
  3月前
145 2.9k 410

R Requests:一个简单的HTTP 请求库,它简化了如何与其他站点交互,带走你所有的担心。
 
0.3 0.0