jinfagang - I am the best!

微博终结者爬虫

这个项目致力于对抗微博的反爬虫机制,集合众人的力量把微博成千上万的微博评论语料爬取下来并制作成一个开源的高质量中文对话语料,推动中文对话系统的研发。

相关的项目 - 更多比较

405 5.3k 807

P portia:Scrapy 可视化爬取
 
10.0 2.5
  1月前
655 3.6k 1.8k

T TuShare是实现对股票/期货等金融数据从**数据采集**、**清洗加工** 到 **数据存储**过程的工具
 
10.0 5.300000000000001
  12天前
168 2.5k 563

? 🔞 全球最大成人网站PornHub爬虫 (Scrapy、MongoDB) 一天500w的海量数据
 
10.0 4.5
  4天前