微博终结者爬虫

这个项目致力于对抗微博的反爬虫机制,集合众人的力量把微博成千上万的微博评论语料爬取下来并制作成一个开源的高质量中文对话语料,推动中文对话系统的研发。

相关的项目 - 更多比较

602 3.3k 1.7k

T TuShare是实现对股票/期货等金融数据从**数据采集**、**清洗加工** 到 **数据存储**过程的工具
 
10.0 4.699999999999999
  前天
Popular
139 2.2k 427

? 🔞 全球最大成人网站PornHub爬虫 (Scrapy、MongoDB) 一天500w的海量数据
 
10.0 10.0
  18天前
Popular
1.4k 20.7k 5.5k

S Scrapy:一个快速高级的网站截图和网页采集框架
 
9.0 10.0
  5天前