高质量爬虫案例聚集,仅供测试,学习,切勿暴力索取!!!
少点套路,多点真诚,仍有不足,欢迎交流~~
每个文件夹都包含一个爬虫以及一个raedme文件
爬虫文件代码顶端加上author及日期
# author:xxx 19-9-22
喜马拉雅免费音频下载
代码用于下载已购买的课课家视频教程
代码用于下载已购买的淘宝教育视频教程
代码用于下载菜鸟窝视频教程
爬取新浪旗下黑猫投诉平台中,圆通速递投诉信息,保存于MySQL数据库
通过代理访问twitter,解析网页源码获取推文信息,构造content_id找到下一页推文数据
通过大量的正则匹配解析推文信息
电商网站数据采集,包括京东、苏宁、天猫
Python3实现百度云盘资源自动转存,解决带有密码的分享链接自动转存,不含密码的资源自动转存,同时实现post请求转存以及selenium转存