新浪微博爬虫

基于Python实现的从微博移动端爬取新浪微博用户的微博数据（文本、图片、实况照片和视频）。该爬虫通过session（用户名和密码）模拟用户登录。

特别感谢Python中文社区提供的原始代码SourceCode_weibocrawler.py。

功能

爬虫程序在Ubuntu 16.04操作系统已测试通过。针对Window和macOS操作系统，文件路径的格式需要进行相应的修改。

设置session的S_DATA和S_HEADER以模拟新浪微博用户登录（详细信息参见注释）。
设置目标微博用户的USER_URL（详细信息参见注释）。
设置爬取的总页数PAGE_AMOUNT（详细信息参见注释）。
设置保存微博数据的路径PATH_FOLDER和文本文件PATH_FILE_TXT。
设置爬取的微博数据类型（IF_IMAGE、IF_PHOTO和IF_VIDEO为1）。
若需要将实况照片（视频）转换为GIF图片，设置IF_LIVE2GIF = True。
设置爬虫的TIME_DELAY以避免ConnectionError 104: ('Connection aborted.')。
如果出现ConnectionError 104: ('Connection aborted.')：
1. 设置IF_RECONNECT = True以重连模式运行爬虫。
2. 设置TAG_STARTCARD为终止微博的序号（根据日志信息）。
3. 重新运行run_WeiboCrawler.py以继续爬取微博数据。
4. 若以正常模式运行爬虫，设置IF_RECONNECT = False！

微博数据将会保存到预设定的文件夹（例如，Demo_WeiboData/）。
微博文本将会保存到文本文件（例如，Demo_WeiboData/Demo_WeiboPost_Records.txt）。
图片、实况照片和视频将会保存到子文件夹（例如，Demo_WeiboData/1/、Demo_WeiboData/1_livephoto/和Demo_WeiboData/1_video/）。

如果您对该项目有任何问题，请报告issue，我将会尽快回复。

如果该项目对您有帮助，请为其加星支持哈，非常感谢。^_^