admin管理员组文章数量:1794759
以某乎为实战案例,教你用Python爬取手机App数据!居然有人说爬不了APP!
最近爬取的数据都是网页端,今天来教大家如何爬取手机端app数据(本文以ios苹果手机为例,其实安卓跟ios差不多)!
本文将以『某乎』为实战案例,手把手教你从配置到代码一步一步的爬取App数据!
2、配置抓包工具 1.安装软件【资料领取】本文选择的抓包工具:Fiddler
具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!
2.配置Fiddler安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!)
配置Connections打开Fiddler后,点击Tools->Options
点击Connections
勾选上对应的选项
配置HTTPS由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!
勾选上对应的选项
最后抓包工具Fiddler就配置好了
记得重启Fiddler!重启Fiddler!重启Fiddler!不然可能不生效
3、配置手机代理 1.设置代理 准备工作首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网)
查看ip命令
window:ipconfig复制代码 开始配置目标代理主机信 ip:192.168.31.195
端口:8888
在wifi无线网处进去,点击配置代理
填写好相关代理信
2.安装证书在浏览器输入:
192.168.31.195:8888 复制代码
点击下载证书后,下面就开始安装(看图操作)
ok,这样手机端就配置完成,下面开始抓取数据!!!
4、抓取数据 1.打开某乎app 2.查看数据包列表打开app之后,Fiddler就已经抓取到数据了
这里可以看到app发送和接收了哪些数据包
为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件
这样我们获取的数据包列表就都是过滤条件内的目标网址
3.查找数据包比如点击热榜
对应的https加密数据包如下:
数据包中的数据如下:
提取出url链接
api.zhihu/topstory/hot-list?limit=10&reverse_order=0
拿到url之后,接着开始编程爬取保存数据。
4.编写爬虫程序 # -*- coding: utf-8 -*-ok这样就可以将数据获取下来! 5、总结 1.配置抓包工具Fiddler(重点)。 2.ios苹果手机配置证书和设置代理(安卓手机也类似)。 3.简单使用Fiddler(过滤数据包、查看数据包等)。 4.本文以某户为实战,实现了python爬取手机app数据(详细教程,推荐收藏)。
如何获取源码:
①3000多本Python电子书有 ②Python开发环境安装教程有 ③Python400集自学视频有 ④软件开发常用词汇有 ⑤Python学习路线图有 ⑥项目源码案例分享有 如果你用得到的话可以直接拿走,在我的QQ技术交流群里群号:754370353(纯技术交流和资源共享,广告勿入)以自助拿走点击这里 领取
版权声明:本文标题:以某乎为实战案例,教你用Python爬取手机App数据!居然有人说爬不了APP! 内容由林淑君副主任自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.xiehuijuan.com/baike/1686475283a71649.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论