admin管理员组文章数量:1794759
python学习笔记(二)
python学习笔记(二)—python爬取网页源代码
使用模块urllib
#coding:utf-8 import urllib.request请求url,获取网页源代码
def getHtml(url): h = urllib.request.urlopen(url).read() return h保存文档
def saveHtml(file_name,file_content): with open (file_name,"wb") as f: f.write( file_content )循环访问并爬取网站内各网页源代码
for i in range(1,6365): url='www.xxxx/home.php?mod=space&uid=' h=getHtml(url) saveHtml('D:/工具/py脚本/pachong/html/%s.html'%i,h) print ("结束")版权声明:本文标题:python学习笔记(二) 内容由林淑君副主任自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.xiehuijuan.com/baike/1686621105a87266.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论