admin管理员组文章数量:1794759
迪艾姆python培训
迪艾姆python培训_爬虫_采集联想词
提供python收费辅导服务 本人为迪艾姆python培训黄哥,请看视频讲课效果
迪艾姆python培训视频试看下载
#coding:utf-8 """ 本代码由迪艾姆公司python培训班黄哥所写,详细请看视频。 视频中有讲爬虫常用模块和第三方库,urllib2怎么使用、http拦截、get模拟、代理访问等知识点。 迪艾姆python远程视频培训班 咨询:qq:1465376564 """ import urllib2 import urllib import re import time from random import choice #特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip iplist = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888'] list1 = ["集团","科技"] for item in list1: ip= choice(iplist) gjc = urllib.quote(item) url = "sug.so.360/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc headers = { "GET":url, "Host":"sug.so.360", "Referer":"www.so/", "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17", } proxy_support = urllib2.ProxyHandler({'http':''+ip}) opener = urllib2.build_opener(proxy_support) urllib2.install_opener( opener ) req = urllib2.Request(url) for key in headers: req.add_header(key,headers[key]) html = urllib2.urlopen(req).read() ss = re.findall("\\"(.*?)\\"",html) for item in ss: print item time.sleep(2)
视频请看python培训_python爬虫之采集
版权声明:本文标题:迪艾姆python培训 内容由林淑君副主任自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.xiehuijuan.com/baike/1687072366a131176.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论