admin管理员组

文章数量:1794759

迪艾姆python培训

迪艾姆python培训

迪艾姆python培训_爬虫_采集联想词

提供python收费辅导服务 本人为迪艾姆python培训黄哥,请看视频讲课效果

迪艾姆python培训视频试看下载

#coding:utf-8 """ 本代码由迪艾姆公司python培训班黄哥所写,详细请看视频。 视频中有讲爬虫常用模块和第三方库,urllib2怎么使用、http拦截、get模拟、代理访问等知识点。 迪艾姆python远程视频培训班 咨询:qq:1465376564 """ import urllib2 import urllib import re import time from random import choice #特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888'] list1 = ["集团","科技"] for item in list1:     ip= choice(iplist)     gjc = urllib.quote(item)     url = "sug.so.360/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc     headers = {                 "GET":url,                 "Host":"sug.so.360",                 "Referer":"www.so/",                 "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",                 }     proxy_support = urllib2.ProxyHandler({'http':''+ip})     opener = urllib2.build_opener(proxy_support)     urllib2.install_opener( opener )     req = urllib2.Request(url)          for key in headers:         req.add_header(key,headers[key])     html = urllib2.urlopen(req).read()          ss = re.findall("\\"(.*?)\\"",html)     for item in ss:         print item     time.sleep(2)

视频请看python培训_python爬虫之采集

本文标签: 迪艾姆Python