#微实例1:京东商品页面的爬取 |
import requests |
url = 'https://item.jd.com/100021802484.html' |
try : |
headers = { 'User-agent' : 'Mozilla/5.0' } |
#设定请求头 |
r = requests.get(url,headers = headers) |
#打开京东商品页面链接 |
r.raise_for_status() |
#判断返回状态码是否200,不是则执行except |
r.encoding = r.apparent_encoding |
#将编码方式设置为页面内容的编码方式 |
print (r.text[: 1000 ]) |
#打印网页源代码前1000个字符 |
except : |
print ( '获取网页信息失败' ) |