作者:别喷我我还小_216 | 来源:互联网 | 2023-07-20 05:12
京东商品页面爬取选择了一款荣耀手机的页面(给华为打广告了,荣耀play真心不错)1importrequests2urlhttps:item.jd.com747991
京东商品页面爬取
选择了一款荣耀手机的页面(给华为打广告了,荣耀play真心不错)
1 import requests
2 url = "https://item.jd.com/7479912.html"
3 try:
4 r = requests.get(url)
5 r.raise_for_status()
6 r.encoding = r.apparent_encoding
7 print(r.text[:1000])
8 except:
9 print("爬取失败")
这里给出更改发送信息的头部来模拟浏览器爬取网站信息
import requests
url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
kv={'User-Agent':'Mozilla/5.0'}
r = requests.get(url,headers=kv)
r.raise_for_status()
r.encoding = r.apparent_encoding
print(r.text[1000:2000])
except:
print("爬取失败")