python - 关于爬取网站,下载图片的时候碰到网址结构问题卡住

 你不必害怕q因为我会发光 发布于 2022-10-27 01:31

下载图片的时候很容易碰到下载了几张之后碰到图片的链接里面含有/时会出现:
FileNotFoundError: [Errno 2] No such file or directory:

例如:
图一:http://gnondgnoqnioandiofnas_swn_ssy_mhtng.jpg
图二:http://asnoqenconvoqenripetn_swn_ssy_mhtng.jpg
图三:http://asdnioqnoqwrqwenoqwr/12345/123/1256.gif

 
for item in download_link:
    urllib.request.urlretrieve(item,folder_path + item[-19:])
    time.sleep(2)
    print('Done')
    

运行到图三的时候就中断了,我的理解是因为图三的地址有/,造成文件夹之后再次进入子文件夹进不去,所以出错。

(1)想请问下怎么样能跳过这个文件,继续下载后面的图片
(2)或者说有什么办法能直接把这个图三直接下载了

2 个回答
  • 粗暴一点,你可以try一下。

    2022-10-27 01:31 回答
  • urlretrieve第二个参数是文件名,文件名里面是不允许有斜杠的,可以这样做:

    urllib.request.urlretrieve(item,folder_path + item.split('/')[-1])
    2022-10-27 01:32 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有