Python网络图片爬取

芳华梦落 2022-9-17 75 9/17

一、源代码

import requests
import os
url="https://pic.netbian.com/uploads/allimg/210519/002850-1621355330e39b.jpg"
root="D://pics//"    #设立一个根目录
path=root+url.split("/")[-1]  #保存图片的地址+图片名字
try:
    if not os.path.exists(root):   #判断是否存在根目录
        os.mkdir(root)   #建立一个根目录
    if not os.path.exists(path):   #判断是否存在这个地址
        r=requests.get(url)
        with open(path,'wb') as f:
            f.write(r.content)
            f.close()
            print("文件保存成功")
    else:
        print("文件已存在")   #如果存在,返回文件已存在
except:
    print("爬取失败")

二、源代码解释

1、requests库是Python爬虫主要的库,是轻量型的爬虫库,特点是使用和入门比较简单

2、此代码使用了os库,代码第六行使用os的.path.existe方法判断根目录是否存在,第七行使用os.mkdir方法建立一个新目录,os.path是一个整体使用的部分

3、第十一行文件的写入使用到了r.content方法,这个方法是以2进制写入,因为图片都是以2进制形式保存

3、全代码使用到了try-except方法进行异常处理

三、代码的使用

将代码的url="https://pic.netbian.com/uploads/allimg/210519/002850-1621355330e39b.jpg"改为自己需要爬取的图片的地址,地址格式必须是.jpg结尾的。

- THE END -

芳华梦落

9月17日19:26

最后修改:2022年9月17日
0

非特殊说明,本博所有文章均为博主原创。