又到每天Python小技巧分享的时候了,今天给大家分享的是怎么样去爬取清纯小姐姐照片(没有人会拒绝美女吧,小声说),这篇文章好像有点刺激,未成年的小伙伴就不要进来了。快来看看这些清纯的小姐姐的容颜,话不多说,上教程。
先来看看效果图
不好意思,图片有点辣眼睛,被拦截了,还没有还给我.....
import re import requests import os
头文件:
因为爬虫需要用到请求网络部分,所以需要这两个包,没有的话自行下载即可。这个可以直接用pip安装。如果连pip都不懂,那就只能学习一下python基础了。
请求头:
headers = {\'User-Agent\':\'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36\'
完整的请求:
# (https://jq.qq.com/?_wv=1027&k=RFMVm5zq) url = \'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word==\'+name+\'+&pn=\'+str(i*30) result = requests.get(url,headers=headers) dowmloadPic(result.content.decode(), name)
正则表达式:
pic_url = re.findall(\'\"objURL\":\"(.*?)\",\',html,re.S)
下载图片:
fp = open(dir, \'wb\') fp.write(pic.content) fp.close()
完整代码:
#!/usr/bin/python # -*- coding: UTF-8 -*- import re import requests import os def dowmloadPic(html, keyword,i): pic_url = re.findall(\'\"objURL\":\"(.*?)\",\',html,re.S) abc=i*60 print(\'找到关键词:\' + keyword + \'的图片,现在开始下载图片...\') for each in pic_url: print(\'正在下载第\' + str(abc) + \'张图片,图片地址:\' + str(each)) try: pic = requests.get(each, timeout=10) except requests.exceptions.ConnectionError: print(\'【错误】当前图片无法下载\') continue dir = r\'D:\\image\\i\' + keyword + \'_\' + str(abc) + \'.jpg\' if not os.path.exists(\'D:\\image\'): os.makedirs(\'D:\\image\') fp = open(dir, \'wb\') fp.write(pic.content) fp.close() abc += 1 if __name__ == \'__main__\': #word = input(\"Input key word: \") headers = {\'User-Agent\':\'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36\'} name = \"清纯妹子私房照\" num = 0 x =1 for i in range(int(x)): url = \'https://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=\'+name+\'+&pn=\'+str(i*30) print(url) result = requests.get(url,headers=headers) dowmloadPic(result.content, name,1)print(\"下载完成\")
到这里,相信大家都已经把自己心里的小姐姐爬取下来看了(友情提示:别偷偷躲着看),代码都给你了,这不得给我来一个赞,不然怎么对的起这些密密麻麻的代码。爬取小姐姐清纯照片还是超级简单的,不知道你有没有学会,学没学会就先给我点个赞,然后告诉我你还想看什么。
来源:https://www.cnblogs.com/123456feng/p/16034673.html
本站部分图文来源于网络,如有侵权请联系删除。