百木园-与人分享,
就是让自己快乐。

Python爬虫学以致用,嘿嘿

因为放假回到了老家,可能是在镇上的缘故,治安管的可能不是那么严,每天晚上都会有鬼火少年出来炸街,md,有时候半夜两三点突然炸一下街,声音贼大,但是吧,声音贼大,车速还没我跑的快

a4705de191e267485687c5f84ed3d112.gif

天菩萨,真的烦死人了,一声砰,一下抖,家人们就说连续几天烦死了

1cd3655a2e098a506cdd281b7a7ef804.gif

于是我就想写篇文章去我们当地的\"情报网\"(就是那种地方自己人吐槽或者互助的网),希望大家一起对这种行为控诉一波,也希望家里有鬼火少年的家长不要天天麻将馆007,多看看你孩子在街上放炮。

于是我就写了篇文章去控述,但是吧,担心浏览量低了,大家看不到,于是就想想能不能用python写个爬虫来长长浏览量,说干就干。

由于那个网址太low,也没啥反扒的,也不需要休眠啥的,就很简单的写了出来,就用了个多线程,轮换ip,欸嘿嘿。

下面是代码

import requests
import random
from concurrent.futures import ThreadPoolExecutor
\"\"\"发送请求到网址\"\"\"
def Requsts():
    # ip池
    proxies = [
        {\'http\': \'183.230.106.87\'},
        {\'http\': \'183.64.239.19\'},
        {\'http\': \'36.92.159.181\'},
        {\'http\': \'202.142.126.6\'},
        {\'http\': \'67.229.29.109\'},
        {\'http\': \'36.95.15.149\'}
    ]
    header={
        \"User-Agent\": \"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.9 Safari/537.36\"
    }
    proxy = random.choice(proxies)# 随机选取一个ip
    url=\'https://www.qj023.com/forum.php?mod=viewthread&tid=1940772\'
    resp=requests.get(url,headers=header,proxies=proxy)
\"\"\"多线程刷网址\"\"\"
def Multithreading():
     with ThreadPoolExecutor(100) as t:  # 创建线程池,有100个线程
            for i in range(1000000):
                t.submit(Requsts)
                print(i)
if __name__ == \'__main__\':
    Multithreading()

看看成果吧

8e0c660cf8f5465ba2b5beff8866ae91.png

欸嘿嘿,不敢长太多了,万一被逮到村口示众就蛋糕了。

代码因网址而已哈,有些网址有反扒机制的,可以自己去破破(比如添加cookie),刷太快怕被检测到的,可以每次休眠一会会儿。


来源:https://blog.csdn.net/m0_67394230/article/details/123258361
本站部分图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » Python爬虫学以致用,嘿嘿

相关推荐

  • 暂无文章