校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁(yè) > 知識(shí)庫(kù) > Python爬蟲(chóng)和反爬技術(shù)過(guò)程詳解

Python爬蟲(chóng)和反爬技術(shù)過(guò)程詳解

熱門(mén)標(biāo)簽:萊蕪電信外呼系統(tǒng) 高德地圖標(biāo)注收入咋樣 地圖標(biāo)注多個(gè) 鶴壁手機(jī)自動(dòng)外呼系統(tǒng)違法嗎 銀川電話機(jī)器人電話 沈陽(yáng)防封電銷(xiāo)電話卡 企業(yè)微信地圖標(biāo)注 怎么辦理400客服電話 B52系統(tǒng)電梯外呼顯示E7

一、瀏覽器模擬(Headers)

瀏覽器模擬是最常用的一種反爬方式。設(shè)想一下:一個(gè)網(wǎng)站不停的被同一個(gè)版本的瀏覽器頻率的訪問(wèn),那大概了就要被認(rèn)為是機(jī)器人了。所以上有政策下有對(duì)策,我們每次訪問(wèn)都使用不同的瀏覽器版本信息不就可以了嗎。首先我們來(lái)看一下如何找到自己瀏覽器信息。

如何找到瀏覽器信息

打開(kāi)瀏覽器,按F12(或者鼠標(biāo)右鍵+檢查)

點(diǎn)擊如下圖所示的Network按鈕

按鍵盤(pán)Ctrl+R(MAC:Command+R)進(jìn)行抓包

操作完上一步之后,隨便點(diǎn)擊右側(cè)name中的一項(xiàng),即可出現(xiàn)下面的頁(yè)面,紅框中的內(nèi)容就是我們要找的瀏覽器信息了。

備注:有一些網(wǎng)站會(huì)帶有Referer信息,這里的作用主要是在于告訴瀏覽器你是從哪個(gè)網(wǎng)址跳轉(zhuǎn)過(guò)來(lái)的,類(lèi)似于P站這種站點(diǎn)就會(huì)進(jìn)行相應(yīng)的檢查,所以我們可以通過(guò)上述同樣的方式找到瀏覽器的Referer信息。如下圖紅框所示:

通過(guò)上面的步驟,我們就能夠成功的得到瀏覽器的版本信息了,如果能夠獲得不同的版本信息我們就能夠模擬不同的瀏覽器進(jìn)行操作了。

在Python中使用user-agent的方式如下:

headers = {
  			'Referer': '具體的Referer',
            'User-Agent': '具體的user-agent'
    }
requests.get(url,headers=headers)

常用的請(qǐng)求頭(模擬瀏覽器)信息如下:

User_Agent = [
    "Mozilla/5.0 (iPod; U; CPU iPhone OS 4_3_2 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8H7 Safari/6533.18.5",
    "Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_2 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8H7 Safari/6533.18.5",
    "MQQBrowser/25 (Linux; U; 2.3.3; zh-cn; HTC Desire S Build/GRI40;480*800)",
    "Mozilla/5.0 (Linux; U; Android 2.3.3; zh-cn; HTC_DesireS_S510e Build/GRI40) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1",
    "Mozilla/5.0 (SymbianOS/9.3; U; Series60/3.2 NokiaE75-1 /110.48.125 Profile/MIDP-2.1 Configuration/CLDC-1.1 ) AppleWebKit/413 (KHTML, like Gecko) Safari/413",
    "Mozilla/5.0 (iPad; U; CPU OS 4_3_3 like Mac OS X; zh-cn) AppleWebKit/533.17.9 (KHTML, like Gecko) Mobile/8J2",
    "Mozilla/5.0 (Windows NT 5.2) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_2) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.202 Safari/535.1",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_2) AppleWebKit/534.51.22 (KHTML, like Gecko) Version/5.1.1 Safari/534.51.22",
    "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A5313e Safari/7534.48.3",
    "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A5313e Safari/7534.48.3",
    "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A5313e Safari/7534.48.3",
    "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.202 Safari/535.1",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows Phone OS 7.5; Trident/5.0; IEMobile/9.0; SAMSUNG; OMNIA7)",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; XBLWP7; ZuneWP7)",
    "Mozilla/5.0 (Windows NT 5.2) AppleWebKit/534.30 (KHTML, like Gecko) Chrome/12.0.742.122 Safari/534.30",
    "Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0",
    "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.2; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET4.0E; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C)",
    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET4.0E; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C)",
    "Mozilla/4.0 (compatible; MSIE 60; Windows NT 5.1; SV1; .NET CLR 2.0.50727)",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)",
    "Opera/9.80 (Windows NT 5.1; U; zh-cn) Presto/2.9.168 Version/11.50",
    "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)",
    "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022; .NET4.0E; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C)",
    "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN) AppleWebKit/533.21.1 (KHTML, like Gecko) Version/5.0.5 Safari/533.21.1",
    "Mozilla/5.0 (Windows; U; Windows NT 5.1; ) AppleWebKit/534.12 (KHTML, like Gecko) Maxthon/3.0 Safari/534.12",
    "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld)",
    "Opera/9.80 (X11; Linux i686; Ubuntu/14.10) Presto/2.12.388 Version/12.16",
    "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14",
    "Mozilla/5.0 (Windows NT 6.0; rv:2.0) Gecko/20100101 Firefox/4.0 Opera 12.14",
    "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0) Opera 12.14",
    "Opera/12.80 (Windows NT 5.1; U; en) Presto/2.10.289 Version/12.02",
    "Opera/9.80 (Windows NT 6.1; U; es-ES) Presto/2.9.181 Version/12.00",
    "Opera/9.80 (Windows NT 5.1; U; zh-sg) Presto/2.9.181 Version/12.00",
    "Opera/12.0(Windows NT 5.2;U;en)Presto/22.9.168 Version/12.00",
    "Opera/12.0(Windows NT 5.1;U;en)Presto/22.9.168 Version/12.00",
    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1",
    "Mozilla/5.0 (Windows NT 6.3; rv:36.0) Gecko/20100101 Firefox/36.0",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10; rv:33.0) Gecko/20100101 Firefox/33.0",
    "Mozilla/5.0 (X11; Linux i586; rv:31.0) Gecko/20100101 Firefox/31.0",
    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/20130401 Firefox/31.0",
    "Mozilla/5.0 (Windows NT 5.1; rv:31.0) Gecko/20100101 Firefox/31.0",
    "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20120101 Firefox/29.0",
    "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/29.0",
    "Mozilla/5.0 (X11; OpenBSD amd64; rv:28.0) Gecko/20100101 Firefox/28.0",
    "Mozilla/5.0 (X11; Linux x86_64; rv:28.0) Gecko/20100101  Firefox/28.0",
    "Mozilla/5.0 (Windows NT 6.1; rv:27.3) Gecko/20130101 Firefox/27.3",
    "Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:27.0) Gecko/20121011 Firefox/27.0",
    "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:25.0) Gecko/20100101 Firefox/25.0",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:25.0) Gecko/20100101 Firefox/25.0",
    "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:24.0) Gecko/20100101 Firefox/24.0",
    "Mozilla/5.0 (Windows NT 6.0; WOW64; rv:24.0) Gecko/20100101 Firefox/24.0",
    "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:24.0) Gecko/20100101 Firefox/24.0"
]

二、IP代理

除了通過(guò)同一個(gè)瀏覽器進(jìn)行訪問(wèn),還可能出現(xiàn)的情況就是通過(guò)同一個(gè)IP不斷的訪問(wèn)網(wǎng)址,這樣很容易造成整個(gè)IP被封,個(gè)人的IP還好,如果一個(gè)公司的IP都不能訪問(wèn)某個(gè)網(wǎng)站,那將會(huì)是怎樣的效果就不用多說(shuō)了吧。

對(duì)于IP來(lái)說(shuō)除了需要控制IP地址的變更之外,還要控制訪問(wèn)速度,畢竟程序快起來(lái)是不眨眼的。

Python使用IP代理的方式如下:

import requests
proxies = {"http": 'IP地址'}
requests.get(url, headers=headers, proxies=proxies)

注:關(guān)于代理IP去哪找的問(wèn)題,網(wǎng)上一搜一大把,我們放心大膽的使用就可以了。

控制訪問(wèn)頻率使用time模塊即可:

import time
time.sleep(5)

三、Cookies模擬

有很多時(shí)候我們?cè)L問(wèn)網(wǎng)址會(huì)遇到403錯(cuò)誤,一般這種情況表示無(wú)權(quán)訪問(wèn)請(qǐng)求的資源,通常在沒(méi)有設(shè)置cookie或是沒(méi)有設(shè)置正確的cookie會(huì)導(dǎo)致這個(gè)錯(cuò)誤。cookie的存在就像是一個(gè)網(wǎng)址的通行證,你會(huì)發(fā)現(xiàn)在你登陸和未登陸網(wǎng)頁(yè)的時(shí)候cookie是會(huì)發(fā)生變化的。

手動(dòng)獲取cookie

我們可以通過(guò)和獲取user-agent一樣的方式來(lái)手動(dòng)獲取cookie:

自動(dòng)獲取cookie

我們使用session方法就能夠?qū)崿F(xiàn)自動(dòng)獲取cookie了

示例代碼如下:

import requests
session = requests.session()
session.cookies = LWPCookieJar(filename='Cookies.txt')
def login():
    name = input("輸入賬戶(hù):")
    password = input("輸入密碼:")
    url = "url"
    data = {
        "ck": "",
        "name": name,
        "password": password,
        "remember": "True",
        "ticket": "",
    }
    response = session.post(url, data=data)
    print(response.text)
    session.cookies.save()  # 保存 cookie

這樣我們的cookie就能夠得以保存了。

使用session加載cookie的方式如下:

session.cookies = LWPCookieJar(filename='Cookies.txt')
session.cookies.load(ignore_discard=True)

使用cookies

當(dāng)我們有了cookies時(shí),使用起來(lái)就簡(jiǎn)單很多了,直接使用和加載user-agent一樣的方式即可。

headers = {
  			'Referer': '具體的Referer',
        'User-Agent': '具體的user-agent',
  			'Cookie': 'cookie'
    }
requests.get(url,headers=headers)

對(duì)于反爬的一些基礎(chǔ)操作就介紹完了更多關(guān)于Python爬蟲(chóng)和反爬技術(shù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • 關(guān)于python爬蟲(chóng)應(yīng)用urllib庫(kù)作用分析
  • python爬蟲(chóng)Scrapy框架:媒體管道原理學(xué)習(xí)分析
  • python爬蟲(chóng)Mitmproxy安裝使用學(xué)習(xí)筆記
  • python爬蟲(chóng)之Appium爬取手機(jī)App數(shù)據(jù)及模擬用戶(hù)手勢(shì)
  • 爬蟲(chóng)Python驗(yàn)證碼識(shí)別入門(mén)
  • Python爬蟲(chóng)技術(shù)
  • Python爬蟲(chóng)爬取商品失敗處理方法
  • Python獲取江蘇疫情實(shí)時(shí)數(shù)據(jù)及爬蟲(chóng)分析
  • Python爬蟲(chóng)之Scrapy環(huán)境搭建案例教程
  • Python爬蟲(chóng)中urllib3與urllib的區(qū)別是什么
  • 教你如何利用python3爬蟲(chóng)爬取漫畫(huà)島-非人哉漫畫(huà)
  • Python爬蟲(chóng)分析匯總

標(biāo)簽:呼倫貝爾 三亞 葫蘆島 安慶 呼倫貝爾 銀川 烏魯木齊 湘西

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬蟲(chóng)和反爬技術(shù)過(guò)程詳解》,本文關(guān)鍵詞  Python,爬蟲(chóng),和,反爬,技術(shù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬蟲(chóng)和反爬技術(shù)過(guò)程詳解》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于Python爬蟲(chóng)和反爬技術(shù)過(guò)程詳解的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    国产精品66部| 色婷婷综合五月| 亚洲女人小视频在线观看| 日韩女优毛片在线| 一本一本大道香蕉久在线精品| 免费精品视频最新在线| 亚洲精品中文字幕在线观看| 精品国产亚洲在线| 欧美日本一区二区三区| av在线一区二区三区| 麻豆成人免费电影| 亚洲v日本v欧美v久久精品| 中文字幕在线免费不卡| 久久伊99综合婷婷久久伊| 欧美日韩激情一区二区三区| jizz一区二区| 精品写真视频在线观看| 青青草97国产精品免费观看 | 欧美一区二区精品在线| 91在线视频网址| 丰满岳乱妇一区二区三区| 极品少妇xxxx精品少妇| 男女视频一区二区| 日本免费新一区视频| 亚洲电影一区二区三区| 亚洲视频一区二区在线| 综合激情成人伊人| 国产精品久久久久久久久晋中| 精品国产乱码久久久久久免费| 欧美剧情电影在线观看完整版免费励志电影 | 欧美日韩高清一区| 欧美伊人久久久久久久久影院 | 欧美电视剧免费全集观看| 欧美日韩免费一区二区三区| 色婷婷av一区二区三区gif| 97久久超碰精品国产| 99久久久久久99| 9色porny自拍视频一区二区| 成人午夜精品一区二区三区| 国产传媒一区在线| 国产99久久久国产精品潘金网站| 国产一区二区三区精品视频| 精品一区二区在线看| 国产精一品亚洲二区在线视频| 极品少妇一区二区| 国产电影一区二区三区| 高清久久久久久| 色综合久久88色综合天天6 | 国产在线播精品第三| 国产一区二区在线观看视频| 国产麻豆日韩欧美久久| 成年人午夜久久久| 日本高清不卡在线观看| 欧美日韩在线精品一区二区三区激情 | aa级大片欧美| 色美美综合视频| 欧美人牲a欧美精品| 精品剧情在线观看| 国产亚洲精品超碰| 亚洲欧美日韩国产综合| 亚洲国产乱码最新视频| 免费不卡在线视频| 成人中文字幕电影| 色婷婷久久综合| 日韩一区二区三区视频在线| 欧美mv和日韩mv的网站| 国产精品乱码妇女bbbb| 亚洲国产美国国产综合一区二区| 免费观看日韩av| 成人av中文字幕| 欧美日韩精品一区二区天天拍小说 | 欧美日韩国产小视频| 日韩精品中午字幕| 国产精品黄色在线观看| 亚洲一区二区免费视频| 久久精品国产精品亚洲红杏 | 美女诱惑一区二区| 不卡免费追剧大全电视剧网站| 91蜜桃视频在线| 91精品国产一区二区三区蜜臀| 国产精品婷婷午夜在线观看| 亚洲国产一二三| 懂色av中文一区二区三区| 欧美猛男男办公室激情| 久久久久久免费毛片精品| 一区二区三区四区高清精品免费观看| 日韩成人精品在线| 99久久精品国产网站| 日韩欧美电影在线| 一区二区高清视频在线观看| 精品无码三级在线观看视频| 91色综合久久久久婷婷| 精品国产乱码久久| 亚洲午夜免费视频| 成人免费黄色在线| 日韩欧美亚洲一区二区| 亚洲品质自拍视频| 国产传媒日韩欧美成人| 欧美一区二区三区四区视频| 国产精品国产馆在线真实露脸| 亚洲成人精品在线观看| av日韩在线网站| 久久久国产精华| 免费看黄色91| 欧美日韩免费观看一区二区三区 | 亚洲日本乱码在线观看| 麻豆精品国产91久久久久久| 在线视频欧美区| 欧美极品aⅴ影院| 国产美女久久久久| 日韩一级片网址| 午夜精品福利一区二区三区av| a级精品国产片在线观看| 久久婷婷色综合| 蜜桃av一区二区| 欧美一区二区三区喷汁尤物| 一区二区三区欧美激情| 91在线观看美女| 国产精品久久久久一区| 高清在线不卡av| 日韩一区二区不卡| 五月婷婷久久综合| 91福利资源站| 亚洲卡通动漫在线| 91免费视频网址| 亚洲视频一区二区在线| 99精品国产99久久久久久白柏| 亚洲国产高清不卡| 高清免费成人av| 国产精品天美传媒| 风间由美中文字幕在线看视频国产欧美| 欧美va在线播放| 久久爱www久久做| 欧美va亚洲va国产综合| 精品一区二区三区免费| 欧美大片日本大片免费观看| 青青草原综合久久大伊人精品 | 国产精品888| 国产日韩欧美激情| 成人精品免费网站| 日韩一区在线看| 91蜜桃传媒精品久久久一区二区| 国产精品福利一区| 色香色香欲天天天影视综合网| 亚洲激情综合网| 欧美精品粉嫩高潮一区二区| 天堂资源在线中文精品| 91精品一区二区三区在线观看| 日韩国产精品久久久| 精品久久五月天| 粉嫩aⅴ一区二区三区四区五区 | 欧美国产国产综合| 91一区二区在线观看| 一区二区三区欧美亚洲| 欧美高清视频不卡网| 免费成人在线网站| 国产日韩欧美精品电影三级在线| k8久久久一区二区三区| 亚洲国产裸拍裸体视频在线观看乱了| 欧美精品在线一区二区| 久久99精品一区二区三区| 中文字幕av在线一区二区三区| 色一区在线观看| 麻豆91精品91久久久的内涵| 日本一区二区在线不卡| 欧美影院精品一区| 老司机精品视频导航| 中文字幕国产一区二区| 在线看日韩精品电影| 日本欧美久久久久免费播放网| 久久青草国产手机看片福利盒子| a美女胸又www黄视频久久| 亚洲va国产天堂va久久en| 精品福利视频一区二区三区| 色综合天天综合网天天狠天天| 亚洲成人综合网站| 久久免费的精品国产v∧| 色综合视频在线观看| 成人午夜碰碰视频| 懂色av一区二区三区免费看| 国产精品99久久久久久久女警| 国产精品亚洲综合一区在线观看| 久久精品国产亚洲a| 国产成人一级电影| 欧美日韩亚洲综合| 亚洲一区二区三区四区在线观看| 日韩一区二区不卡| 成人激情小说乱人伦| 夜夜爽夜夜爽精品视频| 成人妖精视频yjsp地址| 精品日韩一区二区三区| 久久国产福利国产秒拍| 成人v精品蜜桃久久一区| 国产视频911| 视频一区二区三区在线| 久久一区二区视频| 欧美日韩国产精选| 日一区二区三区| 7777精品伊人久久久大香线蕉超级流畅 | 99精品国产视频|