校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > python爬蟲系列網絡請求案例詳解

python爬蟲系列網絡請求案例詳解

熱門標簽:電話外呼系統招商代理 蘇州人工外呼系統軟件 電話機器人貸款詐騙 京華圖書館地圖標注 看懂地圖標注方法 淮安呼叫中心外呼系統如何 佛山通用400電話申請 廣東旅游地圖標注 打印谷歌地圖標注

學習了之前的基礎和爬蟲基礎之后,我們要開始學習網絡請求了。

先來看看urllib

urllib的介紹

urllib是Python自帶的標準庫中用于網絡請求的庫,無需安裝,直接引用即可。
主要用來做爬蟲開發,API數據獲取和測試中使用。

urllib庫的四大模塊:

  • urllib.request: 用于打開和讀取url
  • urllib.error : 包含提出的例外,urllib.request
  • urllib.parse:用于解析url
  • urllib.robotparser:用于解析robots.txt

案例

# 作者:互聯網老辛
# 開發時間:2021/4/5/0005 8:23
import urllib.parse
kw={'wd':"互聯網老辛"}
result=urllib.parse.urlencode(kw)
print(result)
#解碼
res=urllib.parse.unquote(result)
print(res)

瀏覽器中會把互聯網老辛,改成非中文的形式

我在瀏覽器中搜互聯網老辛,然后把瀏覽中的復制下來:

https://www.baidu.com/s?ie=utf-8f=8rsv_bp=1rsv_idx=1tn=baiduwd=%E4%BA%92%E8%81%94%E7%BD%91%E8%80%81%E8%BE%9Bfenlei=256oq=%25E7%25BE%258E%25E5%259B%25A2rsv_pq=aa5b8079001eec3ersv_t=9ed1VMqcHzdaH7l2O1E8kMBcAS8OfSAGWHaXNgUYsfoVtGNbNVzHRatL1TUrqlang=cnrsv_enter=1rsv_dl=tbrsv_btype=tinputT=3542rsv_sug2=0rsv_sug4=3542

仔細看下,加粗的部分是不是就是我們在代碼中輸出的wd的結果

發送請求

  •  urllib.request 庫

模擬瀏覽器發起一個http請求,并獲取請求的響應結果

  • urllib.request.urlopen 的語法格式:

urlopen(url,data=None,[timeout]*,cafile=None,capath=None,cadefault=False,context=None

參數說明:

url: str類型的地址,也就是要訪問的URL,例如https://www/baidu.com
data: 默認值為None
urlopen: 函數返回的是一個http.client.HTTPResponse對象

代碼案例

get請求

# 作者:互聯網老辛
# 開發時間:2021/4/5/0005 8:23
import urllib.request
url="http://www.geekyunwei.com/"
resp=urllib.request.urlopen(url)
html=resp.read().decode('utf-8')  #將bytes轉成utf-8類型
print(html)

為什么要改成utf-8而不是gbk, 這里要看網頁的檢查網頁源代碼里是什么:

發送請求-Request請求

我們去爬取豆瓣

# 作者:互聯網老辛
# 開發時間:2021/4/5/0005 8:23
import urllib.request

url="https://movie.douban.com/"

resp=urllib.request.urlopen(url)
print(resp)

豆瓣有反爬蟲策略,會直接報418錯誤


對于這種我們需要偽裝請求頭:

我們找到網頁中的user-Agent:

User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400
# 作者:互聯網老辛
# 開發時間:2021/4/5/0005 8:23
import urllib.request

url="https://movie.douban.com/"
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}

#構建請求對象
req=urllib.request.Request(url,headers=headers)
#使用urlopen打開請求
resp=urllib.request.urlopen(req)
#從響應結果中讀取數據
html=resp.read().decode('utf-8')
print(html)

這樣我們就用Python成功的偽裝成瀏覽器獲取到了數據

IP代理

opener的使用,構建自己的opener發送請求

# 作者:互聯網老辛
# 開發時間:2021/4/5/0005 8:23
import urllib.request
url="https://www.baidu.com/"
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}
#構建請求對象

req=urllib.request.Request(url,headers=headers)

opener=urllib.request.build_opener()
resp=opener.open(req)
print(resp.read().decode())

如果你不停的發送請求,他有可能給你禁止IP, 所以我們每隔一段時間就換一個IP代理。

IP代理分類:

  • 透明代理: 目標網站知道你使用了代理并且知道你的源IP地址,這種代理肯定不符合我們的初衷
  • 匿名代理: 網站知道你使用了代理,但不知道你的源ip
  • 高匿代理: 這是最保險的方式,目錄網站不知道你使用了代理

ip代理的方式:

免費的: https://www.xicidaili.com/nn/

收費的: 大象代理,快代理,芝麻代理

# 作者:互聯網老辛
# 開發時間:2021/4/5/0005 8:23
from urllib.request import build_opener
from urllib.request import ProxyHandler
proxy=ProxyHandler({'https':'222.184.90.241:4278'})

opener=build_opener(proxy)

url='https://www.baidu.com/'
resp=opener.open(url)
print(resp.read().decode('utf-8'))

百度其實能夠做到反爬,即使是高匿代理也做不到百分百的繞過。

使用cookie

為什么使用cookie?

使用cookie主要是為了解決http的無狀態性。

使用步驟:

  • 實例化MozillaCookiejar(保存cookie)
  • 創建handler對象(cookie的處理器)
  • 創建opener對象
  • 打開網頁(發送請求獲取響應)
  • 保存cookie文件

案例: 獲取百度貼的cookie存儲下來

import urllib.request
from http import cookiejar
filename='cookie.txt'
def get_cookie():
    cookie=cookiejar.MozillaCookieJar(filename)
    #創建handler對象

    handler=urllib.request.HTTPCookieProcessor(cookie)
    opener=urllib.request.build_opener((handler))
    #請求網址
    url='https://tieba.baidu.com/f?kw=python3fr=index'

    resp=opener.open(url)
    # 保存cookie
    cookie.save()
#讀取數據
def use_cookie():
    #實例化MozillaCookieJar
    cookie=cookiejar.MozillaCookieJar()
    #加載cookie文件
    cookie.load(filename)
    print(cookie)
if __name__=='__main--':
    use_cookie()
    #get_cookie()

異常處理

我們爬取一個訪問不了的網站來捕獲異常

# 作者:互聯網老辛
# 開發時間:2021/4/6/0006 7:38

import urllib.request
import urllib.error
url='https://www.google.com'
try:
    resp=urllib.request.urlopen(url)
except urllib.error.URLError as e:
    print(e.reason)

可以看到捕獲到了異常

網絡請求我們已經學完了,后面我們將學習幾個常用的庫,之后就可以進行數據的爬取了。

到此這篇關于python爬蟲系列網絡請求案例詳解的文章就介紹到這了,更多相關python爬蟲網絡請求內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python爬蟲請求庫httpx和parsel解析庫的使用測評
  • 詳解python requests中的post請求的參數問題
  • 快速一鍵生成Python爬蟲請求頭
  • Python3+Django get/post請求實現教程詳解
  • python 實現Requests發送帶cookies的請求
  • python實現三種隨機請求頭方式
  • Python urllib request模塊發送請求實現過程解析
  • python 爬蟲請求模塊requests詳解
  • Python Http請求json解析庫用法解析
  • python 發送get請求接口詳解
  • python+excel接口自動化獲取token并作為請求參數進行傳參操作
  • Python使用grequests并發發送請求的示例
  • Python爬蟲基礎講解之請求

標簽:呼和浩特 衡水 畢節 股票 江蘇 駐馬店 湖州 中山

巨人網絡通訊聲明:本文標題《python爬蟲系列網絡請求案例詳解》,本文關鍵詞  python,爬蟲,系列,網絡,請求,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python爬蟲系列網絡請求案例詳解》相關的同類信息!
  • 本頁收集關于python爬蟲系列網絡請求案例詳解的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    精品国产一区二区三区久久久蜜月 | 韩国精品主播一区二区在线观看 | 综合久久久久久久| 色94色欧美sute亚洲13| 精品一区二区三区蜜桃| 亚洲人快播电影网| 99久久er热在这里只有精品66| 8x福利精品第一导航| 一区二区在线观看av| 一本高清dvd不卡在线观看| 亚洲成av人综合在线观看| 欧美一区二区三区男人的天堂| 韩国视频一区二区| 亚洲视频一区二区在线观看| 56国语精品自产拍在线观看| 另类中文字幕网| 亚洲欧美一区二区三区国产精品| 色婷婷综合久久久| 极品少妇xxxx偷拍精品少妇| 国产精品嫩草99a| 色综合色狠狠天天综合色| 丝袜亚洲另类丝袜在线| 欧美大片一区二区| 欧美在线观看一二区| 日本欧美肥老太交大片| 久久亚洲捆绑美女| 在线看一区二区| 国产成人午夜99999| 亚洲图片有声小说| 欧美精品一区二区三区四区| 欧美日韩极品在线观看一区| 国产成人8x视频一区二区| 婷婷一区二区三区| 玉米视频成人免费看| 欧美激情在线观看视频免费| 亚洲精品一区二区在线观看| 在线播放/欧美激情| 欧美性感一区二区三区| 日韩亚洲欧美在线| 高清国产一区二区三区| 国产视频一区二区在线| 99精品久久久久久| 国产精品乱码久久久久久| 粉嫩av一区二区三区粉嫩| 亚洲伦在线观看| 日韩一二三区视频| 在线观看不卡一区| 91麻豆国产自产在线观看| 成人三级在线视频| 99久久精品国产网站| 成人久久视频在线观看| 成人永久免费视频| eeuss影院一区二区三区| eeuss鲁片一区二区三区在线观看 eeuss鲁片一区二区三区在线看 | 日韩影院在线观看| 日韩国产欧美一区二区三区| 日韩激情视频在线观看| 日本女人一区二区三区| 蜜臀久久99精品久久久久久9| 老司机一区二区| 成人性生交大合| 日本精品视频一区二区| 欧美酷刑日本凌虐凌虐| 精品国产一区二区三区久久久蜜月 | 4438x亚洲最大成人网| 日韩视频免费观看高清完整版 | 色av综合在线| 国产一区二区剧情av在线| 欧美韩国日本一区| 有坂深雪av一区二区精品| 丝袜亚洲另类欧美综合| 国产精品影视网| 欧美色精品天天在线观看视频| 欧美乱妇15p| 亚洲欧美日韩国产成人精品影院| 日韩精品一级二级| 色综合天天做天天爱| 日韩一级高清毛片| 亚洲精品视频在线看| 美国十次了思思久久精品导航| 国产精品亚洲专一区二区三区| 欧美日精品一区视频| 中文字幕一区二区在线播放| 首页国产丝袜综合| 欧美主播一区二区三区| 国产欧美日韩一区二区三区在线观看| 日本一区中文字幕| 欧美三级在线看| 综合色中文字幕| 国产a区久久久| 中文字幕乱码日本亚洲一区二区| 日韩va亚洲va欧美va久久| 99久久国产免费看| 7777精品久久久大香线蕉 | 国产精品白丝av| 91免费精品国自产拍在线不卡| 一二三四区精品视频| 精品国产91久久久久久久妲己 | 欧美日韩亚洲高清一区二区| 激情五月激情综合网| 一区二区三区国产精品| 日韩一卡二卡三卡四卡| 99riav久久精品riav| 日本va欧美va欧美va精品| 亚洲欧美怡红院| 精品国产一区二区三区忘忧草| 97精品久久久久中文字幕| 国产盗摄一区二区| 七七婷婷婷婷精品国产| 亚洲精品免费在线观看| 国产日韩欧美麻豆| 欧美不卡视频一区| 91麻豆精品国产91久久久久| 一本大道久久a久久综合婷婷| 国产精品综合一区二区三区| 亚洲一区二区三区小说| 亚洲欧美日韩电影| 中文字幕亚洲视频| 最新热久久免费视频| 中文字幕av在线一区二区三区| 欧美r级在线观看| 欧美日韩精品专区| 91视频一区二区| 国产999精品久久久久久绿帽| 蜜桃久久精品一区二区| 一区二区三区在线播| 国产精品久久久久久久裸模| 国产婷婷色一区二区三区在线| 日韩午夜三级在线| 欧美精品vⅰdeose4hd| 成人午夜大片免费观看| 国产美女在线观看一区| 日本美女一区二区三区视频| 一区二区三区在线高清| **欧美大码日韩| 一区二区激情小说| 亚洲va韩国va欧美va精品| 日韩av一二三| 黑人巨大精品欧美黑白配亚洲 | 免费国产亚洲视频| 狠狠狠色丁香婷婷综合激情| 99久久久国产精品| 欧美日韩精品三区| 精品免费日韩av| 欧美国产精品劲爆| 亚洲女与黑人做爰| 亚洲第一狼人社区| 久国产精品韩国三级视频| 国产精品456| 色婷婷综合久久| 欧美精品一二三| 久久久国产午夜精品| 亚洲精品乱码久久久久久黑人| 亚洲午夜激情av| 国内一区二区在线| 91片在线免费观看| 久久久久久久综合色一本| 亚洲一区影音先锋| 大胆欧美人体老妇| 久久久亚洲精华液精华液精华液| 亚洲国产美国国产综合一区二区| 成人a区在线观看| 欧美激情一区二区三区全黄 | 欧美韩日一区二区三区四区| 亚洲国产精品久久久久秋霞影院 | 一区二区三区在线免费视频| 亚洲色图欧洲色图| 亚洲一线二线三线久久久| 亚洲天堂av老司机| 粉嫩高潮美女一区二区三区| 久久影音资源网| 亚洲成年人网站在线观看| 国产精品99久久久久久似苏梦涵 | 日韩精品一区二区三区swag| 一区二区在线观看视频| 色婷婷综合久久| 一区二区在线电影| 欧美久久久影院| 免费观看91视频大全| 欧美大黄免费观看| 日韩免费观看高清完整版 | 国产精品欧美久久久久无广告| 一区二区高清视频在线观看| 国产福利精品一区二区| 久久久高清一区二区三区| 久久精品99国产精品| 丁香婷婷综合激情五月色| 91香蕉视频mp4| 91超碰这里只有精品国产| 91精品国产综合久久福利| 精品国产一区a| 亚洲精品欧美二区三区中文字幕| 亚洲一区自拍偷拍| 美女视频黄 久久| 91网站在线观看视频| 欧美一区二区三区公司| 国产精品国产三级国产专播品爱网| 国产精品久久久久一区二区三区共| 亚洲久草在线视频| 国产一区二区不卡在线|