校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > python爬蟲智能翻頁批量下載文件的實例詳解

python爬蟲智能翻頁批量下載文件的實例詳解

熱門標簽:滴滴地圖標注公司 江門智能電話機器人 如何申請400電話代理 杭州房產地圖標注 智能電話機器人調研 天津塘沽區地圖標注 地圖標注可以遠程操作嗎 甘肅高頻外呼系統 400電話在線如何申請

python爬蟲遇到爬取文件內容時,需要一頁頁的翻頁爬取,這樣很是麻煩,其實可以獲取每個列表信息下的文件名和文件鏈接,讓文件名和文件鏈接處理為列表,保存后下載,實現智能翻頁批量下載文件,本文以以京客隆為例,批量下載文件,如財務資料,他的每一份報告都是一份pdf格式的文檔。以此頁面為目標,下載他每個分類的文件python爬蟲實戰之智能翻頁批量下載文件。

1、引入庫

import requests
import pandas as pd
from lxml import etree
import re
import os

2、解析初始頁面

baseUrl ='http://www.jkl.com.cn/cn/invest.aspx' # 爬取頁面的數據
heade ={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/81.0.4044.92 Safari/537.36'
}
res =requests.get(url=baseUrl,headers=heade).text  
# print(res.text)
html = etree.HTML(res)
res =requests.get(url=baseUrl,headers=heade).text  #  設置變量接受 基礎頁的響應數據
# print(res.text)
html = etree.HTML(res)

3、獲得投資關系的分類名稱和url地址

data_name = html.xpath('//div[@class="infoLis"]//a/text()') # 投資者列表的名字
data_link = html.xpath('//div[@class="infoLis"]//@href')  # 全部列表的鏈接
name = [data_name.strip() for data_name in data_name]  # 通過for循環去掉空字符
link = ['http://www.jkl.com.cn/cn/'+ data_link for data_link in data_link] # 拼接字符串
# 合并為字典,方便保存文件
file = dict(zip(name,link))

4、每個列表信息,保存一個文件夾

for name,link in file.items():
  name=name.replace('/','.')
  name=name.replace('...','報表')
  # 上面的把文件名帶特許字符的 強制轉換為我們想要的文本類型
  path = 'E:/'+ name
  if not os.path.exists(path):
    os.mkdir(path)
    #建立儲存位置

5、對列表的每個項目鏈接進行解析,拿到尾頁

  res_list = requests.get(url = link, headers = heade).text
  list_html = etree.HTML(res_list)
  # print(html_erJi) 解析每個分類的鏈接
  weiYe = list_html.xpath('//a[text()="尾頁"]/@href')
  # print(html_weiye)
  # 拿到尾頁信息
  if weiYe !=[]:
    # 正則提取尾頁信息
    get_weiYe =re.search("(\d+)'\)",html_weiye[0])
    get_yeMa = get_html_weiYe.group(1)
  else:
    get_yeMa=1
  # print(get_html_yeMa) 看看是不是提取成功

6、獲取每個列表信息下的文件名和文件鏈接

  for get_yeMa in range(1,int(get_yeMa)+1): # 翻頁
    yaMa= {
    '__EVENTTARGET': 'AspNetPager1',
    '__EVENTARGUMENT': get_yeMa
    }
    get_lei_html = requests.get(url = link, headers = heade, params = yaMa).text
    res3 =etree.HTML(get_lei_html)
    # print(res3)
    pdf_name = res3.xpath('//div[@class="newsLis"]//li/a/text()')
    # print(pdf_name)
    pdf_url = res3.xpath('//div[@class="newsLis"]//li//@href')

7、讓文件名和文件鏈接處理為列表,保存后下載

 pdf_names = [pdf_name.strip() for pdf_name in pdf_name]
 # print(pdf_names)
 if all(pdf_url):
      pdf_urls = ['http://www.jkl.com.cn'+pdf_url for pdf_url in pdf_url]
      # print(pdf_url)
      pdf_data=dict(zip(pdf_names,pdf_urls))  # pdf地址和名字整合為字典
      for pdfName,pdfUrl in pdf_data.items():
        pdfName =pdfName.replace('/','.')
        res_pdf= requests.get(url =pdfUrl,headers=heade).content
        houZui = pdfUrl.split('.')[-1]
        pdf_pash = path + '/' + pdfName + '.'+ houZui  # 
        # print(pdf_pash)
        with open(pdf_pash,'wb') as f:
          f.write(res_pdf)
          print(pdfName,'下載成功')

到此這篇關于python爬蟲智能翻頁批量下載文件的實例詳解的文章就介紹到這了,更多相關python爬蟲實戰之智能翻頁批量下載文件內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python 批量下載陰陽師網站壁紙
  • Python爬蟲之批量下載喜馬拉雅音頻
  • 用python批量下載apk
  • 用python爬蟲批量下載pdf的實現
  • python 批量下載bilibili視頻的gui程序
  • Python爬蟲實戰之批量下載快手平臺視頻數據

標簽:漢中 廊坊 德宏 河池 長春 東莞 臨汾 重慶

巨人網絡通訊聲明:本文標題《python爬蟲智能翻頁批量下載文件的實例詳解》,本文關鍵詞  python,爬蟲,智能,翻頁,批量,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python爬蟲智能翻頁批量下載文件的實例詳解》相關的同類信息!
  • 本頁收集關于python爬蟲智能翻頁批量下載文件的實例詳解的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    蜜桃视频一区二区三区| 在线成人高清不卡| 有码一区二区三区| 欧美视频在线不卡| 国内精品久久久久影院薰衣草| 精品国产精品一区二区夜夜嗨| 日韩二区在线观看| 色哟哟亚洲精品| 欧美aⅴ一区二区三区视频| 久久精品亚洲精品国产欧美kt∨| 91麻豆蜜桃一区二区三区| 亚洲一区二区五区| 亚洲国产电影在线观看| 欧美日韩一区精品| 亚洲国产精品v| 成人精品在线视频观看| 国产一区二区三区电影在线观看| 午夜一区二区三区在线观看| 亚洲精品国产一区二区精华液| 成人欧美一区二区三区白人| 7777精品久久久大香线蕉| av网站一区二区三区| 国产一区二区精品久久91| 久久99国产精品久久99果冻传媒| 精品视频免费看| 欧美又粗又大又爽| 欧洲精品在线观看| 欧美裸体bbwbbwbbw| 欧美精选一区二区| 日韩精品中文字幕在线不卡尤物| 91精品国产91热久久久做人人| 一级中文字幕一区二区| 精品久久久久99| 久久久av毛片精品| ...中文天堂在线一区| 亚洲色图自拍偷拍美腿丝袜制服诱惑麻豆| 国产精品国产三级国产a| 亚洲视频精选在线| 日韩va欧美va亚洲va久久| 韩国女主播一区| 成人免费视频网站在线观看| 日本道精品一区二区三区| 亚洲欧美日韩国产手机在线| 国产成人av网站| 99国产精品国产精品久久| 欧美视频在线播放| 精品成人a区在线观看| 国产精品国产三级国产aⅴ入口 | 国产精品精品国产色婷婷| 日韩一区在线看| 视频一区二区三区中文字幕| 狠狠色丁香九九婷婷综合五月| 波多野结衣中文字幕一区二区三区 | 天涯成人国产亚洲精品一区av| 欧美大片一区二区三区| ...av二区三区久久精品| 视频一区免费在线观看| 色综合久久天天| 久久免费电影网| 国产美女一区二区三区| 国产乱国产乱300精品| 欧美美女视频在线观看| 亚洲综合小说图片| 91小视频在线免费看| 欧美国产日韩一二三区| 麻豆一区二区99久久久久| 欧美精品tushy高清| 一区二区三区日韩欧美精品| 91香蕉视频黄| 国产精品美女久久久久久久久久久| 久久99精品国产| 精品国产一区二区三区四区四 | 91福利在线看| 亚洲天堂av一区| 波多野结衣中文一区| 亚洲国产精品成人久久综合一区| 欧美日韩国产综合一区二区三区 | 中文字幕亚洲视频| 亚洲国产aⅴ成人精品无吗| 不卡视频一二三| 国产精品污网站| 91亚洲精华国产精华精华液| 日韩美女精品在线| 欧美怡红院视频| 蜜乳av一区二区| 国产精品色在线观看| 一本色道久久综合精品竹菊| 丝袜亚洲另类欧美综合| 国产精品一二三| 狠狠v欧美v日韩v亚洲ⅴ| 中文字幕国产一区二区| 国产九色sp调教91| 欧美韩国一区二区| 欧美亚洲动漫精品| 日本美女一区二区| 中文字幕一区二区三区色视频| 一本大道久久a久久综合| 奇米精品一区二区三区在线观看 | 不卡的av网站| 视频在线观看一区| 日韩精品专区在线影院重磅| 成人小视频免费在线观看| 亚洲一区二区三区精品在线| 精品盗摄一区二区三区| 日本韩国欧美在线| 亚洲欧美欧美一区二区三区| 欧美一区二区福利在线| 91丨porny丨国产| 日韩精品1区2区3区| 亚洲欧美电影院| 亚洲国产精品成人久久综合一区| 欧美人与禽zozo性伦| 成人一级黄色片| 国产综合久久久久影院| 精一区二区三区| 日韩二区在线观看| 奇米888四色在线精品| 亚洲精品视频观看| 国产精品午夜电影| 国产女人aaa级久久久级| 欧美电影免费观看完整版| 91精品久久久久久久久99蜜臂| 欧美优质美女网站| 欧美在线观看你懂的| 91国产免费看| 欧美日韩久久不卡| 天天影视色香欲综合网老头| 一区二区三区在线不卡| 日韩av电影免费观看高清完整版在线观看| 欧美一区二区三区在线电影| 欧美日韩高清一区二区不卡| 色老综合老女人久久久| 欧美偷拍一区二区| 制服丝袜一区二区三区| 日韩一区二区三区视频| 亚洲综合视频网| 亚洲免费在线观看视频| 亚洲永久免费av| 久久成人免费网| 成人午夜电影小说| 色狠狠一区二区| 日韩无一区二区| 国产精品美女久久久久久久网站| 亚洲男人天堂av网| 天堂精品中文字幕在线| 蜜臀av性久久久久蜜臀aⅴ | 色综合中文字幕| 日本成人在线电影网| 成人av午夜影院| 欧美一区二区在线观看| 国产视频一区在线观看| 亚洲一区二区综合| 国产成人av资源| 欧美一区二区啪啪| 亚洲人成网站色在线观看| 蜜臀av性久久久久蜜臀av麻豆| 欧美久久一二区| 亚洲女同ⅹxx女同tv| 欧美日韩国产精品自在自线| 国产欧美精品一区二区三区四区| 亚洲午夜免费福利视频| 高清在线不卡av| 欧美成人一区二区三区| 一区二区久久久久| 丁香六月综合激情| 久久久噜噜噜久久中文字幕色伊伊| 玉米视频成人免费看| aaa欧美日韩| 国产精品视频一二三区 | 日韩一区二区三区四区五区六区| 亚洲欧美一区二区三区极速播放 | 欧美一区二区三级| 性感美女久久精品| 在线观看国产91| 亚洲精品乱码久久久久久日本蜜臀| 国产成人啪午夜精品网站男同| 欧美精品一区二区三| 韩国av一区二区三区| 亚洲国产高清不卡| 成人午夜看片网址| 日本一区二区成人在线| 91在线视频官网| 亚洲一区二三区| 91精品国产综合久久久蜜臀粉嫩 | 国产.欧美.日韩| 亚洲欧美影音先锋| 日本福利一区二区| 亚洲成人av资源| 精品国产乱子伦一区| 日本91福利区| 久久亚洲一区二区三区明星换脸 | 成人91在线观看| 一区二区三区成人在线视频| 欧美精品一二三| 激情小说欧美图片| 亚洲人精品午夜| 日韩三级免费观看| 国产mv日韩mv欧美| 91福利在线观看| 亚洲欧美日韩一区二区|