校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > python爬蟲智能翻頁批量下載文件的實例詳解

python爬蟲智能翻頁批量下載文件的實例詳解

熱門標簽:滴滴地圖標注公司 江門智能電話機器人 如何申請400電話代理 杭州房產地圖標注 智能電話機器人調研 天津塘沽區地圖標注 地圖標注可以遠程操作嗎 甘肅高頻外呼系統 400電話在線如何申請

python爬蟲遇到爬取文件內容時,需要一頁頁的翻頁爬取,這樣很是麻煩,其實可以獲取每個列表信息下的文件名和文件鏈接,讓文件名和文件鏈接處理為列表,保存后下載,實現智能翻頁批量下載文件,本文以以京客隆為例,批量下載文件,如財務資料,他的每一份報告都是一份pdf格式的文檔。以此頁面為目標,下載他每個分類的文件python爬蟲實戰之智能翻頁批量下載文件。

1、引入庫

import requests
import pandas as pd
from lxml import etree
import re
import os

2、解析初始頁面

baseUrl ='http://www.jkl.com.cn/cn/invest.aspx' # 爬取頁面的數據
heade ={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/81.0.4044.92 Safari/537.36'
}
res =requests.get(url=baseUrl,headers=heade).text  
# print(res.text)
html = etree.HTML(res)
res =requests.get(url=baseUrl,headers=heade).text  #  設置變量接受 基礎頁的響應數據
# print(res.text)
html = etree.HTML(res)

3、獲得投資關系的分類名稱和url地址

data_name = html.xpath('//div[@class="infoLis"]//a/text()') # 投資者列表的名字
data_link = html.xpath('//div[@class="infoLis"]//@href')  # 全部列表的鏈接
name = [data_name.strip() for data_name in data_name]  # 通過for循環去掉空字符
link = ['http://www.jkl.com.cn/cn/'+ data_link for data_link in data_link] # 拼接字符串
# 合并為字典,方便保存文件
file = dict(zip(name,link))

4、每個列表信息,保存一個文件夾

for name,link in file.items():
  name=name.replace('/','.')
  name=name.replace('...','報表')
  # 上面的把文件名帶特許字符的 強制轉換為我們想要的文本類型
  path = 'E:/'+ name
  if not os.path.exists(path):
    os.mkdir(path)
    #建立儲存位置

5、對列表的每個項目鏈接進行解析,拿到尾頁

  res_list = requests.get(url = link, headers = heade).text
  list_html = etree.HTML(res_list)
  # print(html_erJi) 解析每個分類的鏈接
  weiYe = list_html.xpath('//a[text()="尾頁"]/@href')
  # print(html_weiye)
  # 拿到尾頁信息
  if weiYe !=[]:
    # 正則提取尾頁信息
    get_weiYe =re.search("(\d+)'\)",html_weiye[0])
    get_yeMa = get_html_weiYe.group(1)
  else:
    get_yeMa=1
  # print(get_html_yeMa) 看看是不是提取成功

6、獲取每個列表信息下的文件名和文件鏈接

  for get_yeMa in range(1,int(get_yeMa)+1): # 翻頁
    yaMa= {
    '__EVENTTARGET': 'AspNetPager1',
    '__EVENTARGUMENT': get_yeMa
    }
    get_lei_html = requests.get(url = link, headers = heade, params = yaMa).text
    res3 =etree.HTML(get_lei_html)
    # print(res3)
    pdf_name = res3.xpath('//div[@class="newsLis"]//li/a/text()')
    # print(pdf_name)
    pdf_url = res3.xpath('//div[@class="newsLis"]//li//@href')

7、讓文件名和文件鏈接處理為列表,保存后下載

 pdf_names = [pdf_name.strip() for pdf_name in pdf_name]
 # print(pdf_names)
 if all(pdf_url):
      pdf_urls = ['http://www.jkl.com.cn'+pdf_url for pdf_url in pdf_url]
      # print(pdf_url)
      pdf_data=dict(zip(pdf_names,pdf_urls))  # pdf地址和名字整合為字典
      for pdfName,pdfUrl in pdf_data.items():
        pdfName =pdfName.replace('/','.')
        res_pdf= requests.get(url =pdfUrl,headers=heade).content
        houZui = pdfUrl.split('.')[-1]
        pdf_pash = path + '/' + pdfName + '.'+ houZui  # 
        # print(pdf_pash)
        with open(pdf_pash,'wb') as f:
          f.write(res_pdf)
          print(pdfName,'下載成功')

到此這篇關于python爬蟲智能翻頁批量下載文件的實例詳解的文章就介紹到這了,更多相關python爬蟲實戰之智能翻頁批量下載文件內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python 批量下載陰陽師網站壁紙
  • Python爬蟲之批量下載喜馬拉雅音頻
  • 用python批量下載apk
  • 用python爬蟲批量下載pdf的實現
  • python 批量下載bilibili視頻的gui程序
  • Python爬蟲實戰之批量下載快手平臺視頻數據

標簽:漢中 廊坊 德宏 河池 長春 東莞 臨汾 重慶

巨人網絡通訊聲明:本文標題《python爬蟲智能翻頁批量下載文件的實例詳解》,本文關鍵詞  python,爬蟲,智能,翻頁,批量,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《python爬蟲智能翻頁批量下載文件的實例詳解》相關的同類信息!
  • 本頁收集關于python爬蟲智能翻頁批量下載文件的實例詳解的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    成人h精品动漫一区二区三区| 午夜久久久久久久久| 欧美日韩www| 91久久久免费一区二区| 99国产一区二区三精品乱码| av电影在线观看一区| 99天天综合性| 97成人超碰视| 欧美综合亚洲图片综合区| 色视频成人在线观看免| 日本韩国一区二区三区视频| 色悠久久久久综合欧美99| 色综合久久88色综合天天6| 欧美体内she精视频| 日韩欧美精品在线视频| 精品国产乱码久久久久久浪潮| 26uuu精品一区二区在线观看| 精品女同一区二区| 国产亚洲污的网站| 亚洲精品你懂的| 五月天精品一区二区三区| 免费观看在线综合| 激情综合色播五月| 国产精品亚洲视频| 色久综合一二码| 91精品国产综合久久精品图片| 精品久久久久一区二区国产| 中文字幕成人在线观看| 亚洲成av人片在线观看无码| 久久国产麻豆精品| kk眼镜猥琐国模调教系列一区二区 | a美女胸又www黄视频久久| 日本道在线观看一区二区| 欧美丰满少妇xxxbbb| 欧美哺乳videos| 中文字幕永久在线不卡| 日本在线不卡视频一二三区| 国产一区二区美女| 在线中文字幕一区二区| 精品国产一区a| 亚洲综合一二三区| 国内精品视频666| 欧美日韩在线免费视频| 久久久久久久久久久久电影| 一区二区三区中文字幕| 韩国精品久久久| 在线观看网站黄不卡| 久久亚洲精华国产精华液| 一区二区三区免费在线观看| 国产成人在线视频免费播放| 欧美日产在线观看| 中文字幕一区二区在线观看| 六月丁香综合在线视频| 91啪亚洲精品| 国产亚洲欧美一区在线观看| 日韩国产欧美三级| 成人一区二区三区中文字幕| 717成人午夜免费福利电影| 国产精品久久久久影院老司 | 日韩欧美国产三级| 亚洲综合一区二区精品导航| 成人午夜电影小说| 337p日本欧洲亚洲大胆精品| 亚洲a一区二区| 北岛玲一区二区三区四区| www国产精品av| 美国av一区二区| 欧美日韩三级在线| 一区二区三区四区在线免费观看 | 99久久精品久久久久久清纯| 精品1区2区在线观看| 午夜精品一区二区三区三上悠亚| 91麻豆国产在线观看| 国产精品久久久久aaaa樱花 | 欧美国产一区二区在线观看| 国产乱淫av一区二区三区| 精品日韩在线观看| 精品一区二区日韩| 精品剧情v国产在线观看在线| 免费xxxx性欧美18vr| 日韩视频免费观看高清完整版| 午夜影视日本亚洲欧洲精品| 欧美日韩精品一区二区三区蜜桃| 亚洲曰韩产成在线| 欧美亚洲禁片免费| 亚洲va国产va欧美va观看| 欧美精选在线播放| 三级久久三级久久| 欧美美女黄视频| 青草av.久久免费一区| 日韩女优av电影在线观看| 精品伊人久久久久7777人| 国产亚洲美州欧州综合国| 高清在线不卡av| 国产色婷婷亚洲99精品小说| 国产福利一区在线| 国产精品短视频| 精品视频免费在线| 奇米888四色在线精品| 26uuu国产在线精品一区二区| 国产成人免费9x9x人网站视频| 亚洲国产成人私人影院tom| 日本道色综合久久| 日日摸夜夜添夜夜添亚洲女人| 欧美精品一区二区三区在线播放 | 亚洲天堂精品视频| 色88888久久久久久影院野外| 中文字幕五月欧美| 91精品欧美一区二区三区综合在| 日本aⅴ免费视频一区二区三区 | 中文一区二区完整视频在线观看 | 91同城在线观看| 五月婷婷另类国产| 久久久精品影视| 欧美亚日韩国产aⅴ精品中极品| 蜜桃一区二区三区在线观看| 国产精品久久综合| 日韩视频一区二区三区在线播放| 成人性生交大片免费看在线播放| 亚洲欧美日韩在线播放| 欧美大片在线观看一区二区| 91麻豆国产福利精品| 久久国产精品72免费观看| 亚洲欧美日韩中文字幕一区二区三区 | 久久av老司机精品网站导航| 国产精品乱人伦| 日韩欧美色综合网站| 91日韩精品一区| 粉嫩av一区二区三区粉嫩| 日韩精品色哟哟| 国产精品午夜在线| 欧美videofree性高清杂交| 91碰在线视频| 成人一区二区视频| 国产精品影视在线观看| 三级不卡在线观看| 亚洲一区二区综合| 中文字幕在线观看一区| 久久综合九色综合欧美98 | 日本不卡的三区四区五区| 国产精品国产精品国产专区不蜜 | 国产精品乱码一区二区三区软件 | 日韩国产在线一| 国产精品福利在线播放| 久久综合一区二区| 日韩一级视频免费观看在线| 欧美午夜电影一区| 91成人免费在线| 91美女在线看| 91小视频在线| 91亚洲永久精品| 91亚洲午夜精品久久久久久| av男人天堂一区| 91一区二区在线| 97精品久久久久中文字幕| 成人av电影免费观看| 成人h动漫精品一区二区| 成人av免费在线观看| 91在线观看一区二区| 99riav久久精品riav| 91女厕偷拍女厕偷拍高清| 色综合天天综合色综合av| 色欲综合视频天天天| 欧美自拍偷拍午夜视频| 欧美日韩卡一卡二| 欧美精品tushy高清| 欧美成人三级电影在线| 国产色一区二区| 最新中文字幕一区二区三区| 亚洲图片你懂的| 亚洲一级二级在线| 奇米影视在线99精品| 国产自产v一区二区三区c| 成人免费三级在线| 色吧成人激情小说| 欧美一区二区三区不卡| 久久这里只有精品首页| 国产精品久久久久影院亚瑟| 伊人色综合久久天天| 免费黄网站欧美| 成人a免费在线看| 欧美无人高清视频在线观看| 日韩美女一区二区三区四区| 久久精品人人做人人综合| 亚洲天堂网中文字| 首页亚洲欧美制服丝腿| 国产精品白丝jk黑袜喷水| 91福利视频网站| 精品国产一区二区亚洲人成毛片| 欧美国产欧美综合| 偷拍一区二区三区四区| 国内精品国产成人| 色婷婷av一区二区三区gif | 精品国产凹凸成av人导航| 国产精品成人免费在线| 日韩和欧美的一区| 91一区二区三区在线观看| 精品日产卡一卡二卡麻豆| 伊人色综合久久天天人手人婷| 免费视频最近日韩|