校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > Python爬蟲之爬取某文庫文檔數據

Python爬蟲之爬取某文庫文檔數據

熱門標簽:房產電銷外呼系統 地圖標注微信發送位置不顯示 南京銷售外呼系統軟件 浙江電銷卡外呼系統好用嗎 蓋州市地圖標注 上海機器人外呼系統哪家好 315電話機器人廣告 地圖制圖標注位置改變是移位嗎 地圖標注的意義點

一、基本開發環境

Python 3.6

Pycharm

二、相關模塊的使用

import os
import requests
import time
import re
import json
from docx import Document
from docx.shared import Cm

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

三、目標網頁分析

網站的文檔內容,都是以圖片形式存在的。它有自己的數據接口

接口鏈接:

https://openapi.book118.com/getPreview.html?project_id=1aid=272112230t=f2c66902d6b63726d8e08b557fef90fbview_token=SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1page=1callback=jQuery18304186406662159248_1614492889385_=1614492889486

接口的請求參數

四、整體思路

  • 請求網頁返回response數據(字符串)
  • 通過re模塊匹配提取中間的數據(列表)索引取0(字符串)
  • 通過json模塊是把提取出來的數據轉換成json模塊
  • 通過遍歷獲取每張圖片的url地址
  • 保存圖片到本地文件夾
  • 把圖片保存到word文檔
  • 爬蟲代碼實現

五、爬蟲代碼實現

def download():
    content = 0
    for page in range(1, 96, 6):
        # 給定 2秒延時
        time.sleep(2)
        # 獲取時間戳
        now_time = int(time.time() * 1000)
        url = 'https://openapi.book118.com/getPreview.html'
        # 請求參數
        params = {
            'project_id': '1',
            'aid': '272112230',
            't': 'f2c66902d6b63726d8e08b557fef90fb',
            'view_token': 'SqX7ktrZ_ZakjDI@vcohcCwbn_PLb3C1',
            'page': f'{page}',
            '_': now_time,
        }
        # 請求頭
        headers = {
            'Host': 'openapi.book118.com',
            'Referer': 'https://max.book118.com/html/2020/0427/8026036013002110.shtm',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
        }
        response = requests.get(url=url, params=params, headers=headers)
        # 使用正則表達式提取內容
        result = re.findall('jsonpReturn\((.*?)\)', response.text)[0]
        # 字符串轉json數據
        json_data = json.loads(result)['data']
        # 字典值的遍歷
        for value in json_data.values():
            content += 1
            # 拼接圖片url
            img_url = 'http:' + value
            print(img_url)
            headers_1 = {
                'Host': 'view-cache.book118.com',
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
            }
            # 請求圖片url地址 獲取content二進制數據
            img_content = requests.get(url=img_url, headers=headers_1).content
            # 文件名
            img_name = str(content) + '.jpg'
            # 保存路徑
            filename = 'img\\'
            # 以二進制方式保存 (圖片、音頻、視頻等文件都是以二進制的方式保存)
            with open(filename + img_name, mode='wb') as f:
                f.write(img_content)

注意點:

1、一定要給延時,不然后面接口數據會請求不到。

2、請求圖片url的時候headers參數需要寫完整,否則保存圖片是無法打開的

3、命名最好是給定數字,1.jpg、2.jpg 這樣,方便后續保存到word

爬蟲部分的代碼還是比較簡單的,沒有什么特別的難度。

爬取這些文檔,都是需要打印或者查詢所以要把這些單張的圖片都保存到word文檔里面。

六、寫入文檔

def save_picture():
    document = Document()
    path = './img/'
    lis = os.listdir(path)
    c = []
    for li in lis:
        index = li.replace('.jpg', '')
        c.append(index)
    c_1 = sorted(list(map(int, c)))
    print(c_1)
    new_files = [(str(i) + '.jpg') for i in c_1]
    for num in new_files:
        img_path = path + num
        document.add_picture(img_path, width=Cm(17), height=Cm(24))
        document.save('tu.doc')  # 保存文檔
        os.remove(img_path)  # 刪除保存在本地的圖片

到此這篇關于Python爬蟲之爬取某文庫文檔數據的文章就介紹到這了,更多相關python爬取文檔數據內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬取股票信息,并可視化數據的示例
  • Python爬取數據并實現可視化代碼解析
  • python如何爬取網站數據并進行數據可視化
  • 高考要來啦!用Python爬取歷年高考數據并分析
  • 單身狗福利?Python爬取某婚戀網征婚數據
  • Python爬蟲之自動爬取某車之家各車銷售數據
  • Python爬蟲之爬取2020女團選秀數據
  • python爬蟲之教你如何爬取地理數據
  • Python爬蟲實戰之爬取京東商品數據并實實現數據可視化

標簽:雙鴨山 貴州 陽泉 克拉瑪依 赤峰 臨汾 日照 金華

巨人網絡通訊聲明:本文標題《Python爬蟲之爬取某文庫文檔數據》,本文關鍵詞  Python,爬蟲,之爬,取某,文庫,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲之爬取某文庫文檔數據》相關的同類信息!
  • 本頁收集關于Python爬蟲之爬取某文庫文檔數據的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    久久99久久99| 国产经典欧美精品| 亚洲美女免费视频| 成人免费在线视频| 国产女人aaa级久久久级| 国产亚洲一区二区三区| 精品国精品国产尤物美女| 日韩欧美在线观看一区二区三区| 欧美精品在线视频| 日韩欧美另类在线| 久久嫩草精品久久久精品一| 久久精品一区二区三区四区| 国产精品久99| 亚洲一级片在线观看| 日一区二区三区| 麻豆国产精品视频| 成人一区二区在线观看| 97久久精品人人做人人爽| 99亚偷拍自图区亚洲| 色哟哟日韩精品| 正在播放亚洲一区| 日韩午夜av一区| 久久久精品黄色| 亚洲欧美电影一区二区| 婷婷六月综合亚洲| 国产乱对白刺激视频不卡| 国产福利一区二区三区视频| av一区二区不卡| 欧美视频一区二| 国产网红主播福利一区二区| 亚洲精品国产一区二区精华液| 亚洲蜜臀av乱码久久精品| 午夜欧美视频在线观看| 国产精品综合一区二区| 91视频一区二区| 欧美一区二区三区在线观看| 国产三级三级三级精品8ⅰ区| 亚洲精品乱码久久久久久日本蜜臀| 日本一不卡视频| eeuss影院一区二区三区| 欧美顶级少妇做爰| 中文字幕一区二区5566日韩| 亚洲成人免费看| 丁香一区二区三区| 日韩一区二区免费在线观看| 日韩理论在线观看| 久久精品国产免费看久久精品| av电影天堂一区二区在线| 欧美大片免费久久精品三p| 一区二区三区在线不卡| 国产揄拍国内精品对白| 欧美日韩国产一级片| 中文字幕一区二区三区在线不卡| 青青国产91久久久久久| 在线观看国产一区二区| 国产精品毛片大码女人| 精品一区二区在线免费观看| 欧美猛男男办公室激情| 亚洲一区二区三区自拍| 国产成人一区在线| 26uuu色噜噜精品一区二区| 天天综合网 天天综合色| 欧洲视频一区二区| 亚洲精品va在线观看| 97久久精品人人澡人人爽| 久久久久久久久伊人| 精品夜夜嗨av一区二区三区| 911精品国产一区二区在线| 亚洲在线视频网站| 日本精品一级二级| 亚洲精品视频一区二区| 91麻豆国产在线观看| 亚洲精品免费在线观看| 91久久香蕉国产日韩欧美9色| 中文字幕亚洲区| 高清日韩电视剧大全免费| 国产片一区二区| 成人一区在线观看| 亚洲欧洲美洲综合色网| 99视频热这里只有精品免费| 国产精品久久久久久福利一牛影视 | 成人动漫视频在线| 久久久91精品国产一区二区三区| 国产美女一区二区三区| 国产欧美精品一区二区三区四区| 国产一区欧美一区| 国产精品久久久久精k8| 日本丰满少妇一区二区三区| 一区二区三区四区视频精品免费 | 午夜国产精品影院在线观看| 欧美日韩在线观看一区二区| 亚洲午夜私人影院| 日韩免费观看高清完整版| 日本强好片久久久久久aaa| 日韩精品一区二区三区中文不卡| 蜜臀av亚洲一区中文字幕| 精品国产91九色蝌蚪| 国产成人aaa| 一区二区三区**美女毛片| 日韩一级视频免费观看在线| 国产一区二区三区久久悠悠色av| 国产精品久久久久三级| 欧美色视频一区| 国产一区二区不卡| 一区二区三区四区视频精品免费 | 久久精品久久99精品久久| 国产亚洲一区字幕| 欧美性做爰猛烈叫床潮| 另类小说视频一区二区| 国产精品久久久久永久免费观看| 欧美影院精品一区| 国产精品18久久久久久久久| 亚洲卡通欧美制服中文| 欧美一级精品大片| 91视频精品在这里| 国产在线观看免费一区| 亚洲国产精品久久不卡毛片 | 亚洲一区二区三区视频在线播放| 日韩欧美一区在线观看| 一本色道亚洲精品aⅴ| 极品瑜伽女神91| 一二三四社区欧美黄| 欧美经典三级视频一区二区三区| 69av一区二区三区| 91麻豆swag| 国产精品资源在线看| 日本aⅴ亚洲精品中文乱码| 亚洲免费av在线| 国产精品久久久久久久久免费樱桃| 91精品国产综合久久国产大片| av网站一区二区三区| 国产一区啦啦啦在线观看| 亚洲国产精品一区二区www在线| 国产欧美va欧美不卡在线| 日韩三级视频中文字幕| 欧美日韩国产片| 欧美色图一区二区三区| 99久久精品免费看国产免费软件| 国产一区二区三区免费播放| 蜜臂av日日欢夜夜爽一区| 亚洲一区二区三区在线播放| 亚洲青青青在线视频| 国产欧美日韩三区| 久久精品一区四区| 久久久久久久久久电影| 精品免费日韩av| 精品久久久久久久久久久院品网| 欧美日本一区二区三区四区| 在线观看一区日韩| 91国偷自产一区二区开放时间 | 日韩1区2区日韩1区2区| 天天影视色香欲综合网老头| 亚洲成精国产精品女| 亚洲午夜精品一区二区三区他趣| 亚洲黄色av一区| 午夜激情综合网| 日本91福利区| 久久福利资源站| 国产成人h网站| 成人黄色大片在线观看| 93久久精品日日躁夜夜躁欧美| 91在线无精精品入口| 日本久久电影网| 欧美裸体bbwbbwbbw| 91精品在线麻豆| 精品欧美一区二区在线观看| 精品国产免费人成电影在线观看四季 | 成人一区二区三区在线观看| 国产91精品久久久久久久网曝门 | 亚洲成a人在线观看| 日韩电影在线免费观看| 狠狠色丁香久久婷婷综| 国产综合色产在线精品| www.日韩在线| 欧美日韩一区二区三区高清| 日韩一区二区影院| 国产亚洲综合性久久久影院| 亚洲人成伊人成综合网小说| 午夜视频在线观看一区二区 | 精品国产制服丝袜高跟| 中文久久乱码一区二区| 亚洲宅男天堂在线观看无病毒| 日本va欧美va精品| 99久久免费精品高清特色大片| 欧美日本一区二区在线观看| 国产亚洲成aⅴ人片在线观看 | 捆绑紧缚一区二区三区视频| 激情综合网av| 欧美亚洲日本国产| 久久久久久久久久久电影| 亚洲一区在线观看视频| 国产一区欧美日韩| 欧美日韩国产综合久久| 欧美国产亚洲另类动漫| 亚洲第一成人在线| 成人久久久精品乱码一区二区三区| 欧美电影一区二区| 亚洲欧洲精品成人久久奇米网| 日韩精品午夜视频| 色婷婷狠狠综合|