校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識(shí)庫 > Python爬蟲之爬取二手房信息

Python爬蟲之爬取二手房信息

熱門標(biāo)簽:溫州旅游地圖標(biāo)注 外呼不封號(hào)系統(tǒng) 遼寧400電話辦理多少錢 蘇州電銷機(jī)器人十大排行榜 荊州云電銷機(jī)器人供應(yīng)商 江蘇房產(chǎn)電銷機(jī)器人廠家 幫人做地圖標(biāo)注收費(fèi)算詐騙嗎 悟空智電銷機(jī)器人6 電信營(yíng)業(yè)廳400電話申請(qǐng)

前言

說到二手房信息,不知道你們心里最先跳出來的公司(網(wǎng)站)是什么,反正我心里第一個(gè)跳出來的是網(wǎng)站是 58 同城。哎呦,我這暴脾氣,想到就趕緊去干。

但很顯然,我失敗了。說顯然,而不是不幸,這是因?yàn)?58 同城是大公司,我這點(diǎn)本事爬不了數(shù)據(jù)是再正常不過的了。下面來看看 58 同城的反爬手段了。這是我爬取下來的網(wǎng)頁源碼。

我們看到爬取下來的源碼有很多英文大寫字母和數(shù)字是網(wǎng)頁源碼中沒有的,后來我了解到 58 同城對(duì)自己的網(wǎng)站的源碼進(jìn)行了文本加密,所以就出現(xiàn)了我爬取到的情況。

爬取二手房信息

我打開 58 同城的 robots 協(xié)議。

好家伙,不愧是大公司,所有的動(dòng)態(tài)網(wǎng)址都不讓爬取,打擾了。我只好轉(zhuǎn)頭離開,去尋找可以讓我這種小白爬取的二手房網(wǎng)站。于是我找到了c21網(wǎng)站,不知道是我的原因,還是別的原因,反正我是沒有找到這個(gè)網(wǎng)站的 robots 協(xié)議。不管了,既然沒找到,就默認(rèn)沒有吧,直接開始爬取。

我本來打算通過二手房的目錄跳到一個(gè)具體信息,然后爬取二手房的一些基本信息和屬性。


像我紅筆圈起來的部分。但很可惜我失敗了,后來我看了看紅筆圈起來的部分的爬取到的源碼。

好家伙,還可以這樣。不過這怎么可以難倒機(jī)智的我?(其實(shí)我真不知道怎么解決它)。沒關(guān)系,之前的源碼里不是有類似的信息嗎?我只好將就一下了。

然后是翻頁。翻頁問題很好解決,我們很快就發(fā)現(xiàn)網(wǎng)頁都是 https://bj.c21.com.cn/ershoufang/pg2/。其中的頁數(shù)和 pg 后面的數(shù)字有關(guān)。

然后就是分析這些數(shù)據(jù)源碼的位置了。

首先,我們發(fā)現(xiàn)我們要爬取的數(shù)據(jù)全在 li 標(biāo)簽里,所以我們可以先獲得 li 標(biāo)簽的列表。偽代碼就像這樣。

form lxml import etree
……   ……
tree = etree.HTML(源碼)
li_list = tree.xpath( li 標(biāo)簽的路徑)

這時(shí)候我們獲得的就是 li 標(biāo)簽的 etree 的類,可以繼續(xù)使用 etree 類里的函數(shù)。然后我們就可以利用 for 循環(huán)提出不同房源的 li 標(biāo)簽,根據(jù)自己的需要獲取文本信息。

歐克,了解了這些(感覺源碼前前后后就是四個(gè)字 ”我是菜雞“ )我們就可以開始寫代碼了。

import requests
from lxml import etree
import re

if __name__ == "__main__":
    # UA偽裝
    header = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.72 Safari/537.36"
        }

    for pg in range(1, 3): # 翻兩頁
        # 指定 url
        url = "https://bj.c21.com.cn/ershoufang/pg%s/" % str(pg)

        # 獲取網(wǎng)頁源碼
        page = requests.get(url = url, headers = header).text

        # xpath 解析
        tree = etree.HTML(page)
        li_list = tree.xpath('//ul[@id="availability"]/li') 
        for li in li_list:
            title = li.xpath('div[2]/div/a/text()')[0] # 房子的名稱
            # print(title[0]) # 測(cè)試
            add = li.xpath('div[2]/div/p//a/text()') # 地址
            add = add[-2: ] + add[0:1] # 地址范圍由大到小
            # print(add) # 測(cè)試
            div_list = li.xpath('div[2]/div[2]/div')
            # 具體信息
            message_list = ["建筑面積", "房屋戶型", "房屋朝向", "所在樓層", "裝修情況", "建成時(shí)間"]
            for i in range(6):
                div = div_list[i]
                message = div.xpath('span/text()')[0]
                message = re.sub("\s", "", str(message)) # 因?yàn)榘l(fā)現(xiàn)獲取的文本有很多換行符和空格,所以需要去掉
                message = re.sub("\\n", "", str(message))
                message_list[i] = message_list[i] + ":" + message
            # print(message_list) # 測(cè)試
            # 交通情況
            traffic = li.xpath('div[2]/div[4]//text()')
            # print(traffic) # 測(cè)試
            # 價(jià)格情況
            price = li.xpath('div[2]/div[3]//text()')
            price = price[0] + price[1]
            # print(price) # 測(cè)試
            with open("C:\\Users\\ASUS\\Desktop\\CSDN\\數(shù)據(jù)解析\\xpath\\二手房\\" + "二手房.txt", "a", encoding = "utf-8") as fp:
                fp.write(title + "\n")
                for message in message_list:
                    fp.write(message + "\n")
                if traffic == []:
                    fp.write("交通情況:無介紹" + "\n")
                else:
                    fp.write("交通情況:" + traffic[0] + "\n")
                fp.write("價(jià)格:" + price + "\n\n")
            print(title, "下載完成!!!")

    print("over!!!")

爬取結(jié)果

最后的運(yùn)行結(jié)果就像這樣

到此這篇關(guān)于Python爬蟲之爬取二手房信息的文章就介紹到這了,更多相關(guān)Python爬取二手房信息內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python手拉手教你爬取貝殼房源數(shù)據(jù)的實(shí)戰(zhàn)教程
  • Python scrapy爬取蘇州二手房交易數(shù)據(jù)
  • Python爬蟲之爬取我愛我家二手房數(shù)據(jù)
  • python爬取鏈家二手房的數(shù)據(jù)
  • 基于python爬取鏈家二手房信息代碼示例
  • python爬蟲 爬取58同城上所有城市的租房信息詳解
  • Python爬蟲入門案例之爬取二手房源數(shù)據(jù)

標(biāo)簽:景德鎮(zhèn) 宿遷 喀什 欽州 三沙 臺(tái)灣 濟(jì)南 黃山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬蟲之爬取二手房信息》,本文關(guān)鍵詞  Python,爬蟲,之爬,取,二手房,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬蟲之爬取二手房信息》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python爬蟲之爬取二手房信息的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    欧美日韩国产精选| 亚洲国产精品嫩草影院| 最新国产成人在线观看| 一区二区三区不卡视频| 久久精品国产成人一区二区三区| 成人av网站在线观看免费| 欧美日韩一区二区三区四区 | 亚洲日本va在线观看| 亚洲va天堂va国产va久| 韩国理伦片一区二区三区在线播放| 99久久精品国产精品久久| 欧美剧情电影在线观看完整版免费励志电影 | 久久九九99视频| 亚洲一区二区三区中文字幕在线| 日本亚洲视频在线| 91网址在线看| 精品国产百合女同互慰| 亚洲激情图片小说视频| 国产一区二区精品在线观看| 欧美猛男男办公室激情| 中文字幕不卡三区| 免费人成精品欧美精品| 色先锋aa成人| 久久精品免费在线观看| 日本美女一区二区三区| 91老师片黄在线观看| 国产亚洲欧美中文| 日韩成人dvd| 在线观看91精品国产入口| 欧美电影免费观看高清完整版| 亚洲欧美一区二区三区极速播放| 免费成人小视频| 欧美日韩免费观看一区三区| 中文字幕一区二区三区av| 久久精品国产亚洲高清剧情介绍| 一本久久a久久精品亚洲| 中文文精品字幕一区二区| 久久精品二区亚洲w码| 欧美日韩国产一二三| 亚洲另类中文字| 成人免费视频app| 欧美xxxxxxxx| 亚洲高清免费观看| 99re这里只有精品视频首页| 日韩精品一区在线观看| 日日欢夜夜爽一区| 精品婷婷伊人一区三区三| 亚洲精品视频免费看| 成人午夜免费视频| 久久免费国产精品| 国内外成人在线| 日韩欧美www| 日本午夜一本久久久综合| 欧美视频你懂的| 亚洲一二三四在线| 91免费观看在线| 国产精品福利一区| 成人av在线看| 国产精品超碰97尤物18| 国产a级毛片一区| 国产亚洲精品中文字幕| 国产精品一级黄| 国产欧美日本一区视频| 高清不卡在线观看| 久久尤物电影视频在线观看| 国内外成人在线| 久久久久久一级片| 国产成人亚洲综合a∨婷婷图片| 久久视频一区二区| 国产精品一卡二卡在线观看| 日韩欧美综合一区| 日本伊人色综合网| 欧美日本不卡视频| 亚洲色图色小说| 91免费看`日韩一区二区| 一区二区三区精品视频在线| 成人激情视频网站| 欧美激情一区二区三区蜜桃视频 | 粉嫩一区二区三区在线看| 欧美精彩视频一区二区三区| 成人午夜电影网站| 最近日韩中文字幕| 欧美日韩中文字幕一区| 一区二区三区四区乱视频| 欧美在线你懂得| 亚洲国产毛片aaaaa无费看| 欧美日韩国产高清一区二区 | 欧美一区二区三区思思人| 久久精品国产99国产精品| 26uuu国产在线精品一区二区| 国产乱码精品一区二区三区忘忧草 | 麻豆成人av在线| 久久久91精品国产一区二区精品 | 成人av免费在线观看| 亚洲精品伦理在线| 欧美日韩另类国产亚洲欧美一级| 亚洲综合免费观看高清在线观看| 91尤物视频在线观看| 亚洲午夜久久久久久久久电影院| 91精品免费观看| 国产成人亚洲综合a∨婷婷| 国产精品每日更新在线播放网址| 国产成人8x视频一区二区| 亚洲九九爱视频| 欧美一级国产精品| 99久久综合99久久综合网站| 亚洲一区成人在线| 久久综合五月天婷婷伊人| 色综合一个色综合| 日本中文字幕不卡| 久久精品视频一区| 欧美在线视频全部完| 国产在线播放一区二区三区| 一区二区三区美女| 精品国产伦一区二区三区观看方式 | 欧美一区二区视频观看视频| 国产精品 欧美精品| 亚洲成人自拍一区| 国产欧美一区二区精品性| 欧美三片在线视频观看 | 日产国产欧美视频一区精品| 欧美国产精品中文字幕| 欧美日韩一区二区电影| 国产成人在线视频免费播放| 午夜成人免费电影| 精品99一区二区三区| 成人丝袜18视频在线观看| 亚洲国产精华液网站w| 欧美精品三级日韩久久| av电影在线不卡| 奇米色777欧美一区二区| 亚洲女同女同女同女同女同69| 日韩一级完整毛片| 欧美视频在线一区二区三区| 蜜芽一区二区三区| 国产精品乱码人人做人人爱| 日韩一级成人av| 欧美优质美女网站| 国内精品不卡在线| 亚洲一区视频在线| 国产精品九色蝌蚪自拍| 精品免费视频.| 欧美人伦禁忌dvd放荡欲情| caoporn国产一区二区| 日韩av不卡一区二区| 一区二区三区久久| 国产精品麻豆视频| 久久久久久久久免费| 91精品国产色综合久久不卡电影| 国产福利91精品一区二区三区| 亚洲午夜一区二区三区| 夜夜嗨av一区二区三区中文字幕 | 色狠狠色狠狠综合| 成人激情电影免费在线观看| 国产美女在线精品| 精品一区二区三区在线观看| 亚洲电影视频在线| 一区二区三区欧美亚洲| 国产精品人妖ts系列视频| 久久综合狠狠综合久久综合88| 欧美在线视频日韩| 欧美日韩精品系列| 在线视频你懂得一区| 91色乱码一区二区三区| 成人听书哪个软件好| 国产精品系列在线播放| 极品美女销魂一区二区三区| 日韩av中文字幕一区二区三区| 亚洲一区电影777| 一区二区在线观看免费 | 夜夜亚洲天天久久| 亚洲综合一二三区| 亚洲综合视频在线观看| 中文字幕日韩一区| 欧美极品美女视频| 久久久91精品国产一区二区精品| 欧美zozozo| 精品国产欧美一区二区| 久久夜色精品国产噜噜av| 久久品道一品道久久精品| 欧美一区二区三区在线观看| 欧美电影一区二区| 日韩欧美的一区二区| 久久只精品国产| 日韩一级大片在线观看| 91麻豆精品91久久久久同性| 91精品国产免费久久综合| 日韩一区二区免费高清| 欧美变态口味重另类| 精品国产乱码久久| 国产欧美1区2区3区| 国产精品久久久久久户外露出| 国产精品网友自拍| 国产亚洲精品7777| 中文字幕av一区二区三区| 亚洲欧美综合另类在线卡通| 亚洲伦在线观看| 亚洲一区二区三区四区在线观看| 日韩成人精品在线观看| 国产一区二区0|