校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖

Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖

熱門標簽:所得系統電梯怎樣主板設置外呼 小蘇云呼電話機器人 儋州電話機器人 北瀚ai電銷機器人官網手機版 市場上的電銷機器人 朝陽手機外呼系統 佛山400電話辦理 北京電銷外呼系統加盟 地圖標注面積

一、前言

通過這篇文章,你將會收貨:

① 豆瓣電影數據的爬取;

② 手把手教你學會詞云圖的繪制;

二、豆瓣爬蟲步驟

當然,豆瓣上面有很多其他的數據,值得我們爬取后做分析。但是本文我們僅僅爬取評論信息。

待爬取網址:

https://movie.douban.com/subject/34913671/comments?status=P

由于只有一個字段,我們直接使用re正則表達式,解決該問題。

那些爬蟲小白看過來,這又是一個你們練手的好機會。

下面直接為大家講述爬蟲步驟:

# 1. 導入相關庫,用什么庫,都寫在這里
import requests
import chardet
import re

# 2. 構造請求頭,這是一個反扒措施,初期學會總結,哪些網站都用了哪些,總結多了,用起來就得心應手。
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36',
    #在爬蟲里面如果出現了Referer最好也粘上去,因為有時候服務器會根據Referer來判斷請求時由瀏覽器還是爬蟲發出的
    'Referer':'https://www.douban.com/'
}

# 3. 這個循環,類似于翻頁操作
for i in range(0,1001,20):
    url = f"https://movie.douban.com/subject/34913671/comments?start={i}limit=20status=Psort=new_score"
    # 4. 使用requests庫發起請求
    response = requests.get(url,headers=headers)#發起請求得到響應
    # 5. 有時候返回結果可能會亂碼,這里記得調用encoding屬性,修改編碼
    response.encoding = "utf-8"
    # 6. 獲取返回的結果,調用的是text屬性。一定要區分text和content屬性的區別
    text = response.text#返回一個經過解碼的字符串
    # 7. 解析數據,這里直接使用正則解析
    comments_list = [i for i in re.findall('span class="short">(.*?)/span>',text,re.S)]
    # 8. 數據存儲,針對列表中的每一條數據,我們直接使用open()函數,寫入到txt文檔
    for comment in comments_list:
         with open(r"哆啦A夢:伴我同行2.txt","a",encoding = "utf-8") as f :  
                    f.write(comment + "\n")

三、最終效果如下

四、詞云圖制作流程

很多同學不會制作詞云圖,借此機會,我這里寫一套詳細的流程,大家照貓畫虎就行。

繪制詞云圖的詳細步驟如下:

  • ① 導入相關庫;
  • ② 讀取文本文件,使用jieba庫動態修改詞典;
  • ③ 使用jieba庫中的lcut()方法進行分詞;
  • ④ 讀取停用詞,添加額外停用詞,并去除停用詞;
  • ⑤ 詞頻統計;
  • ⑥ 繪制詞云圖

① 導入相關庫

在這里,你需要什么庫,就導入什么庫。

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
from imageio import imread

import warnings
warnings.filterwarnings("ignore")

② 讀取文本文件,使用jieba庫動態修改詞典

這里with open()讀取文本文件,我就不解釋了。這里解釋一下動態修改詞典

sentence = "湖北廣水第三條街,有一條狗"

list(jieba.cut(sentence))

結果如下:

針對上述切分結果,如果我們想把“湖北廣水”和“第三條街”都當成一個完整詞,而不切分開,怎么辦呢?此時,就需要借助add_word()方法,動態修改詞典。

sentence = "湖北廣水第三條街,有一條狗"

jieba.add_word("湖北廣水")
jieba.add_word("有一條狗")

list(jieba.cut(sentence))

結果如下:

總結:

  • jieba.add_word()方法,只能一個個動態添加某個詞語。
  • 假如我們需要動態添加多個詞語的時候,就需要使用jieba.load_userdict()方法。也就是說:將所有的自定義詞語,放到一個文本中,然后使用該方法,一次性動態修改詞典集。

有了上述基礎,我們直接讀取文本后,動態修改詞典。

with open(r"哆啦A夢:伴我同行2.txt",encoding="utf-8") as f:
    txt = f.read()
txt = txt.split()

jieba.add_word("哆啦A夢")
jieba.add_word("大雄")

③ 使用jieba庫中的lcut()方法進行分詞

短短的一行代碼,很簡單。

data_cut = [jieba.lcut(x) for x in txt]

④ 讀取停用詞,添加額外停用詞,并去除停用詞

讀取停用詞,采用split()函數切分后,會得到一個停用詞列表。接著,采用+號將額外停用詞,添加到列表中即可。

# 讀取停用詞
with open(r"stoplist.txt",encoding="utf-8") as f:
    stop = f.read()
stop = stop.split()
# 額外添加停用詞,這里我們只添加了一個空格
stop = [" "] + stop
# 去除停用詞
s_data_cut = pd.Series(data_cut)
all_words_after = s_data_cut.apply(lambda x:[i for i in x if i not in stop])

⑤ 詞頻統計

這里注意series中value_counts()的使用。

all_words = []
for i in all_words_after:
    all_words.extend(i)
    
word_count = pd.Series(all_words).value_counts()

⑥ 繪制詞云圖

# 1、讀取背景圖片
back_picture = imread(r"aixin.jpg")

# 2、設置詞云參數
wc = WordCloud(font_path="simhei.ttf",
               background_color="white",
               max_words=2000,
               mask=back_picture,
               max_font_size=200,
               random_state=42
              )
wc2 = wc.fit_words(word_count)

# 3、繪制詞云圖
plt.figure(figsize=(16,8))
plt.imshow(wc2)
plt.axis("off")
plt.show()
wc.to_file("ciyun.png")

五、效果圖

從詞云圖大致可以看出:這又是一部催淚電影,這是一部情懷電影,陪伴我們長大的大雄都結婚了?那我們呢?其實我們小時候,就盼望著大雄和靜香能夠是好盆友,就在這部電影,他們結婚了。這部電影應該怎么上演呢?大家可以去電影院一探究竟。

到此這篇關于Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖的文章就介紹到這了,更多相關Python爬取影評并生成詞云圖內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python多線程爬取豆瓣影評API接口
  • Python爬取英雄聯盟MSI直播間彈幕并生成詞云圖
  • Python通過文本和圖片生成詞云圖
  • 基于python生成英文版詞云圖代碼實例
  • Python實現Wordcloud生成詞云圖的示例
  • python根據文本生成詞云圖代碼實例
  • 利用Python爬取微博數據生成詞云圖片實例代碼
  • Python采集貓眼兩萬條數據 對《無名之輩》影評進行分析
  • 使用Python抓取豆瓣影評數據的方法
  • Python爬蟲實戰:分析《戰狼2》豆瓣影評

標簽:龍巖 云南 江蘇 商丘 金融催收 寧夏 定西 酒泉

巨人網絡通訊聲明:本文標題《Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖》,本文關鍵詞  Python,爬取,哆啦,夢,伴我,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖》相關的同類信息!
  • 本頁收集關于Python爬取哆啦A夢-伴我同行2豆瓣影評并生成詞云圖的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    日韩精品91亚洲二区在线观看 | 欧美大尺度电影在线| 欧美最新大片在线看| 9191久久久久久久久久久| 欧美一区二区人人喊爽| 久久久久久麻豆| 亚洲女人小视频在线观看| 日韩av一区二区在线影视| 国产一区二区三区蝌蚪| 成人av网站在线| 日韩一区二区影院| 国产精品高潮呻吟久久| 男人操女人的视频在线观看欧美| 福利视频网站一区二区三区| 欧美日韩国产不卡| 国产欧美日韩中文久久| 日韩精彩视频在线观看| 91在线视频免费91| 国产欧美日韩精品在线| 日本网站在线观看一区二区三区| 国产盗摄一区二区| 欧美成人女星排名| 午夜日韩在线电影| 欧美在线观看你懂的| 国产精品久久久久久久久快鸭| 蜜臀久久99精品久久久久久9 | 久久老女人爱爱| 国产在线视频精品一区| 欧美一区二区三区小说| 亚洲一区二区综合| 欧美亚洲禁片免费| 亚洲国产综合人成综合网站| 99久久精品国产网站| 中文字幕av在线一区二区三区| 老司机免费视频一区二区三区| 欧美日韩免费一区二区三区视频| 亚洲一区二区欧美激情| 欧美日韩在线播| 男人的天堂亚洲一区| 国产午夜精品一区二区三区视频| 亚洲自拍另类综合| 欧美日韩国产成人在线免费| 亚洲成人动漫在线免费观看| 欧美久久婷婷综合色| 蜜臀久久99精品久久久久久9| 欧美大胆一级视频| 99久精品国产| 丝袜美腿亚洲综合| 久久久久久久久久久黄色| 成人av网站在线| 午夜一区二区三区视频| 欧美精品一区二区三区蜜桃| 国产99久久久国产精品潘金| 亚洲丝袜自拍清纯另类| 欧美一区二区在线免费观看| 国产一区在线精品| 亚洲一区二区三区四区五区中文| 欧美一区二区网站| www.日韩精品| 久久99日本精品| 一区二区三区在线免费| 国产精品久久看| 制服.丝袜.亚洲.另类.中文| av在线不卡电影| 韩国av一区二区| 青青草国产成人av片免费| 一区二区三区蜜桃网| 久久婷婷国产综合国色天香| 欧美一区二区在线视频| 欧美日韩精品一区二区天天拍小说| 国产麻豆午夜三级精品| 久久 天天综合| 蜜臀久久久99精品久久久久久| 曰韩精品一区二区| 夜夜操天天操亚洲| 亚洲午夜在线视频| 日韩国产欧美三级| 免费一级片91| 久久99精品国产麻豆不卡| 久久狠狠亚洲综合| 麻豆成人免费电影| 久久99国产精品成人| 国产高清无密码一区二区三区| 激情伊人五月天久久综合| 亚洲6080在线| 老司机精品视频在线| 久久99久久久欧美国产| 国产高清在线观看免费不卡| 成人污污视频在线观看| 国产成人亚洲综合a∨婷婷图片| 国内欧美视频一区二区| 91天堂素人约啪| 欧美美女bb生活片| 久久先锋资源网| 一区二区三区毛片| 国产乱码精品一区二区三区五月婷| 久久国产日韩欧美精品| 91亚洲大成网污www| 欧美一级欧美三级在线观看| 国产欧美视频在线观看| 亚洲一区在线观看免费| 国产一区二区三区久久悠悠色av| 91在线观看污| 2021中文字幕一区亚洲| 亚洲制服欧美中文字幕中文字幕| 激情综合五月天| 日韩免费一区二区| 亚洲日本成人在线观看| 国产一区在线观看麻豆| 欧美性受xxxx| 亚洲图片另类小说| 丁香亚洲综合激情啪啪综合| 91精品国产欧美一区二区18 | 91欧美一区二区| 日本一区二区三级电影在线观看| 亚洲午夜激情网页| 91农村精品一区二区在线| 欧美精品一区二区三区很污很色的| 亚洲电影中文字幕在线观看| 91美女蜜桃在线| 一区二区三区不卡视频在线观看| 粉嫩绯色av一区二区在线观看 | 紧缚捆绑精品一区二区| 制服丝袜亚洲色图| 水野朝阳av一区二区三区| 欧美巨大另类极品videosbest | 欧洲另类一二三四区| 中文字幕日本乱码精品影院| 91在线视频免费观看| 一区二区在线观看免费| 精品视频123区在线观看| 亚洲精品成a人| 欧美日韩激情一区| 日韩高清在线一区| 久久免费午夜影院| 91免费看片在线观看| 亚洲国产一区二区三区青草影视| 欧美日韩三级在线| 美国十次综合导航| 国产精品美女视频| 欧美欧美欧美欧美| 成人激情文学综合网| 丝袜诱惑亚洲看片 | 久久精品国产77777蜜臀| 精品国产乱码久久久久久老虎 | 欧美日韩和欧美的一区二区| 三级成人在线视频| 国产视频一区二区在线| 色999日韩国产欧美一区二区| 日韩国产一区二| 亚洲日本免费电影| 2023国产精品视频| 欧美日韩国产成人在线免费| 国产最新精品免费| 天天综合天天综合色| 国产精品九色蝌蚪自拍| 亚洲精品一区二区三区香蕉| 欧美午夜影院一区| 色综合久久88色综合天天免费| 精品中文字幕一区二区小辣椒| 一区二区高清免费观看影视大全| 2023国产精品视频| 国产精品国产精品国产专区不片| 欧美大片在线观看一区二区| 欧美日韩一区高清| 91久久精品日日躁夜夜躁欧美| 高清国产一区二区| 在线免费不卡视频| 91麻豆6部合集magnet| 成人一级片在线观看| 成人黄色在线看| 成人性生交大片免费看视频在线| 国产精品原创巨作av| 国产成都精品91一区二区三| 91成人网在线| 色综合久久九月婷婷色综合| 一本色道久久综合精品竹菊| 9久草视频在线视频精品| 色一情一乱一乱一91av| 一本大道综合伊人精品热热 | 一区二区三区在线观看视频 | 在线观看三级视频欧美| 欧美日韩一二三区| 精品毛片乱码1区2区3区| 久久精品欧美一区二区三区不卡| 中文字幕精品三区| 亚洲高清免费在线| 国产在线精品国自产拍免费| 99国产麻豆精品| 欧美三级欧美一级| 国产欧美日本一区二区三区| 亚洲色图另类专区| 国产在线不卡一卡二卡三卡四卡| 91亚洲资源网| 26uuu另类欧美亚洲曰本| 一区二区三区欧美| 国产精品91xxx| 91精品国产91久久综合桃花| 中文字幕中文字幕一区| 日韩1区2区日韩1区2区|