校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > 詳細講解HDFS的高可用機制

詳細講解HDFS的高可用機制

熱門標簽:隨州銷售外呼系統平臺 寧夏保險智能外呼系統哪家好 怎么更改地圖標注電話 臨滄移動外呼系統哪家有 交行外呼系統有哪些 防城港市ai電銷機器人 不同的地圖標注 溫嶺代理外呼系統 激戰黃昏地圖標注說明

在Hadoop2.X之前,Namenode是HDFS集群中可能發生單點故障的節點,每個HDFS集群只有一個namenode,一旦這個節點不可用,則整個HDFS集群將處于不可用狀態。
HDFS高可用(HA)方案就是為了解決上述問題而產生的,在HA HDFS集群中會同時運行兩個Namenode,一個作為活動的Namenode(Active),一個作為備份的Namenode(Standby)。備份的Namenode的命名空間與活動的Namenode是實時同步的,所以當活動的Namenode發生故障而停止服務時,備份Namenode可以立即切換為活動狀態,而不影響HDFS集群服務。

 

在一個HA集群中,會配置兩個獨立的Namenode。在任意時刻,只有一個節點作為活動的節點,另一個節點則處于備份狀態。活動的Namenode負責執行所有修改命名空間以及刪除備份數據塊的操作,而備份的Namenode則執行同步操作,以保持與活動節點命名空間的一致性。
為了使備份節點與活動節點的狀態能夠同步一致,兩個節點都需要同一組獨立運行的節點(JournalNodes,JNS)通信。當Active Namenode執行了修改命名空間的操作時,它會定期將執行的操作記錄在editlog中,并寫入JNS的多數節點中。而Standby Namenode會一直監聽JNS上editlog的變化,如果發現editlog有改動,Standby Namenode就會讀取editlog并與當前的命名空間合并。當發生了錯誤切換時,Standby節點會保證已經從JNS上讀取了所有editlog并與命名空間合并,然后才會從Standby狀態切換為Active狀態。通過這種機制,保證了Active Namenode與Standby Namenode之間命名空間狀態的一致性,也就是第一關系鏈的一致性。
為了使錯誤切換能夠很快的執行完畢,就要保證Standby節點也保存了實時的數據快的存儲信息,也就是第二關系鏈。這樣發生錯誤切換時,Standby節點就不需要等待所有的數據節點進行全量數據塊匯報,而直接可以切換到Active狀態。為了實現這個機制,Datanode會同時向這兩個Namenode發送心跳以及塊匯報信息。這樣就實現了Active Namenode 和standby Namenode 的元數據就完全一致,一旦發生故障,就可以馬上切換,也就是熱備。
這里需要注意的是 Standby Namenode只會更新數據塊的存儲信息,并不會向namenode 發送復制或者刪除數據塊的指令,這些指令只能由Active namenode發送。
在HA架構中有一個非常重非要的問題,就是需要保證同一時刻只有一個處于Active狀態的Namenode,否則機會出現兩個Namenode同時修改命名空間的問,也就是腦裂(Split-brain)。腦裂的HDFS集群很可能造成數據塊的丟失,以及向Datanode下發錯誤的指令等異常情況。為了預防腦裂的情況,HDFS提供了三個級別的隔離機制(fencing):

  • 1.共享存儲隔離:同一時間只允許一個Namenode向JournalNodes寫入editlog數據。
  • 2.客戶端隔離:同一時間只允許一個Namenode響應客戶端的請求。
  • 3.Datanode隔離:同一時間只允許一個Namenode向Datanode下發名字節點指令,李如刪除、復制數據塊指令等等。

在HA實現中還有一個非常重要的部分就是Active Namenode和Standby Namenode之間如何共享editlog日志文件。Active Namenode會將日志文件寫到共享存儲上。Standby Namenode會實時的從共享存儲讀取edetlog文件,然后合并到Standby Namenode的命名空間中。這樣一旦Active Namenode發生錯誤,Standby Namenode可以立即切換到Active狀態。在Hadoop2.6中,提供了QJM(Quorum Journal Manager)方案來解決HA共享存儲問題。

所有的HA實現方案都依賴于一個保存editlog的共享存儲,這個存儲必須是高可用的,并且能夠被集群中所有的Namenode同時訪問。Quorum Journa是一個基于paxos算法的HA設計方案。

Quorum Journal方案中有兩個重要的組件。

  • 1.JournalNoe(JN):運行在N臺獨立的物理機器上,它將editlog文件保存在JournalNode的本地磁盤上,同時JournalNode還對外提供RPC接口QJournalProtocol以執行遠程讀寫editlog文件的功能。
  • 2.QuorumJournalManager(QJM):運行在NmaeNode上,(目前HA集群只有兩個Namenode),通過調用RPC接口QJournalProtocol中的方法向JournalNode發送寫入、排斥、同步editlog。

Quorum Journal方案依賴于這樣一個概念:HDFS集群中有2N+1個JN存儲editlog文件,這些editlog 文件是保存在JN的本地磁盤上的。每個JN對QJM暴露QJM接口QJournalProtocol,允許Namenode讀寫editlog文件。當Namenode向共享存儲寫入editlog文件時,它會通過QJM向集群中所有的JN發送寫editlog文件請求,當有一半以上的JN返回寫操作成功時,即認為寫成功。這個原理是基于Paxos算法的。

使用Quorum Journal實現的HA方案有一下優點:

  • 1.JN進程可以運行在普通的PC上,而無需配置專業的共享存儲硬件。
  • 2.不需要單獨實現fencing機制,Quorum Journal模式中內置了fencing功能。
  • 3. Quorum Journa不存在單點故障,集群中有2N+1個Journal,可以允許有N個Journal Node死亡。
  • 4. JN不會因為其中一個機器的延遲而影響整體的延遲,而且也不會因為JN數量的增多而影響性能(因為Namenode向JournalNode發送日志是并行的)

互斥機制

當HA集群中發生Namenode異常切換時,需要在共享存儲上fencing上一個活動的節點以保證該節點不能再向共享存儲寫入editlog。基于Quorum Journal模式的HA提供了epoch number來解決互斥問題,這個概念可以在分布式文件系統中找到。epoch number具有以下幾個性質。
1.當一個Namenode變為活動狀態時,會分配給他一個epoch number。
2.每個epoch number都是唯一的,沒有任意兩個Namenode有相同的epoch number。
3.epoch number 定義了Namenode寫editlog文件的順序。對于任意兩個namenode ,擁有更大epoch number的Namenode被認為是活動節點。

當一個Namenode切換為活動狀態時,它的QJM會向所有的JN發送命令,以獲取該JN的最后一個promise epoch變量值。當QJM接受到了集群中多于一半的JN回復后,它會將所接收到的最大值加一,并保存到myepoch 中,之后QJM會將該值發送給所有的JN并提出更新請求。每個JN會將該值與自身的epoch值相互比較,如果新的myepoch比較大,則JN更新,并返回更新成功;如果小,則返回更新失敗。如果QJM接收到超過一半的JN返回成功,則設置它的epoch number為myepoch;,否則它終止嘗試為一個活動的Namenode,并拋出異常。

當活動的NameNode成功獲取并更新了epoch number后,調用任何修改editlog的RPC請求都必須攜帶epoch number。當RPC請求到達JN后,JN會將請求者的epoch與自身保存的epoch相互對比,若請求者的epoch更大,JN就會更新自己的epoch,并執行相應的操作,如果請求者的epoch小,就會拒絕相應的請求。當集群中大多數的JN拒絕了請求時,這次操作就失敗了。
當HDFS集群發生Namenode錯誤切換后,原來的standby Namenode將集群的epoch number加一后更新。這樣原來的Active namenode的epoch number肯定小于這個值,當這個節點執行寫editlog操作時,由于JN節點不接收epoch number小于自身的promise epoch的寫請求,所以這次寫請求會失敗,也就達到了fencing的目的。

寫流程

  • 1.將editlog輸出流中緩存的數據寫入JN,對于集群中的每一個JN都存在一個獨立的線程調用RPC 接口中的方法向JN寫入數據。
  • 2.當JN收到請求之后,JN會執行以下操作:

1)驗證epoch number是否正確

2)確認寫入數據對應的txid是否連續

3)將數據持久化到JN的本地磁盤

4)向QJM發送正確的響應

  • 3.QJM等待集群JN的響應,如果多數JN返回成功,則寫操作成功;否則寫操作失敗,QJM會拋出異常。

Namenode會調用FSEditlogLog下面的方法初始化editlog文件的輸出流,然后使用輸出流對象向editlog文件寫入數據。
獲取了QuorumOutputStream輸出流對象之后,Namenode會調用write方法向editlog文件中寫入數據,QuorumOutputStream的底層也調用了EditsDoubleBuffer雙緩存區。數據回先寫入其中一個緩沖區中,然后調用flush方法時,將緩沖區中的數據發送給JN。

讀流程

Standby Namenode會從JN讀取editlog,然后與Sdtandby Namenode的命名空間合并,以保持和Active Namenode命名空間的同步。當Sdtandby Namenode從JN讀取editlog時,它會首先發送RPC請求到集群中所有的JN上。JN接收到這個請求后會將JN本地存儲上保存的所有FINALIZED狀態的editlog段落文件信息返回,之后QJM會為所有JN返回的editlog段落文件構造輸入流對象,并將這些輸入流對象合并到一個新的輸入流對象中,這樣Standby namenode就可以從任一個JN讀取每個editlog段落了。如果其中一個JN失敗了輸入流對象會自動切換到另一個保存了該edirlog段落的JN上。

恢復流程

當Namenode發生主從切換時,原來的Standby namenode會接管共享存儲并執行寫editlog的操作。在切換之前,對于共享存儲會執行以下操作:
1.fencing原來的Active Namenode。這部分在互斥部分已經講述。
2.恢復正在處理的editlog。由于Namenode發生了主從切換,集群中JN上正在執行寫入操作的editlog數據可能不一致。例如,可能出現某些JN上的editlog正在寫入,但是當前Active Namenode發生錯誤,這時該JN上的editlog文件就與已完成寫入的JN不一致。在這種情況下,需要對JN上所有狀態不一致的editlog文件執行恢復操作,將他們的數據同步一致,并且將editlog文件轉化為FINALIZED狀態。
3.當不一致的editlog文件完成恢復之后,這時原來的Standby Namenode就可以切換為Active Namenode并執行寫editlog的操作。
4.寫editlog。在前面已經介紹了。

日志恢復操作可以分為以下幾個階段:

1.確定需要執行恢復操作的editlog段落:在執行恢復操作之前,QJM會執行newEpoch()調用以產生新的epoch number,JN接收到這個請求后除了執行更新epoch number外,還會將該JN上保存的最新的editlog段落的txid返回。當集群中的大多數JN都發回了這個響應后,QJM就可以確定出集群中最新的一個正在處理editlog段落的txid,然后QJM就會對這個txid對應的editlog段落執行恢復操作了。

2.準備恢復:QJM向集群中的所有JN發送RPC請求,查詢執行恢復操作的editlog段落文件在所有JN上的狀態,這里的狀態包括editlog文件是in-propress還是FINALIZED狀態,以及editlog文件的長度。

3.接受恢復:QJM接收到JN發回的JN發回的響應后,會根據恢復算法選擇執行恢復操作的源節點。然后QJM會發送RPC請求給每一個JN,這個請求會包含兩部分信息:源editlog段落文件信息,以及供JN下載這個源editlog段落的url。
接收到這個RPC請求之后,JN會執行以下操作:

1)同步editlog段落文件,如果JN磁盤上的editlog段落文件與請求中的段落文件狀態不同,則JN會從當前請求中的url上下載段落文件,并替換磁盤上的editlog段落文件。
2)持久化恢復元數據,JN會將執行恢復操作的editlog段落文件的狀態、觸發恢復操作的QJM的epoch number等信息(恢復的元數據信息)持久化到磁盤上。
3)當這些操作都執行成功后,JN會返回成功響應給QJM,如果集群中的大多數JN都返回了成功,則此次恢復操作執行成功。

4.完成editlog段落文件:到這步操作時,QJM 就能確定集群中大多數的JN保存的editlog文件的狀態已經一致了,并且JN持久化了恢復信息。QJM就會向JN發送指令,將這個editlog段落文件的狀態轉化為FINALIZED狀態,,并且JN會刪除持久化的恢復元數據,因為磁盤上保存的editlog文件信息已經是正確的了,不需要保存恢復的元數據。

到此這篇關于詳細講解HDFS的高可用機制的文章就介紹到這了,更多相關HDFS的高可用機制內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • HDFS-Hadoop NameNode高可用機制
  • JAVA讀取HDFS的文件數據出現亂碼的解決方案
  • Hadoop 分布式存儲系統 HDFS的實例詳解
  • JAVA操作HDFS案例的簡單實現
  • hadoop的hdfs文件操作實現上傳文件到hdfs

標簽:青海 無錫 沈陽 忻州 哈密 紅河 阜陽 河源

巨人網絡通訊聲明:本文標題《詳細講解HDFS的高可用機制》,本文關鍵詞  詳細,講解,HDFS,的,高可用,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《詳細講解HDFS的高可用機制》相關的同類信息!
  • 本頁收集關于詳細講解HDFS的高可用機制的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    麻豆国产精品777777在线| 91丨porny丨最新| 日韩av不卡在线观看| 亚洲图片欧美色图| 一区二区三区丝袜| 一区二区在线观看视频| 亚洲精品国产精品乱码不99| 亚洲欧美另类图片小说| 一区二区三区四区不卡视频| 亚洲精品自拍动漫在线| 一区二区成人在线| 亚洲一卡二卡三卡四卡五卡| 亚洲五码中文字幕| 日本sm残虐另类| 蜜臀va亚洲va欧美va天堂| 美美哒免费高清在线观看视频一区二区| 久久亚洲精品小早川怜子| 国产亚洲精品资源在线26u| 欧美国产成人在线| 国产精品不卡一区| 亚洲在线成人精品| 首页国产欧美久久| 精品一区二区三区久久| 国产成人aaaa| 色综合久久久久| 精品污污网站免费看| 欧美一区二区三区男人的天堂| 欧美一区二区三区日韩视频| 久久午夜免费电影| 中文字幕综合网| 日本视频免费一区| 国产不卡在线播放| 91国偷自产一区二区开放时间| 欧美日韩中文一区| 国产丝袜欧美中文另类| 一区二区成人在线| 六月丁香综合在线视频| 成人精品gif动图一区| 欧美婷婷六月丁香综合色| 久久综合狠狠综合| 亚洲日穴在线视频| 韩国三级在线一区| 91麻豆精东视频| 日韩欧美一区二区久久婷婷| 中文字幕亚洲一区二区va在线| 亚洲国产精品自拍| 国产精品99久久久久久久vr| 91豆麻精品91久久久久久| 精品日韩在线一区| 亚洲男人天堂一区| 国产剧情在线观看一区二区| 91久久精品一区二区三| 欧美成人乱码一区二区三区| 亚洲黄色免费电影| 国产又粗又猛又爽又黄91精品| 色婷婷国产精品| 久久久久久久久久久久久女国产乱 | 国产美女精品人人做人人爽| 色综合天天做天天爱| 久久麻豆一区二区| 亚洲风情在线资源站| 国产成人aaa| 欧美一区二区三区免费大片| 亚洲欧洲日韩在线| 久久99精品久久久久久国产越南| 色呦呦日韩精品| 中文在线一区二区| 蜜桃一区二区三区在线| 色婷婷一区二区| 日本一区二区三区久久久久久久久不| 亚洲国产精品一区二区久久| 成人sese在线| 久久久久久久久久久久久久久99| 香蕉影视欧美成人| 色综合色狠狠综合色| 国产人久久人人人人爽| 青青草成人在线观看| 欧美性色黄大片手机版| 亚洲免费观看高清在线观看| 国产精品亚洲人在线观看| 欧美一级理论片| 午夜欧美电影在线观看| 色嗨嗨av一区二区三区| 国产精品国产馆在线真实露脸| 久久99精品久久久| 欧美大片国产精品| 蜜桃久久av一区| 日韩一区二区在线观看视频| 五月开心婷婷久久| 欧美日韩精品一区二区在线播放| 亚洲精品欧美激情| 色老综合老女人久久久| 亚洲欧美一区二区三区孕妇| 成人开心网精品视频| 中文字幕免费在线观看视频一区| 国产精品一级片| 久久久久99精品一区| 国产一区二区三区免费看| 精品国内二区三区| 精品在线观看免费| 久久综合国产精品| 国产精品亚洲人在线观看| 国产午夜精品一区二区三区嫩草| 国产很黄免费观看久久| 欧美激情中文不卡| 99国产精品一区| 亚洲欧美日韩国产手机在线| 91黄色激情网站| 一区二区三区成人| 欧美日本韩国一区二区三区视频| 亚洲午夜免费视频| 欧美疯狂性受xxxxx喷水图片| 天天免费综合色| 日韩欧美在线不卡| 国内成+人亚洲+欧美+综合在线| 久久久久久久久久久久久女国产乱| 国产激情一区二区三区| 亚洲欧洲成人自拍| 91久久人澡人人添人人爽欧美| 亚洲bdsm女犯bdsm网站| 日韩欧美一区电影| 粉嫩蜜臀av国产精品网站| 国产精品五月天| 欧美性色黄大片手机版| 日本欧美肥老太交大片| 久久久久久久久蜜桃| 99精品在线观看视频| 午夜精品久久久久久久99水蜜桃| 欧美一三区三区四区免费在线看| 极品少妇xxxx精品少妇偷拍| 中文字幕欧美日韩一区| 欧美亚洲愉拍一区二区| 久久精品国产99| 欧美国产精品v| 欧美日韩激情在线| 国产裸体歌舞团一区二区| 国产免费成人在线视频| 欧美在线一区二区三区| 久久精品国产亚洲a| 国产欧美一区二区精品久导航| 日本韩国一区二区| 视频一区视频二区在线观看| 久久网站热最新地址| 色呦呦国产精品| 老司机免费视频一区二区| 国产精品久久久久永久免费观看| 欧美日韩在线观看一区二区| 国产成人在线视频播放| 亚洲国产精品久久人人爱蜜臀| 久久人人97超碰com| 在线免费亚洲电影| 国产精一区二区三区| 亚洲欧美激情一区二区| 精品国产91乱码一区二区三区 | 91精品国产丝袜白色高跟鞋| 国产成人精品三级麻豆| 亚洲bt欧美bt精品| 国产精品视频免费| 日韩西西人体444www| 91免费精品国自产拍在线不卡| 青青草国产精品97视觉盛宴| 亚洲欧美日韩国产中文在线| 久久网这里都是精品| 制服丝袜中文字幕亚洲| 99久久婷婷国产综合精品| 久久成人免费电影| 亚洲一区二区三区自拍| 欧美国产激情一区二区三区蜜月| 91精品综合久久久久久| av在线一区二区| 国产麻豆精品theporn| 日产欧产美韩系列久久99| 亚洲美女免费在线| 国产精品三级av在线播放| 欧美va天堂va视频va在线| 欧美体内she精视频| 99久久99精品久久久久久| 国产乱理伦片在线观看夜一区| 视频一区视频二区在线观看| 亚洲精品va在线观看| 国产精品乱码一区二三区小蝌蚪| 欧美成人综合网站| 91.com在线观看| 欧美日韩国产一区二区三区地区| 97se亚洲国产综合自在线观| 国产成人一级电影| 国产精品一区免费在线观看| 免费美女久久99| 日本女优在线视频一区二区| 亚洲高清在线视频| 亚洲乱码国产乱码精品精98午夜| 中文成人综合网| 国产欧美日韩中文久久| 欧美大片在线观看一区| 日韩一二在线观看| 91精品国产欧美一区二区18| 欧美电影一区二区| 欧美日本在线播放| 欧美精品777| 日韩欧美视频一区|