校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > 幾道和「黑洞照片」那種海量數據有關的算法問題

幾道和「黑洞照片」那種海量數據有關的算法問題

熱門標簽:地圖標注審核工作怎么樣注冊 鄭州中國移動400電話申請 無錫電銷機器人銷售 招聘信息 地圖標注植物名稱 去哪里辦卡 南召400電話辦理資費 揭陽外呼系統公司 熱血傳奇沃瑪森林地圖標注 福建ai電銷機器人加盟公司

昨晚被一則新聞刷屏:北京時間 4 月 10 日今晚 9 點,人類首張黑洞照片正式發布。

看到這張圖片,小吳心里是極為震撼的:愛因斯坦太太太太太牛逼了!!!

同時,看新聞的時候小吳還注意到里面有個細節,給黑洞”拍照“的事件視界望遠鏡從 2017 年就開始為黑洞拍照了,但直到 2019 年才公布。

心里不禁納悶:為什么給黑洞拍照需要這么長時間?

于是去更加詳細的搜索資料,果然發現了端倪,其中一個點就是 望遠鏡觀測到的數據量非常龐大 !

2017 年時 8 個望遠鏡的數據量達到了 10PB(=10240TB),2018 年又增加了格陵蘭島望遠鏡,數據量繼續增加。龐大的數據量為處理讓數據處理的難度不斷加大。

平時面試的時候老是說海量數據,海量數據,這次的數據真的是海量數據了。

這次的數據流之大,導致每個射電望遠鏡產生的數據,都只能用硬盤來儲存。

那么現在問題來了,假設你作為給黑洞拍照的研發人員,給你一臺內存有限的計算機,你如何找出這些數據的中位數或者判斷某個數字是否存在里面。

1. 海量數據查找中位數

題目描述

現在有 10 億個 int 型的數字( java 中 int 型占 4B),以及一臺可用內存為 1GB 的機器,如何找出這 10 億個數字的中位數?

所謂中位數就是有序列表中間的數。如果列表長度是偶數,中位數則是中間兩個數的平均值。

題目解析

題目中有 10 億個數字,每個數字在內存中占 4B,那么這 10 億個數字完全加載到內存中需要:10 * 10^8 * 4,大概需要 4GB 的存儲空間。根據題目的限制,顯然不能把所有的數字都裝入內存中。

這里,可以采用基于 二進制位比較 和 快速排序算法中的 分割思想 來尋找中位數,實際上這也是 桶排序 的一種應用。

桶排序

假設將這 10 億個數字保存在一個大文件中,依次讀一部分文件到內存(不超過內存的限制: 1GB ),將每個數字用二進制表示,比較二進制的最高位(第 32 位),如果數字的最高位為 0,則將這個數字寫入 file_0 文件中;如果最高位為 1,則將該數字寫入 file_1 文件中。

注意:最高位為符號位,也就是說 file_1 中的數都是負數,而 file_0 中的數都是正數。

通過這樣的操作,這 10 億個數字分成了兩個文件,假設 file_0 文件中有 6 億個數字,而 file_1 文件中有 4 億個數字。

這樣劃分后,思考一下:所求的中位數在哪個文件中?

10 億個數字的中位數是10 億個數排序之后的第 5 億個數,現在 file_0 有 6 億個正數,file_1 有 4 億個負數,file_0 中的數都比 file_1 中的數要大,排序之后的第 5 億個數一定是正數,那么排序之后的第 5 億個數一定位于file_0中。

也就是說:中位數就在 file_0 文件中,并且是 file_0 文件中所有數字排序之后的第 1 億個數字。

現在,我們只需要處理 file_0 文件了(不需要再考慮 file_1 文件)。

而對于 file_0 文件,可以同樣的采取上面的措施處理:將 file_0 文件依次讀一部分到內存(不超內存限制:1GB ),將每個數字用二進制表示,比較二進制的 次高位(第 31 位),如果數字的次高位為 0,寫入 file_0_0 文件中;如果次高位為 1 ,寫入 file_0_1 文件中。

現假設 file_0_0 文件中有 3 億個數字,file_0_1中也有 3 億個數字,則中位數就是:file_0_0 文件中的數字從小到大排序之后的第 1 億個數字。

拋棄 file_0_1 文件,繼續對 file_0_0 文件 根據次次高位(第 30 位) 劃分,假設此次劃分的兩個文件為:file_0_0_0中有 0.5 億個數字,file_0_0_1 中有 2.5 億個數字,那么中位數就是 file_0_0_1 文件中的所有數字排序之后的第 0.5 億個數。

2. 海量數據中判斷數字是否存在

題目描述

現在有 10 億個 int 型的數字( java 中 int 型占 4B),以及一臺可用內存為 1GB 的機器,給出一個整數,問如果快速地判斷這個整數是否在這 10 億數字中?

題目分析

這里可以使用 布隆過濾器 進行處理。

布隆過濾器(英語:Bloom Filter)是 1970 年由 Burton Bloom 提出的。

它實際上是一個很長的二進制矢量和一系列隨機映射函數。

它可以用來判斷一個元素是否在一個集合中。它的優勢是只需要占用很小的內存空間以及有著高效的查詢效率。

對于布隆過濾器而言,它的本質是一個位數組:位數組就是數組的每個元素都只占用 1 bit ,并且每個元素只能是 0 或者 1。

一開始,布隆過濾器的位數組所有位都初始化為 0。比如,數組長度為 m ,那么將長度為 m 個位數組的所有的位都初始化為 0。

0 0 0 0 0 0 0 0 0 0
0 0 1 m-2 m-1

在數組中的每一位都是二進制位。

布隆過濾器除了一個位數組,還有 K 個哈希函數。當一個元素加入布隆過濾器中的時候,會進行如下操作:

使用 K 個哈希函數對元素值進行 K 次計算,得到 K 個哈希值。根據得到的哈希值,在位數組中把對應下標的值置為 1。

圖 1

舉個例子,假設布隆過濾器有 3 個哈希函數:f1, f2, f3 和一個位數組 arr。現在要把 2333 插入布隆過濾器中:

對值進行三次哈希計算,得到三個值 n1, n2, n3。把位數組中三個元素 arr[n1], arr[n2], arr[3] 都置為 1。

當要判斷一個值是否在布隆過濾器中,對元素進行三次哈希計算,得到值之后判斷位數組中的每個元素是否都為 1,如果值都為 1,那么說明這個值在布隆過濾器中,如果存在一個值不為 1,說明該元素不在布隆過濾器中。

布隆

總結

以上所述是小編給大家介紹的幾道和「黑洞照片」那種海量數據有關的算法問題,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

您可能感興趣的文章:
  • Python數據結構與算法之圖的最短路徑(Dijkstra算法)完整實例
  • JS實現的數組去除重復數據算法小結
  • Python數據結構與算法之圖結構(Graph)實例分析
  • C++數據結構與算法之雙緩存隊列實現方法詳解

標簽:文山 南昌 鹽城 黔南 桂林 宣城 東莞 景德鎮

巨人網絡通訊聲明:本文標題《幾道和「黑洞照片」那種海量數據有關的算法問題》,本文關鍵詞  幾道,和,黑洞,照片,那種,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《幾道和「黑洞照片」那種海量數據有關的算法問題》相關的同類信息!
  • 本頁收集關于幾道和「黑洞照片」那種海量數據有關的算法問題的相關信息資訊供網民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    精品一区二区三区不卡| 中文字幕一区二区不卡| 青青草精品视频| 日韩一区二区高清| 麻豆久久一区二区| 亚洲国产成人午夜在线一区| 99久久久无码国产精品| 亚洲成年人网站在线观看| 欧美一二三区精品| 国产福利一区二区三区在线视频| 国产精品理论在线观看| 91麻豆.com| 蜜桃av一区二区| 中文字幕的久久| 欧美性生活影院| 黄色精品一二区| 亚洲色图欧洲色图婷婷| 欧美日韩一区二区三区四区| 精品亚洲欧美一区| 17c精品麻豆一区二区免费| 欧美天堂一区二区三区| 韩国三级在线一区| 日韩理论片一区二区| 91精品国产乱| 97久久精品人人做人人爽50路| 五月天激情综合| 欧美一级欧美三级| 狠狠色狠狠色合久久伊人| 中文字幕视频一区| 欧美一区二区精品| 色婷婷av一区二区三区gif| 开心九九激情九九欧美日韩精美视频电影| 国产网站一区二区| 欧美福利视频一区| 92国产精品观看| 国产精品影视网| 日韩电影在线观看一区| 中文字幕人成不卡一区| 精品国产青草久久久久福利| 97精品视频在线观看自产线路二 | 香蕉成人伊视频在线观看| 久久精品夜色噜噜亚洲aⅴ| 欧美日韩综合在线| 成人黄色av网站在线| 久久99蜜桃精品| 亚洲444eee在线观看| 亚洲三级在线播放| 国产婷婷色一区二区三区在线| 欧美色综合网站| 99久久婷婷国产| 高清av一区二区| 久久精品理论片| 亚洲成人自拍网| 亚洲久草在线视频| 国产精品夫妻自拍| 中文一区二区完整视频在线观看| 日韩欧美专区在线| 色美美综合视频| 日韩免费视频线观看| 欧美天堂亚洲电影院在线播放| 99精品国产一区二区三区不卡| 久久99久久久欧美国产| 免费一级片91| 日韩成人免费看| 天天操天天色综合| 性欧美大战久久久久久久久| 亚洲男人天堂av| 亚洲特级片在线| 国产精品全国免费观看高清| 久久久精品影视| 国产视频一区在线观看| 2022国产精品视频| 欧美精品一区二区三区在线播放| 欧美一区二区高清| 日韩女优av电影| 精品精品国产高清一毛片一天堂| 欧美一级xxx| 欧美精品一区二区三区蜜桃| 欧美成人精品福利| 久久精品日韩一区二区三区| 久久久久久久久伊人| 国产日韩欧美综合在线| 中文欧美字幕免费| 亚洲乱码国产乱码精品精98午夜| 亚洲欧美色图小说| 一片黄亚洲嫩模| 亚洲.国产.中文慕字在线| 图片区日韩欧美亚洲| 六月丁香综合在线视频| 精品一区二区在线播放| 国产精品一区一区| av色综合久久天堂av综合| 99re视频精品| 7777精品伊人久久久大香线蕉最新版| 日韩国产高清在线| 美女网站色91| 国产成人在线看| 91黄色免费看| 日韩片之四级片| 国产精品久久99| 亚洲一区二区精品久久av| 视频一区二区欧美| 国产精品99久久久久久有的能看| 成人免费毛片嘿嘿连载视频| 99re免费视频精品全部| 制服丝袜中文字幕亚洲| 国产欧美日韩久久| 亚洲成人1区2区| 国产成人亚洲综合a∨猫咪| 一本一道久久a久久精品 | 日韩精品欧美成人高清一区二区| 青娱乐精品视频在线| 国产69精品久久99不卡| 欧美色区777第一页| 久久久美女艺术照精彩视频福利播放| 中文字幕av不卡| 日韩国产精品久久| 成人免费福利片| 日韩视频免费观看高清完整版 | 精品国一区二区三区| 亚洲色图制服丝袜| 久久99久久99小草精品免视看| av电影在线观看完整版一区二区| 91精品国产全国免费观看| 国产精品不卡一区二区三区| 免费成人av在线| 91在线观看免费视频| 欧美不卡123| 亚洲成a人片综合在线| 成人性生交大片免费| 欧美精品 日韩| 国产精品的网站| 韩国欧美国产1区| 制服视频三区第一页精品| 国产精品电影院| 国产一区高清在线| 日韩一区二区三区视频在线观看| 成人欧美一区二区三区小说| 国产一区欧美一区| 91精品国产91久久综合桃花| 玉米视频成人免费看| 丁香婷婷综合激情五月色| 日韩欧美中文字幕精品| 亚洲高清不卡在线观看| 91在线云播放| 亚洲欧美一区二区在线观看| 成人免费毛片app| 精品嫩草影院久久| 免费一区二区视频| 91精品国产综合久久婷婷香蕉| 日韩毛片精品高清免费| 成人激情av网| 国产精品欧美经典| 国产91富婆露脸刺激对白| 欧美电影免费观看高清完整版| 日韩中文欧美在线| 777色狠狠一区二区三区| 午夜日韩在线观看| 欧美日韩精品三区| 天天爽夜夜爽夜夜爽精品视频| 日本精品一区二区三区高清| 中文字幕在线观看不卡视频| 国产成人小视频| 久久久国际精品| 懂色av一区二区在线播放| 国产清纯白嫩初高生在线观看91 | 成人黄页在线观看| 中文字幕欧美激情一区| 成人视屏免费看| 国产精品福利一区二区三区| 99久久伊人精品| 一区二区高清在线| 欧美日韩一区国产| 日韩制服丝袜av| 久久综合久久综合亚洲| 国产露脸91国语对白| 国产精品欧美一区喷水| 色菇凉天天综合网| 香蕉成人伊视频在线观看| 欧美sm美女调教| 大尺度一区二区| 一区二区三区四区在线播放| 欧美图片一区二区三区| 秋霞影院一区二区| 久久久久国产一区二区三区四区| 成人免费高清在线| 亚洲午夜久久久| 欧美大片在线观看| av动漫一区二区| 三级在线观看一区二区 | 91在线视频观看| 夜夜嗨av一区二区三区四季av| 欧美亚洲国产bt| 极品美女销魂一区二区三区免费| 中文字幕 久热精品 视频在线| 色综合久久久久综合99| 日本不卡中文字幕| 国产欧美1区2区3区| 欧美三日本三级三级在线播放| 美女www一区二区|