校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > Python實現(xiàn)8種常用抽樣方法

Python實現(xiàn)8種常用抽樣方法

熱門標簽:長春極信防封電銷卡批發(fā) 如何地圖標注公司 外賣地址有什么地圖標注 電銷機器人錄音要學(xué)習(xí)什么 上海正規(guī)的外呼系統(tǒng)最新報價 企業(yè)彩鈴地圖標注 煙臺電話外呼營銷系統(tǒng) 預(yù)覽式外呼系統(tǒng) 銀川電話機器人電話

今天來和大家聊聊抽樣的幾種常用方法,以及在Python中是如何實現(xiàn)的。

抽樣是統(tǒng)計學(xué)、機器學(xué)習(xí)中非常重要,也是經(jīng)常用到的方法,因為大多時候使用全量數(shù)據(jù)是不現(xiàn)實的,或者根本無法取到。所以我們需要抽樣,比如在推斷性統(tǒng)計中,我們會經(jīng)常通過采樣的樣本數(shù)據(jù)來推斷估計總體的樣本。

上面所說的都是以概率為基礎(chǔ)的,實際上還有一類非概率的抽樣方法,因此總體上歸納為兩大種類:

概率抽樣:根據(jù)概率理論選擇樣本,每個樣本有相同的概率被選中。

非概率抽樣:根據(jù)非隨機的標準選擇樣本,并不是每個樣本都有機會被選中。

概率抽樣技術(shù)

1.隨機抽樣(Random Sampling)

這也是最簡單暴力的一種抽樣了,就是直接隨機抽取,不考慮任何因素,完全看概率。并且在隨機抽樣下,總體中的每條樣本被選中的概率相等。

比如,現(xiàn)有10000條樣本,且各自有序號對應(yīng)的,假如抽樣數(shù)量為1000,那我就直接從1-10000的數(shù)字中隨機抽取1000個,被選中序號所對應(yīng)的樣本就被選出來了。

Python中,我們可以用random函數(shù)隨機生成數(shù)字。下面就是從100個人中隨機選出5個。

import random
population = 100
data = range(population)
print(random.sample(data,5))
> 4, 19, 82, 45, 41

2.分層抽樣(Stratified Sampling)

分層抽樣其實也是隨機抽取,不過要加上一個前提條件了。在分層抽樣下,會根據(jù)一些共同屬性將帶抽樣樣本分組,然后從這些分組中單獨再隨機抽樣。

因此,可以說分層抽樣是更精細化的隨機抽樣,它要保持與總體群體中相同的比例。 比如,機器學(xué)習(xí)分類標簽中的類標簽0和1,比例為3:7,為保持原有比例,那就可以分層抽樣,按照每個分組單獨隨機抽樣。

Python中我們通過train_test_split設(shè)置stratify參數(shù)即可完成分層操作。

from sklearn.model_selection import train_test_split

stratified_sample, _ = train_test_split(population, test_size=0.9, stratify=population[['label']])
print (stratified_sample)

3.聚類抽樣(Cluster Sampling)

聚類抽樣,也叫整群抽樣。它的意思是,先將整個總體劃分為多個子群體,這些子群體中的每一個都具有與總體相似的特征。也就是說它不對個體進行抽樣,而是隨機選擇整個子群體。

Python可以先給聚類的群體分配聚類ID,然后隨機抽取兩個子群體,再找到相對應(yīng)的樣本值即可,如下。

import numpy as np
clusters=5
pop_size = 100
sample_clusters=2
# 間隔為 20, 從 1 到 5 依次分配集群100個樣本的聚類 ID,這一步已經(jīng)假設(shè)聚類完成
cluster_ids = np.repeat([range(1,clusters+1)], pop_size/clusters)
# 隨機選出兩個聚類的 ID
cluster_to_select = random.sample(set(cluster_ids), sample_clusters)
# 提取聚類 ID 對應(yīng)的樣本
indexes = [i for i, x in enumerate(cluster_ids) if x in cluster_to_select]
# 提取樣本序號對應(yīng)的樣本值
cluster_associated_elements = [el for idx, el in enumerate(range(1, 101)) if idx in indexes]
print (cluster_associated_elements)

4.系統(tǒng)抽樣(Systematic Sampling)

系統(tǒng)抽樣是以預(yù)定的規(guī)則間隔(基本上是固定的和周期性的間隔)從總體中抽樣。比如,每 9 個元素抽取一下。一般來說,這種抽樣方法往往比普通隨機抽樣方法更有效。

下圖是按順序?qū)γ?9 個元素進行一次采樣,然后重復(fù)下去。

Python實現(xiàn)的話可以直接在循環(huán)體中設(shè)置step即可。

population = 100
step = 5
sample = [element for element in range(1, population, step)]
print (sample)

5.多級采樣(Multistage sampling)

在多階段采樣下,我們將多個采樣方法一個接一個地連接在一起。比如,在第一階段,可以使用聚類抽樣從總體中選擇集群,然后第二階段再進行隨機抽樣,從每個集群中選擇元素以形成最終集合。

Python代碼復(fù)用了上面聚類抽樣,只是在最后一步再進行隨機抽樣即可。

import numpy as np
clusters=5
pop_size = 100
sample_clusters=2
sample_size=5
# 間隔為 20, 從 1 到 5 依次分配集群100個樣本的聚類 ID,這一步已經(jīng)假設(shè)聚類完成
cluster_ids = np.repeat([range(1,clusters+1)], pop_size/clusters)
# 隨機選出兩個聚類的 ID
cluster_to_select = random.sample(set(cluster_ids), sample_clusters)
# 提取聚類 ID 對應(yīng)的樣本
indexes = [i for i, x in enumerate(cluster_ids) if x in cluster_to_select]
# 提取樣本序號對應(yīng)的樣本值
cluster_associated_elements = [el for idx, el in enumerate(range(1, 101)) if idx in indexes]
# 再從聚類樣本里隨機抽取樣本
print (random.sample(cluster_associated_elements, sample_size))

非概率抽樣技術(shù)

非概率抽樣,毫無疑問就是不考慮概率的方式了,很多情況下是有條件的選擇。因此,對于無隨機性我們是無法通過統(tǒng)計概率和編程來實現(xiàn)的。這里也介紹3種方法。

1.簡單采樣(convenience sampling)

簡單采樣,其實就是研究人員只選擇最容易參與和最有機會參與研究的個體。比如下面的圖中,藍點是研究人員,橙色點則是藍色點附近最容易接近的人群。

2.自愿抽樣(Voluntary Sampling)

自愿抽樣下,感興趣的人通常通過填寫某種調(diào)查表格形式自行參與的。所以,這種情況中,調(diào)查的研究人員是沒有權(quán)利選擇任何個體的,全憑群體的自愿報名。比如下圖中藍點是研究人員,橙色的是自愿同意參與研究的個體。

3.雪球抽樣(Snowball Sampling)

雪球抽樣是說,最終集合是通過其他參與者選擇的,即研究人員要求其他已知聯(lián)系人尋找愿意參與研究的人。比如下圖中藍點是研究人員,橙色的是已知聯(lián)系人,黃色是是橙色點周圍的其它聯(lián)系人。

總結(jié)

以上就是8種常用抽樣方法,平時工作中比較常用的還是概率類抽樣方法,因為沒有隨機性我們是無法通過統(tǒng)計學(xué)和編程完成自動化操作的。

比如在信貸的風(fēng)控樣本設(shè)計時,就需要從樣本窗口通過概率進行抽樣。因為采樣的質(zhì)量基本就決定了你模型的上限了,所以在抽樣時會考慮很多問題,如樣本數(shù)量、是否有顯著性、樣本穿越等等。在這時,一個良好的抽樣方法是至關(guān)重要的。

到此這篇關(guān)于Python實現(xiàn)8種常用抽樣方法的文章就介紹到這了,更多相關(guān)Python 抽樣方法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python使用pandas抽樣訓(xùn)練數(shù)據(jù)中某個類別實例
  • python實現(xiàn)的分層隨機抽樣案例
  • python數(shù)據(jù)預(yù)處理 :數(shù)據(jù)抽樣解析
  • 基于python進行抽樣分布描述及實踐詳解
  • python Pandas如何對數(shù)據(jù)集隨機抽樣

標簽:上饒 湖北 西寧 盤錦 潮州 珠海 佳木斯 宜昌

巨人網(wǎng)絡(luò)通訊聲明:本文標題《Python實現(xiàn)8種常用抽樣方法》,本文關(guān)鍵詞  Python,實現(xiàn),8種,常用,抽樣,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python實現(xiàn)8種常用抽樣方法》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python實現(xiàn)8種常用抽樣方法的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃
    91污在线观看| 成人高清在线视频| 亚洲人吸女人奶水| 亚洲私人影院在线观看| 国产精品麻豆欧美日韩ww| 欧美国产一区视频在线观看| 久久九九国产精品| 亚洲国产精品t66y| 亚洲另类在线视频| 亚洲一区二区三区中文字幕在线| 亚洲欧美欧美一区二区三区| 中文字幕综合网| 亚洲一区二区三区四区在线免费观看 | 欧美偷拍一区二区| 欧美色图片你懂的| 91精品国产综合久久香蕉麻豆| 在线播放/欧美激情| 日韩欧美成人午夜| 久久午夜免费电影| 最新不卡av在线| 性欧美疯狂xxxxbbbb| 日韩成人dvd| 国产精品夜夜爽| 色久综合一二码| 91麻豆精品91久久久久久清纯| 2023国产精品视频| 亚洲午夜免费福利视频| 精品在线视频一区| 99国产精品久久久久久久久久| 日本久久精品电影| 2021中文字幕一区亚洲| 亚洲少妇最新在线视频| 青娱乐精品在线视频| 成人av免费观看| 日韩网站在线看片你懂的| 中文字幕成人网| 亚洲高清免费观看高清完整版在线观看| 七七婷婷婷婷精品国产| 国产精品一区二区免费不卡| 欧美日韩一区二区三区四区| 国产农村妇女毛片精品久久麻豆| 亚洲成人一区二区| 99在线精品视频| 精品久久久久久久久久久久包黑料| 中文字幕一区二区不卡| 久久爱www久久做| 欧美婷婷六月丁香综合色| 中文一区二区在线观看| 久久国产人妖系列| 欧美精品日韩综合在线| 亚洲色图19p| 国产成人在线视频网站| 日韩精品一区二区三区中文精品| 一区二区在线电影| www.欧美日韩| 国产精品毛片高清在线完整版| 另类调教123区| 7777精品伊人久久久大香线蕉超级流畅 | 欧美一级欧美三级在线观看| 中文字幕日本乱码精品影院| 国产九色精品成人porny| 欧美精品一级二级| 性感美女极品91精品| 91国内精品野花午夜精品| 中文字幕第一区综合| 国产在线精品一区二区不卡了 | 欧美一区二区精品| 午夜视频一区在线观看| 欧美日韩三级一区| 午夜激情久久久| 欧美理论在线播放| 日本人妖一区二区| 欧美大片在线观看| 老司机精品视频一区二区三区| 制服丝袜av成人在线看| 麻豆精品一区二区三区| 精品裸体舞一区二区三区| 久久se精品一区精品二区| 日韩一区二区在线看片| 美女视频黄 久久| 久久理论电影网| 成人综合激情网| 18成人在线视频| 欧美天天综合网| 日本欧美一区二区在线观看| 欧美成人性福生活免费看| 国内精品伊人久久久久av一坑 | 性做久久久久久免费观看欧美| 欧美调教femdomvk| 另类的小说在线视频另类成人小视频在线 | 色88888久久久久久影院野外| 成人免费在线观看入口| 欧美性大战久久久久久久| 日本午夜精品一区二区三区电影| 欧美一级日韩免费不卡| 福利一区福利二区| 亚洲欧美另类综合偷拍| 欧美精品一二三四| 成人午夜视频在线| 一区二区国产视频| 精品久久久久av影院| av在线这里只有精品| 亚洲成人动漫在线观看| 久久亚洲影视婷婷| 欧美在线免费观看视频| 久久精品国产亚洲高清剧情介绍 | 91污在线观看| 久久国产尿小便嘘嘘| 国产精品国产三级国产普通话99| 欧美日韩亚洲不卡| 成人午夜av在线| 亚洲123区在线观看| 国产亚洲1区2区3区| 欧美揉bbbbb揉bbbbb| 国产成人免费av在线| 日韩精品每日更新| 国产精品理论在线观看| 日韩欧美一区在线| 在线观看成人小视频| 国产成人超碰人人澡人人澡| 天天综合网 天天综合色| 亚洲欧洲日韩综合一区二区| 欧美一卡二卡在线| 欧美三级日韩三级国产三级| 成人黄色片在线观看| 久久97超碰国产精品超碰| 亚洲免费观看高清完整版在线观看| 精品美女被调教视频大全网站| 色天天综合色天天久久| 丁香激情综合国产| 裸体一区二区三区| 天天综合网 天天综合色| 亚洲男人天堂av| 亚洲国产成人一区二区三区| 日韩欧美国产一区二区三区| 欧美色图片你懂的| 99久久国产综合精品女不卡| 国产精品一区二区久久精品爱涩| 午夜激情一区二区三区| 亚洲一区二区高清| 亚洲综合男人的天堂| 亚洲特级片在线| 国产精品福利影院| 国产精品视频线看| 国产欧美日韩在线| 久久精品男人的天堂| 久久久国际精品| 久久久久国产精品厨房| 精品久久久久久亚洲综合网| 欧美一区二区视频在线观看2020 | 欧美极品另类videosde| 久久女同精品一区二区| 久久蜜桃av一区二区天堂| 2024国产精品| 国产精品人妖ts系列视频| 国产欧美精品一区二区色综合朱莉| 欧美xxxx老人做受| 国产午夜精品一区二区三区四区| 久久久精品综合| 国产精品久久久久永久免费观看| 国产精品久久久久久久久搜平片 | 欧美视频一区在线观看| 欧美午夜精品一区二区蜜桃 | 久久久精品免费网站| 欧美激情一区二区三区不卡| 国产精品人成在线观看免费| 综合久久久久综合| 亚洲高清一区二区三区| 毛片av一区二区| 国产电影一区二区三区| 97精品国产97久久久久久久久久久久| 99re成人在线| 欧美日韩久久不卡| 日韩欧美成人激情| 国产精品色呦呦| 亚洲一区二区在线播放相泽| 欧美aaa在线| 成人av动漫网站| 欧美日韩一二三| 国产午夜精品一区二区| 亚洲综合另类小说| 国产综合成人久久大片91| 99久久精品免费看| 91精品国产入口在线| 国产精品萝li| 青青草成人在线观看| 不卡免费追剧大全电视剧网站| 欧美在线你懂的| 亚洲高清视频在线| 狠狠狠色丁香婷婷综合激情| 91麻豆国产自产在线观看| 欧美一区二区三级| 亚洲蜜臀av乱码久久精品蜜桃| 青青草原综合久久大伊人精品| 丰满亚洲少妇av| 日韩一区二区免费电影| 亚洲激情成人在线| 国产精品99久久久久久似苏梦涵| 欧美亚洲一区二区三区四区| 欧美激情资源网|