首頁技術(shù)文章正文

常用的抽樣方法介紹

更新時(shí)間:2020-08-07 來源:黑馬程序員 瀏覽量:

學(xué)習(xí)目標(biāo)

·知道總體、樣本、樣本大小、樣本數(shù)量

·知道樣本統(tǒng)計(jì)量和總體統(tǒng)計(jì)量

·知道總體分布、樣本分布和抽樣分布

·知道常用的抽樣方法



某糖果公司研發(fā)了一種超長(zhǎng)效口香糖,為了得到口味持續(xù)時(shí)間的數(shù)據(jù),公司聘請(qǐng)了試吃者幫忙完成檢驗(yàn),結(jié)果卻讓人大跌眼鏡!

抽樣和抽樣方法


沒文化,真可怕!我該怎么辦?

有時(shí)候數(shù)據(jù)很容易收集,例如參加健身俱樂部的人的年齡,后這一家游戲公司的銷售數(shù)據(jù)。但有時(shí)候不太容易,該怎么辦呢?

是時(shí)候拿出終極武器了——抽樣

1.抽樣相關(guān)概念

總體:是指研究對(duì)象的整個(gè)群體。

·公司生產(chǎn)的一批糖果

抽樣

樣本:是從總體中選取的一部分,用于代表總體的整體情況。

·在這批糖果中隨機(jī)抽取50顆糖果

抽樣和方法

樣本數(shù)量:又叫樣本空間,是表示有多少個(gè)樣本。

·在這批糖果中隨機(jī)抽取50顆糖果,抽5次:樣本數(shù)量=5

樣本方法


樣本大?。阂步?strong>樣本容量,表示每個(gè)樣本里有多少個(gè)數(shù)據(jù)。

·每個(gè)樣本50顆糖果:樣本大小=50

統(tǒng)計(jì)量:

統(tǒng)計(jì)量是對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)得到的量,例如:均值、方差、標(biāo)準(zhǔn)差、比例等。

總體統(tǒng)計(jì)量:總體XX

對(duì)總體進(jìn)行統(tǒng)計(jì)得到的統(tǒng)計(jì)量

·總體均值$$\mu$$:整批所有糖果數(shù)據(jù)的均值

·總體方差$$\sigma^2$$:整批所有糖果數(shù)據(jù)的方差

樣本統(tǒng)計(jì)量:樣本XX

對(duì)樣本進(jìn)行統(tǒng)計(jì)得到的統(tǒng)計(jì)量

·樣本均值$$\bar{X}$$:抽取的某個(gè)樣本糖果數(shù)據(jù)的均值

·樣本方差$$S^2$$:抽取的某個(gè)樣本糖果數(shù)據(jù)的方差

分布:

·總體分布

總體數(shù)據(jù)的概率分布:整批所有糖果數(shù)據(jù)的概率分布

·往往未知,很多時(shí)候無法獲得總體所有元素的觀測(cè)值

·可以通過理論計(jì)算進(jìn)行假定

樣本分布

抽取的樣本中數(shù)據(jù)的概率分布:抽取的某個(gè)樣本糖果數(shù)據(jù)的概率分布

假設(shè)總體大小為m,樣本大小為n,n趨近于m時(shí),樣本分布趨近于總體分布

·樣本分布又稱經(jīng)驗(yàn)分布

·注意:樣本分布與總體分布近似(抽樣正確的前提下)

抽樣分布

對(duì)樣本統(tǒng)計(jì)量概率分布的一種描述:所有樣本均值的概率分布

抽樣分布


2.抽樣方法

抽樣的目的是為了通過樣本獲得總體的信息,所以關(guān)鍵點(diǎn)是怎么抽樣才能保證獲得的樣本具有代表性,下面,我們簡(jiǎn)單介紹幾種常用的抽樣方法。

·簡(jiǎn)單隨機(jī)抽樣(simple random sampling)。原理和我們抽撲克牌、抽獎(jiǎng)一樣,就是從一個(gè)固定的總體中(比如有N個(gè)對(duì)象),利用抽簽或其他隨機(jī)方法(如隨機(jī)數(shù)表)抽取n個(gè)對(duì)象。所謂隨機(jī),是指總體中每一個(gè)對(duì)象被抽中的概率相等。假設(shè)兩個(gè)人抽撲克牌比大小,兩個(gè)人抽中大王的概率其實(shí)一樣,都是1/54。

·系統(tǒng)抽樣(systematic sampling)。這種抽樣方法的核心在于確定一個(gè)所謂的“抽樣間隔”。比如將總體對(duì)象隨機(jī)編號(hào),從1至100,我們只抽取編號(hào)個(gè)位數(shù)是7的對(duì)象,即編號(hào)為7,17,27,…的樣本,本質(zhì)上他們相鄰的編號(hào)有一個(gè)固定的間隔——10。

·分層抽樣(stratified sampling),是指先將總體按照某種特征分為若干層,比如按照性別分為男女兩層,然后再?gòu)拿恳粚觾?nèi)進(jìn)行簡(jiǎn)單隨機(jī)抽樣。分層的目的就在于提升樣本對(duì)總體的代表性,提高估計(jì)的精確度,比如一般的理工院校男生多女生少,采用分層抽樣可以保證男性和女性樣本都能被抽中。

·整群抽樣(cluster sampling),是將總體分成幾個(gè)群,比如我國(guó)開展的大型調(diào)查一般會(huì)以省或地區(qū)為群,先采用簡(jiǎn)單隨機(jī)抽樣的方法抽取群,然后從抽中的群中再抽取相關(guān)的個(gè)體進(jìn)行研究?,F(xiàn)實(shí)過程中可以將抽中的群中的所有對(duì)象作為研究樣本,也可以在群內(nèi)部再次進(jìn)行抽樣獲得部分調(diào)查對(duì)象作為樣本。

3.小結(jié)

抽樣相關(guān)概念 【知道】

·總體:是指研究對(duì)象的整個(gè)群體。

·樣本:從總體中選取的一部分

·樣本大?。好總€(gè)樣本里有多少個(gè)數(shù)據(jù)

·樣本數(shù)量:表示有多少個(gè)樣本。

統(tǒng)計(jì)量

總體XX

·總體均值$$\mu$$

·總體方差$$\sigma^2$$

樣本XX

·樣本均值$$\bar{X}$$

·樣本方差$$S^2$$

分布:

·總體分布

·樣本分布

·抽樣分布

抽樣方法 【知道】

·簡(jiǎn)單隨機(jī)抽樣:隨機(jī)抽

·系統(tǒng)抽樣:等間隔抽

·分層抽樣:每種分別抽

·整群抽樣:直接抽一撥


猜你喜歡:

Python編程加入日志的方法

“?!笔鞘裁?如何實(shí)現(xiàn)一個(gè)“棧”?

Python培訓(xùn)課程

分享到:
在線咨詢 我要報(bào)名
和我們?cè)诰€交談!