bootstrap 檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,通過(guò)重復(fù)抽樣和計(jì)算統(tǒng)計(jì)量來(lái)評(píng)估樣本統(tǒng)計(jì)量差異的統(tǒng)計(jì)學(xué)意義。其步驟包括:1. 重復(fù)抽樣;2. 計(jì)算每個(gè)樣本的統(tǒng)計(jì)量;3. 創(chuàng)建統(tǒng)計(jì)量的抽樣分布;4. 計(jì)算原始統(tǒng)計(jì)量的 p 值;5. 根據(jù) p 值得出結(jié)論。
Bootstrap 檢驗(yàn)
什么是 Bootstrap 檢驗(yàn)?
Bootstrap 檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,用于評(píng)估樣本統(tǒng)計(jì)量的差異是否具有統(tǒng)計(jì)學(xué)意義。它通過(guò)在原始數(shù)據(jù)集中重復(fù)抽樣并計(jì)算每一次抽樣的統(tǒng)計(jì)量來(lái)估計(jì)統(tǒng)計(jì)量的抽樣分布。
Bootstrap 檢驗(yàn)的步驟
從原始數(shù)據(jù)集中重復(fù)抽樣:通過(guò)有放回抽樣的方法從原始數(shù)據(jù)集中隨機(jī)抽取多個(gè)樣本。
計(jì)算每個(gè)樣本的統(tǒng)計(jì)量:對(duì)于每一個(gè)抽取的樣本,計(jì)算感興趣的統(tǒng)計(jì)量,如均值、中位數(shù)或差異。
創(chuàng)建統(tǒng)計(jì)量的抽樣分布:收集所有重復(fù)抽樣計(jì)算出的統(tǒng)計(jì)量,并創(chuàng)建它們的分布直方圖。
計(jì)算原始統(tǒng)計(jì)量的 p 值:將原始數(shù)據(jù)集中計(jì)算出的統(tǒng)計(jì)量與抽樣分布進(jìn)行比較。p 值是原始統(tǒng)計(jì)量落在抽樣分布中極端的概率。
得出結(jié)論:如果 p 值小于預(yù)先設(shè)定的顯著性水平(通常為 0.05),則拒絕零假設(shè),即樣本統(tǒng)計(jì)量的差異具有統(tǒng)計(jì)學(xué)意義。
Bootstrap 檢驗(yàn)的優(yōu)點(diǎn)
無(wú)需對(duì)數(shù)據(jù)分布做出假設(shè)
對(duì)于小樣本數(shù)據(jù)更可靠
可以用于評(píng)估多種統(tǒng)計(jì)量
Bootstrap 檢驗(yàn)的缺點(diǎn)
可能計(jì)算密集,尤其是對(duì)于大型數(shù)據(jù)集
對(duì)于高度偏斜或具有異常值的數(shù)據(jù)可能不太準(zhǔn)確
不能用于評(píng)估參數(shù),如方差或標(biāo)準(zhǔn)差