1抽樣的定義
從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對全部樣品具有充分的代表性。
2抽樣的目的
抽樣的目的是從被抽取樣品單位的分析、研究結(jié)果來估計(jì)和推斷全部樣品特性,是科學(xué)實(shí)驗(yàn)、質(zhì)量檢驗(yàn)普遍采用的一種經(jīng)濟(jì)有效的工作和研究方法。
關(guān)于抽樣的這些基本概念你需要知道!
3基本概念
所考察對象的某一數(shù)值指標(biāo)的全體構(gòu)成的集合看作總體,構(gòu)成總體的每一個(gè)元素作為個(gè)體,從總體中抽取一部分的個(gè)體所組成的集合叫做樣本,樣本中的個(gè)體數(shù)目叫做樣本數(shù)量。
總體或抽樣總體:(population)
總體(population)通常與構(gòu)成它的元素共同定義:總體是指構(gòu)成它的所有元素的集合,而元素則是構(gòu)成總體的最基本單位。
比如,當(dāng)我們開展對某批發(fā)市場蔬菜農(nóng)產(chǎn)品質(zhì)量安全監(jiān)測時(shí),該批發(fā)市場的某一車普通白菜就是我們研究的總體,而該車上的每一顆普通白菜便是構(gòu)成總體的元素。
樣本(sample):樣本與總體相對應(yīng),是指用來代表總體的單位,樣本實(shí)際上是總體中某些單位的子集。樣本不是總體,但它應(yīng)代表總體,以抽樣的標(biāo)準(zhǔn)就是讓所選擇的樣本最大程度地代表總體。
抽樣單位或抽樣元素(sampling unit/element):
抽樣單位或抽樣元素是指收集信息的基本單位和進(jìn)行分析的元素。在農(nóng)產(chǎn)品質(zhì)量安全監(jiān)測中,常用的抽樣單位是個(gè)體的植株或果實(shí),它也可以是一定類型的群體。抽樣單位與抽樣元素有時(shí)是一致的,有時(shí)是不一致的。如在簡單抽樣中,它們是一致的,但在整群或多階段抽樣中,抽樣單位是群體,而每個(gè)群體單位中又包含許多抽樣元素。
參數(shù)值與統(tǒng)計(jì)值
參數(shù)值(parameter)也稱總體值,是指反映總體中某變量的特征值。例如某蔬菜大棚中所有番茄果實(shí)的三唑酮平均含量。但參數(shù)值多是理論值,難以具體確定。通常是根據(jù)樣本的統(tǒng)計(jì)值來推論總體的參數(shù)值。
統(tǒng)計(jì)值(statistic)也稱樣本值,是指對樣本中某變量特征的描述。它通常是實(shí)際統(tǒng)計(jì)分析的數(shù)值。例如,根據(jù)某一樣本資料可計(jì)算其三唑酮含量等。用樣本統(tǒng)計(jì)值去推論參數(shù)值時(shí),二者是一一對應(yīng)的。
常見的一些特征值
抽樣誤差(sampling error)
樣本統(tǒng)計(jì)值與所要推論的總體參數(shù)值之間的均差值就稱為抽樣誤差。這是由抽樣本身產(chǎn)生的誤差,它反映的是樣本對總體的表性程度,故又稱代表性誤差。
置信水平與置信區(qū)間(confidence level and interval)
置信水平和置信區(qū)間是與抽樣誤差密切相關(guān)的兩個(gè)概念。
置信水平,又稱置信度,是指總體參數(shù)值落在某一區(qū)間內(nèi)的概率。
而置信區(qū)間是指在某一置信水平下,用樣本統(tǒng)計(jì)值推論總體參數(shù)值的范圍。其大小與誤差密切相關(guān),置信區(qū)間越大,誤差也越大。
抽樣的基本程序包括:界定總體、樣本設(shè)計(jì)。
界定總體包括明確總體的范圍、內(nèi)容和時(shí)間。實(shí)際調(diào)查的總體與理論上設(shè)定的總體會(huì)有所不同,總體越復(fù)雜,二者的差別越大。抽樣總體有時(shí)不等于理論上的研究總體,樣本所代表的也只是明確界定的抽樣總體。
樣本設(shè)計(jì)包括確定樣本規(guī)模和選擇抽樣的具體方式。抽樣的目的是用樣本來代表總體,自然樣本數(shù)越大,其代表性越高。但樣本數(shù)越大,調(diào)查研究的成本也越大。因此,確定合適的樣本規(guī)模和抽樣方式是抽樣設(shè)計(jì)中的一項(xiàng)重要內(nèi)容。
樣本規(guī)模的確定:
確定樣本量的大小是比較復(fù)雜的問題,既要有定性的考慮也要有定量的考慮。
(1)定性方面的考慮
其考慮因素有:決策的重要性,調(diào)研的性質(zhì),變量個(gè)數(shù),數(shù)據(jù)分析的性質(zhì),同類研究中所用的樣本量,發(fā)生率,完成率,資源限制等。具體地說,更重要的決策,需要更多的信息和更準(zhǔn)確的信息,這就需要較大的樣本;探索性研究,樣本量一般較小,而結(jié)論性研究如描述性的調(diào)查,就需要較大的樣本;收集有關(guān)許多變量的數(shù)據(jù),樣本量就要大一些。
(2)定量方面的考慮
有具體的統(tǒng)計(jì)學(xué)公式,不同的抽樣方法有不同的公式。歸納起來,樣本量的大小主要取決于:
(1)研究對象的變化程度,即變異程度;
(2)要求和允許的誤差大小,即精度要求;
(3)要求推斷的置信度,一般情況下,置信度取為95%;
(4)總體的大??;
(5)抽樣的方法。
在無放回簡單隨機(jī)抽樣情況下,總體均值估計(jì)量的標(biāo)準(zhǔn)誤差的表達(dá)式:
其中,σ是總體的標(biāo)準(zhǔn)差。如果誤差界限設(shè)為e,那么:
這里Z是對應(yīng)于某一置信水平的標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)值。
為確定n,需要知道:期望的誤差界限e;置信水平;對應(yīng)的標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)值 Z;總體規(guī)模 N;總體方差σ2 ;其中,總體方差σ2是最不容易得到的,通常需要根據(jù)過去對類似總體所做的研究作近似計(jì)算。
常用的z值:
對于 90% 的置信度,對應(yīng)的z值為 1.64;
對于 95% 的置信度,對應(yīng)的z值為 1.96;
對于 99% 的置信度,對應(yīng)的z值為 2.56。
示例: