免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
算法數(shù)學(xué)基礎(chǔ)-統(tǒng)計(jì)的基本概念

這章開始我們開始介紹數(shù)理統(tǒng)計(jì)的內(nèi)容。概率論是研究的工具,那么數(shù)理統(tǒng)計(jì)就是研究的方法。大學(xué)里面概率論和統(tǒng)計(jì)是一門課,當(dāng)時(shí)其實(shí)根本沒有學(xué)明白,稀里糊涂?,F(xiàn)在來理解就是研究的工具和方法的關(guān)系,而研究的對象隨機(jī)現(xiàn)象。在概率論中,我們都假設(shè)某個(gè)隨機(jī)變量的分布是已知的,告知了我們一些性質(zhì)。而數(shù)理統(tǒng)計(jì)將帶來更多的未知,要解決概率論中那些個(gè)前提假設(shè)如何來的問題,教會(huì)我們?nèi)绾螐拇罅康臄?shù)據(jù)中找到規(guī)律、做出推斷,是更有用的部分。比如,我們從數(shù)據(jù)中發(fā)現(xiàn)可能一個(gè)隨機(jī)現(xiàn)象可以用正態(tài)分布來描述,那么這種感覺或者判斷在我們不了解全部信息的情況下是否正確呢?這就需要用到統(tǒng)計(jì)學(xué)的方法,求得模型的參數(shù)、為判斷提供依據(jù),告訴我們?nèi)绾螐挠^察中得到規(guī)律!個(gè)人覺得學(xué)習(xí)知識(shí)脈絡(luò)是最重要的,理清楚脈絡(luò)才能融會(huì)貫通,運(yùn)用自如。

我們先梳理一下統(tǒng)計(jì)的基本概念:

1、總體:試驗(yàn)的全部可能的觀察值;(是不是樣本空間呢?)

2、個(gè)體:每一個(gè)可能的觀察值;(是不是樣本點(diǎn)?)

3、容量:總體中包含的個(gè)體個(gè)數(shù);容量有限的稱為有限容量總體,無限容量的稱為無限總體。例如投擲硬幣,就是一個(gè)有限總體,而測量湖水深度就是一個(gè)無限總體。(連續(xù)隨機(jī)變量是有限總體么?)擔(dān)但這個(gè)劃分也不是絕對的,如果一個(gè)很大的量我們也可以將其近似看成無限的,比如測量全國人民身高14億人就可以近似看成無限總體。

通過上述定義就可以將現(xiàn)實(shí)中的樣本與概率中的概念聯(lián)系起來了??傮w對應(yīng)著就是我們的樣本空間,個(gè)體的觀察值(每一次試驗(yàn)結(jié)果)對應(yīng)樣本空間的樣本點(diǎn),我們可以用一個(gè)隨機(jī)變量來對應(yīng)這個(gè)樣本空間,通過研究隨機(jī)變量的分布函數(shù)和數(shù)字特征來研究總體的特點(diǎn)和規(guī)律。是不是很順啊!通過幾個(gè)定義,從概率論的概念對應(yīng)到了實(shí)際問題。這個(gè)就叫建模!把身邊的事情用數(shù)學(xué)模型來描述,是很爽的一件事,如果模型建對了你就可以解釋現(xiàn)象、預(yù)測未來了,哈哈哈哈。

舉個(gè)例子吧,比如我們生產(chǎn)了一批零件,這批零件就是一個(gè)總體,有合格的也有不合格的。如果我要了解這批零件的合格率但又不能全部每一個(gè)都測量一遍,我們就可以用一個(gè)隨機(jī)變量X來對應(yīng)(X代表這個(gè)零件的合格率),模型就建完了。接下來我們可以研究X的分布函數(shù)、數(shù)字特征了。如何研究呢?不知大家有沒有想起大數(shù)定律,如果有那么說明你前面的內(nèi)容掌握的不錯(cuò)了。我們可以采用抽樣幾批求平均的方法,通過小樣本的研究來近似總體的特征。這個(gè)就是統(tǒng)計(jì)學(xué)的方法了。

因?yàn)榭傮w的分布通常是未知的,一般都是通過抽樣的方法來獲得總體特征進(jìn)行推斷。所以抽樣概念及方法自然而然就需要提煉出來了。

4、樣本:從總體抽取一部分?jǐn)?shù)據(jù)對總體進(jìn)行推斷,被抽出的部分個(gè)體叫做樣本;

5、簡單隨機(jī)樣本:在相同條件在對總體進(jìn)行n次抽樣并記錄觀察值,每一次觀察值都是獨(dú)立的,而且與總體有相同的分布函數(shù),則稱為容量為n的簡單隨機(jī)樣本。也就是一個(gè)簡單隨機(jī)樣本包括了n個(gè)觀察值。比如我想考察北京市的人均收入,那簡單隨機(jī)樣本應(yīng)該怎么選呢?我就不能過多的考慮差異,按地區(qū)抽樣是比較合理的,因?yàn)椴煌藗兊牡赜蚍植伎梢约僭O(shè)是均勻的,高低收入人群的分是類似的。(可能例子不是太恰當(dāng),但是大家理解意思就好了),就是要求抽樣的前提一致,樣本之間無關(guān)聯(lián)。這樣我們就可以簡單求得總體分布(X1,X2,X3)=F(X1)*F(X2)...F(Xn)-假設(shè)樣本無關(guān),所以從獨(dú)立性的定義出發(fā)聯(lián)合分布的概率等于概率之積,即從樣本的分布得到了總體的分布。這是從部分感知總體的方法,但是約束也是很清晰的就是部分之間沒有聯(lián)系!

6、統(tǒng)計(jì)數(shù)據(jù)的圖形表示:直方圖、箱線圖。直方圖就不解釋了,就是將統(tǒng)計(jì)數(shù)據(jù)用曲線的形式表示出來,有很多例子比如圖像處理中的灰度圖就是典型的直方圖,橫坐標(biāo)是灰度縱坐標(biāo)是點(diǎn)數(shù),這種直方圖外部輪廓線從大數(shù)定律的角度出發(fā)接近于總體的概率密度函數(shù)。另外一種圖要多說兩句,叫箱線圖。箱線圖就是把數(shù)據(jù)分布表示在圖上的一種方法,非常有利于比較不同組數(shù)據(jù)之間的差異。分位點(diǎn)就是數(shù)據(jù)集的劃分,通常有第一分位點(diǎn)、第三分位點(diǎn),通俗理解就是將數(shù)據(jù)排序后得到的最大、最小、1/4大、1/2大、3/4大以及每個(gè)區(qū)間的數(shù)據(jù)個(gè)數(shù)用圖像表示出來。這樣不光可以看到數(shù)據(jù)的個(gè)數(shù),還可以知道數(shù)據(jù)按一個(gè)直觀分布情況。同時(shí)箱線圖還可以排除測試中的異常數(shù)值。箱線圖特別適合用于不同組之間的數(shù)據(jù)比較。如下圖,中間的黑線就是中位數(shù),我們可以看到這些房價(jià)的總體是平穩(wěn)的,99年的房價(jià)5萬元以下的比較集中,而2003年的房價(jià)6-10萬這個(gè)區(qū)間分布比較集中(此例為示意,勿當(dāng)真)。大家可以感受一下,箱線圖中表達(dá)的信息還是非常豐富的。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
概率論及數(shù)理統(tǒng)計(jì)習(xí)題Overleaf排版
第六章 數(shù)理統(tǒng)計(jì)的基本概念1
統(tǒng)計(jì)學(xué)基礎(chǔ)之總體與樣本
概率與統(tǒng)計(jì)
2018年高考數(shù)學(xué)提分秘籍 概率統(tǒng)計(jì)七大考點(diǎn)突破
高考數(shù)學(xué)糾錯(cuò)筆記-統(tǒng)計(jì)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服