免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
馬爾可夫鏈
歷史

馬爾可夫鏈的提出來自俄國數(shù)學(xué)家安德雷·馬爾可夫(Андрей Андреевич Марков)。馬爾可夫在1906-1907年間發(fā)表的研究中為了證明隨機(jī)變量間的獨立性不是弱大數(shù)定律(weak law of large numbers)和中心極限定理(central limit theorem)成立的必要條件,構(gòu)造了一個按條件概率相互依賴的隨機(jī)過程,并證明其在一定條件下收斂于一組向量,該隨機(jī)過程被后世稱為馬爾可夫鏈     。

在馬爾可夫鏈被提出之后,Tatiana Afanasyeva和保羅·埃倫費斯特(Paul Ehrenfest)在1907年使用馬爾可夫鏈建立了Ehrenfest擴(kuò)散模型(Ehrenfest model of diffusion)   。1912年亨利·龐加萊(Jules Henri Poincaré)研究了有限群上的馬爾可夫鏈并得到了龐加萊不等式(Poincaré inequality)   。

1931年,安德雷·柯爾莫哥洛夫(Андрей Николаевич Колмогоров)在對擴(kuò)散問題的研究中將馬爾可夫鏈推廣至連續(xù)指數(shù)集得到了連續(xù)時間馬爾可夫鏈,并推出了其聯(lián)合分布函數(shù)的計算公式   。獨立于柯爾莫哥洛夫,1926年,Sydney Chapman在研究布朗運動時也得到了該計算公式,即后來的Chapman-Kolmogorov等式   。二十世紀(jì)50年代,前蘇聯(lián)數(shù)學(xué)家Eugene Borisovich Dynkin完善了柯爾莫哥洛夫的理論并通過Dynkin公式(Dynkin formula)將平穩(wěn)馬爾可夫過程與鞅過程(martingale process)相聯(lián)系   。此后以馬爾可夫鏈和馬爾可夫過程為基礎(chǔ),各類馬爾可夫模型被相繼提出并在實際問題中得到應(yīng)用了     。

定義
馬爾可夫鏈
馬爾可夫鏈

馬爾可夫鏈?zhǔn)且唤M具有馬爾可夫性質(zhì)的離散隨機(jī)變量的集合。具體地,對概率空間 內(nèi)以一維可數(shù)集為指數(shù)集(index set) 的隨機(jī)變量集合 ,若隨機(jī)變量的取值都在可數(shù)集內(nèi): ,且隨機(jī)變量的條件概率滿足如下關(guān)系   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

則 被稱為馬爾可夫鏈,可數(shù)集 被稱為狀態(tài)空間(state space),馬爾可夫鏈在狀態(tài)空間內(nèi)的取值稱為狀態(tài)   。這里定義的馬爾可夫鏈?zhǔn)请x散時間馬爾可夫鏈(Discrete-Time MC, DTMC),其具有連續(xù)指數(shù)集的情形雖然被稱為連續(xù)時間馬爾可夫鏈(Continuous-Time MC, CTMC),但在本質(zhì)上是馬爾可夫過程(Markov process)   。常見地,馬爾可夫鏈的指數(shù)集被稱為“步”或“時間步(time-step)”   。

馬爾可夫鏈

上式在定義馬爾可夫鏈的同時定義了馬爾可夫性質(zhì),該性質(zhì)也被稱為“無記憶性(memorylessness)”,即下一步的隨機(jī)變量 在給定其當(dāng)前步隨機(jī)變量 后與其余的隨機(jī)變量條件獨立(conditionally independent):   。在此基礎(chǔ)上,馬爾可夫鏈具有強(qiáng)馬爾可夫性(strong Markov property),即對任意的停時( stopping time),馬爾可夫鏈在停時前后的狀態(tài)相互獨立   。

n-階馬爾可夫鏈(n-order Markov chain)

n-階馬爾可夫鏈擁有n階的記憶性,可視為馬爾可夫鏈的推廣。類比馬爾可夫鏈的定義,n-階馬爾可夫鏈滿足如下條件:

馬爾可夫鏈

按上式,傳統(tǒng)的馬爾可夫鏈可以認(rèn)為是1-階馬爾可夫鏈   。由馬爾可夫性質(zhì)可得,將多個馬爾可夫鏈作為組元可以得到n-階的馬爾可夫鏈。

理論與性質(zhì)

轉(zhuǎn)移理論

馬爾可夫鏈中隨機(jī)變量的狀態(tài)隨時間步的變化被稱為演變(evolution)或轉(zhuǎn)移(transition)。這里介紹描述馬爾可夫鏈結(jié)構(gòu)的兩種途徑,即轉(zhuǎn)移矩陣和轉(zhuǎn)移圖,并定義了馬爾可夫鏈在轉(zhuǎn)移過程中表現(xiàn)出的性質(zhì)。

轉(zhuǎn)移概率 (transition probability)與轉(zhuǎn)移矩陣(transition matrix)

馬爾可夫鏈中隨機(jī)變量間的條件概率可定義為如下形式的(單步)轉(zhuǎn)移概率和n-步轉(zhuǎn)移概率   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

式中下標(biāo) 表示第n步的轉(zhuǎn)移。由馬爾可夫性質(zhì)可知,在給定初始概率 后,轉(zhuǎn)移概率的連續(xù)乘法可以表示馬爾可夫鏈的有限維分布(finite-dimensional distribution)   :

馬爾可夫鏈
馬爾可夫鏈

式中的 為樣本軌道(sample path),即馬爾可夫鏈每步的取值   。對n-步轉(zhuǎn)移概率,由Chapman–Kolmogorov等式可知,其值為所有樣本軌道的總和   :

馬爾可夫鏈

上式表明,馬爾可夫鏈直接演變n步等價于其先演變n-k步,再演變k步(k處于該馬爾可夫鏈的狀態(tài)空間內(nèi))。n-步轉(zhuǎn)移概率與初始概率的乘積被稱為該狀態(tài)的絕對概率。

若一個馬爾可夫鏈的狀態(tài)空間是有限的,則可在單步演變中將所有狀態(tài)的轉(zhuǎn)移概率按矩陣排列,得到轉(zhuǎn)移矩陣   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

馬爾可夫鏈的轉(zhuǎn)移矩陣是右隨機(jī)矩陣(right stochastic matrix),矩陣的第 行表示 時 取所有可能狀態(tài)的概率(離散分布),因此馬爾可夫鏈完全決定轉(zhuǎn)移矩陣,轉(zhuǎn)移矩陣也完全決定馬爾可夫鏈   。由概率分布的性質(zhì)可得,轉(zhuǎn)移矩陣是一個正定矩陣,且每行元素之和等于1: 。

馬爾可夫鏈
馬爾可夫鏈

按相同的方式也可定義n-步轉(zhuǎn)移矩陣: ,由n-步轉(zhuǎn)移概率的性質(zhì)(Chapman–Kolmogorov等式)可知,n-步轉(zhuǎn)移矩陣是其之前所有轉(zhuǎn)移矩陣的連續(xù)矩陣乘法:   。

轉(zhuǎn)移圖(transition graph)

1. 可達(dá)(accessible)與連通(communicate)

馬爾可夫鏈的演變可以按(graph)結(jié)構(gòu),表示為轉(zhuǎn)移圖(transition graph),圖中的每條邊都被賦予一個轉(zhuǎn)移概率。通過轉(zhuǎn)移圖可引入“可達(dá)”和“連通”的概念:

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

若對馬爾可夫鏈中的狀態(tài) 有: ,即采樣路徑上的所有轉(zhuǎn)移概率不為0,則狀態(tài) 是狀態(tài) 的可達(dá)狀態(tài),在轉(zhuǎn)移圖中表示為有向連接: 。如果 互為可達(dá)狀態(tài),則二者是連通的,在轉(zhuǎn)移圖中形成閉合回路,記為   。由定義,可達(dá)與連通可以是間接的,即不必在單個時間步完成。

連通是一組等價關(guān)系,因此可以構(gòu)建等價類(equivalence classes),在馬爾可夫鏈中,包含盡可能多狀態(tài)的等價類被稱為連通類(communicating class)   。

2. 閉合集(closed set)與吸收態(tài)(absorbing state)

馬爾可夫鏈

給定狀態(tài)空間的一個子集,若馬爾可夫鏈進(jìn)入該子集后無法離開: ,則該子集是閉合的,稱為閉合集,一個閉合集外部的所有狀態(tài)都不是其可達(dá)狀態(tài)。若閉合集中只有一個狀態(tài),則該狀態(tài)是吸收態(tài),在轉(zhuǎn)移圖中是一個概率為1的自環(huán)。一個閉合集可以包括一個或多個連通類。

3. 轉(zhuǎn)移圖的例子

這里通過一個轉(zhuǎn)移圖的例子對上述概念進(jìn)行舉例說明   :

轉(zhuǎn)移圖的例子
馬爾可夫鏈
馬爾可夫鏈

由定義可知,該轉(zhuǎn)移圖包含了三個連通類: 、三個閉合集: 和一個吸收態(tài),即狀態(tài)6。注意到,在上述轉(zhuǎn)移圖中,馬爾可夫鏈從任意狀態(tài)出發(fā)最終都會進(jìn)入吸收態(tài),這類馬爾可夫鏈被稱為吸收馬爾可夫鏈(absorbing Markov chain)   。

性質(zhì)

周期為3的不可約馬爾可夫鏈

這里對馬爾可夫鏈的4個性質(zhì):不可約性、重現(xiàn)性、周期性和遍歷性進(jìn)行定義。與馬爾可夫性質(zhì)不同,這些性質(zhì)不是馬爾可夫鏈必然擁有的性質(zhì),而是其在轉(zhuǎn)移過程中對其狀態(tài)表現(xiàn)出的性質(zhì)。上述性質(zhì)都是排他的,即不具有可約性的馬爾可夫鏈必然是不可約的,以此類推。

不可約性(irreducibility)

如果一個馬爾可夫鏈的狀態(tài)空間僅有一個連通類,即狀態(tài)空間的全體成員,則該馬爾可夫鏈?zhǔn)遣豢杉s的,否則馬爾可夫鏈具有可約性(reducibility)   。馬爾可夫鏈的不可約性意味著在其演變過程中,隨機(jī)變量可以在任意狀態(tài)間轉(zhuǎn)移   。

重現(xiàn)性(recurrence)

若馬爾可夫鏈在到達(dá)一個狀態(tài)后,在演變中能反復(fù)回到該狀態(tài),則該狀態(tài)具有重現(xiàn)性,或該馬爾可夫鏈具有(局部)重現(xiàn)性,反之則具有瞬變性(transience)的。正式地,對狀態(tài)空間中的某個狀態(tài),馬爾可夫鏈對一給定狀態(tài)的返回時間(return time)是其所有可能返回時間的下確界(infimum)   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

若 ,則該狀態(tài)不存在瞬變性或重現(xiàn)性的;若 ,則該狀態(tài)的瞬變性和重現(xiàn)性的判斷準(zhǔn)則如下   :

馬爾可夫鏈

在時間步趨于無窮時,可重現(xiàn)狀態(tài)的返回概率(return probability)的和,即總訪問次數(shù)的期望也趨于無窮:

馬爾可夫鏈
馬爾可夫鏈

此外,若狀態(tài) 具有重現(xiàn)性,則可計算其平均重現(xiàn)時間(mean recurrence time)   :

馬爾可夫鏈
馬爾可夫鏈

若平均重現(xiàn)時間 ,該狀態(tài)是“正重現(xiàn)的(positive recurrent)”,否則為“零重現(xiàn)的(null recurrent)”   。若一個狀態(tài)是零重現(xiàn)的,那意味著馬爾可夫鏈兩次訪問該狀態(tài)的時間間隔的期望是正無窮   。

由上述瞬變性和重現(xiàn)性的定義可有如下推論:

推論:對有限個狀態(tài)的馬爾可夫鏈,其至少有一個狀態(tài)是可重現(xiàn)的,且所有可重現(xiàn)狀態(tài)都是正可重現(xiàn)的 。

推論:若有限個狀態(tài)的馬爾可夫鏈?zhǔn)遣豢杉s的,則其所有狀態(tài)是正重現(xiàn)的。

推論:若狀態(tài)A是可重現(xiàn)的,且狀態(tài)B是A的可達(dá)狀態(tài),則A與B是連通的,且B是可重現(xiàn)的 。

推論:若狀態(tài)B是A的可達(dá)狀態(tài),且狀態(tài)B是吸收態(tài),則B是可重現(xiàn)狀態(tài),A是瞬變狀態(tài)。

推論:由正可重現(xiàn)狀態(tài)組成的集合是閉合集,但閉合集中的狀態(tài)未必是可重現(xiàn)狀態(tài) 。

1.

推論:對有限個狀態(tài)的馬爾可夫鏈,其至少有一個狀態(tài)是可重現(xiàn)的,且所有可重現(xiàn)狀態(tài)都是正可重現(xiàn)的 。

2.

推論:若有限個狀態(tài)的馬爾可夫鏈?zhǔn)遣豢杉s的,則其所有狀態(tài)是正重現(xiàn)的。

3.

推論:若狀態(tài)A是可重現(xiàn)的,且狀態(tài)B是A的可達(dá)狀態(tài),則A與B是連通的,且B是可重現(xiàn)的 。

4.

推論:若狀態(tài)B是A的可達(dá)狀態(tài),且狀態(tài)B是吸收態(tài),則B是可重現(xiàn)狀態(tài),A是瞬變狀態(tài)。

5.

推論:由正可重現(xiàn)狀態(tài)組成的集合是閉合集,但閉合集中的狀態(tài)未必是可重現(xiàn)狀態(tài) 。

周期性(periodicity)

馬爾可夫鏈

一個正重現(xiàn)的馬爾可夫鏈可能具有周期性,即在其演變中,馬爾可夫鏈能夠按大于1的周期重現(xiàn)其狀態(tài)。正式地,給定具有正重現(xiàn)性的狀態(tài) ,其重現(xiàn)周期按如下方式計算   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

式中 表示取集合元素的最大公約數(shù)。舉例說明,若在轉(zhuǎn)移圖中,一個馬爾可夫鏈重現(xiàn)某狀態(tài)需要的步數(shù)為 ,則其周期是3,即重現(xiàn)該狀態(tài)所需的最小步數(shù)。若按上式計算得到,該狀態(tài)具有周期性,若,該狀態(tài)具有非周期性(aperiodicity)   。由周期性的定義可有如下推論:

推論:吸收態(tài)是非周期性狀態(tài)。

推論:若狀態(tài)A與狀態(tài)B連通,則A與B周期相同 。

推論:若不可約的馬爾可夫鏈有周期性狀態(tài)A,則該馬爾可夫鏈的所有狀態(tài)為周期性狀態(tài) 。

1.

推論:吸收態(tài)是非周期性狀態(tài)。

2.

推論:若狀態(tài)A與狀態(tài)B連通,則A與B周期相同 。

3.

推論:若不可約的馬爾可夫鏈有周期性狀態(tài)A,則該馬爾可夫鏈的所有狀態(tài)為周期性狀態(tài) 。

遍歷性(ergodicity)

若馬爾可夫鏈的一個狀態(tài)是正重現(xiàn)的和非周期的,則該狀態(tài)具有遍歷性   。若一個馬爾可夫鏈?zhǔn)遣豢蛇€原的,且有某個狀態(tài)是遍歷的,則該馬爾可夫鏈的所有狀態(tài)都是遍歷的,被稱為遍歷鏈。由上述定義,遍歷性有如下推論:

推論:若狀態(tài)A是吸收態(tài),且A是狀態(tài)B的可達(dá)狀態(tài),則A是遍歷的,B不是遍歷的。

推論:若多個狀態(tài)的馬爾可夫鏈包含吸收態(tài),則該馬爾可夫鏈不是遍歷鏈。

推論:若多個狀態(tài)的馬爾可夫鏈形成有向無環(huán)圖,或單個閉環(huán),則該馬爾可夫鏈不是遍歷鏈。

1.

推論:若狀態(tài)A是吸收態(tài),且A是狀態(tài)B的可達(dá)狀態(tài),則A是遍歷的,B不是遍歷的。

2.

推論:若多個狀態(tài)的馬爾可夫鏈包含吸收態(tài),則該馬爾可夫鏈不是遍歷鏈。

3.

推論:若多個狀態(tài)的馬爾可夫鏈形成有向無環(huán)圖,或單個閉環(huán),則該馬爾可夫鏈不是遍歷鏈。

遍歷鏈?zhǔn)欠侵芷诘钠椒€(wěn)馬爾可夫鏈,有長時間尺度下的穩(wěn)態(tài)行為,因此是被廣泛研究和應(yīng)用的馬爾可夫鏈     。

穩(wěn)態(tài)分析

這里介紹馬爾可夫鏈的長時間尺度行為的描述,即平穩(wěn)分布和極限分布,并定義平穩(wěn)馬爾可夫鏈。

平穩(wěn)分布(stationary distribution

馬爾可夫鏈

給定一個馬爾可夫鏈,若在其狀態(tài)空間存在概率分布 ,且該分布滿足以下條件:

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

則 是該馬爾可夫鏈的平穩(wěn)分布。式中 是轉(zhuǎn)移矩陣和轉(zhuǎn)移概率,等價符號右側(cè)的線性方程組被稱為平衡方程(balance equation)。進(jìn)一步地,若馬爾可夫鏈的平穩(wěn)分布存在,且其初始分布是平穩(wěn)分布,則該馬爾可夫鏈處于穩(wěn)態(tài)(steady state)   。從幾何觀點,考慮馬爾可夫鏈的平穩(wěn)分布有 ,因此該分布的支撐集是一個正單純形(standard simplex)。

馬爾可夫鏈

對不可約的馬爾可夫鏈,當(dāng)且僅當(dāng)其存在唯一平穩(wěn)分布,即平衡方程在正單純形上有唯一解時,該馬爾可夫鏈?zhǔn)钦噩F(xiàn)的,且平穩(wěn)分布有如下表示     :

馬爾可夫鏈

上述結(jié)論被稱為平穩(wěn)分布準(zhǔn)則(stationary distribution criterion)   。對不可約和可重現(xiàn)的馬爾可夫鏈,可證明其存在除尺度外唯一的不變測度(invariant measure),若該馬爾可夫鏈?zhǔn)钦噩F(xiàn)的,則不變測度的尺度可以歸一化并得到平穩(wěn)分布   ,因此馬爾可夫鏈存在平穩(wěn)分布的充要條件是其存在正重現(xiàn)狀態(tài)。此外通過舉例可知,若一個馬爾可夫鏈包含多個由正重現(xiàn)狀態(tài)組成的連通類(由性質(zhì)可知它們都是閉合集,所以該馬爾可夫鏈不是正重現(xiàn)的),則每個連通類都擁有一個平穩(wěn)分布,且演變得到的穩(wěn)態(tài)取決于初始分布。

極限分布 (limiting distribution)

馬爾可夫鏈
馬爾可夫鏈

若一個馬爾可夫鏈的狀態(tài)空間存在概率分布

并滿足如下關(guān)系:
  則該分布是馬爾可夫鏈的極限分布。注意到極限分布的定義與初始分布無關(guān),即對任意的初始分布,當(dāng)時間步趨于無窮時,隨機(jī)變量的概率分布趨于極限分布 。按定義,極限分布一定是平穩(wěn)分布,但反之不成立,例如周期性的馬爾可夫鏈可能具有平穩(wěn)分布,但周期性馬爾可夫鏈不收斂于任何分布,其平穩(wěn)分布不是極限分布 。

1. 極限定理(limiting theorem)

兩個獨立的非周期平穩(wěn)馬爾可夫鏈,即遍歷鏈如果有相同的轉(zhuǎn)移矩陣,那么當(dāng)時間步趨于無窮時,兩者極限分布間的差異趨于0。按隨機(jī)過程中的耦合(coupling)理論,該結(jié)論的表述為:對狀態(tài)空間相同的遍歷鏈 ,給定任意初始分布后有   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

式中 表示上確界(supremum)??紤]平穩(wěn)分布的性質(zhì),該結(jié)論有推論:對遍歷鏈 ,當(dāng)時間步趨于無窮時,其極限分布趨于平穩(wěn)分布   :

馬爾可夫鏈

該結(jié)論有時被稱為馬爾可夫鏈的極限定理(limit theorem of Markov chain),表明若馬爾可夫鏈?zhǔn)潜闅v的,則其極限分布是平穩(wěn)分布。對一個不可約和非周期的馬爾可夫鏈,其是遍歷鏈等價于其極限分布存在,也等價于其平穩(wěn)分布存在     。

2. 遍歷定理(ergodic theorem)

若一個馬爾可夫鏈為遍歷鏈,則由遍歷定理,其對某一狀態(tài)的訪問次數(shù)與時間步的比值,在時間步趨于無窮時趨近于平均重現(xiàn)時間的倒數(shù),即該狀態(tài)的平穩(wěn)分布或極限分布   :

馬爾可夫鏈

遍歷定理的證明依賴于強(qiáng)大數(shù)定律(Strong Law of Large Numbers, SLLN),表明遍歷鏈無論初始分布如何,在經(jīng)過足夠長的演變后,對其中一個隨機(jī)變量進(jìn)行多次觀測(極限定理)和對多個隨機(jī)變量進(jìn)行一次觀測(上式左側(cè))都可以得到極限分布的近似   。由于遍歷鏈滿足極限定理和遍歷定理,因此MCMC通過構(gòu)建遍歷鏈以確保其在迭代中收斂于平穩(wěn)分布   。

平穩(wěn)馬爾可夫鏈(stationary Markov chain)

若一個馬爾可夫鏈擁有唯一的平穩(wěn)分布且極限分布收斂于平穩(wěn)分布,則按定義等價于,該馬爾可夫鏈?zhǔn)瞧椒€(wěn)馬爾可夫鏈   。平穩(wěn)馬爾可夫鏈?zhǔn)菄?yán)格平穩(wěn)隨機(jī)過程,其演變與時間順序無關(guān)   :

馬爾可夫鏈

由極限定理可知,遍歷鏈?zhǔn)瞧椒€(wěn)馬爾可夫鏈。此外由上述定義,平穩(wěn)馬爾可夫鏈的轉(zhuǎn)移矩陣是常數(shù)矩陣,n-步轉(zhuǎn)移矩陣則是該常數(shù)矩陣的n次冪   。平穩(wěn)馬爾可夫鏈也被稱為齊次馬爾可夫鏈(time-homogeneous Markov chain)與之對應(yīng)的,若馬爾可夫鏈不滿足上述條件,則被稱為非平穩(wěn)馬爾可夫鏈(non-stationary Markvo chain)或非齊次馬爾可夫鏈(time-inhomogeneous Markov chain)   。

一個平穩(wěn)馬爾可夫鏈也是可逆馬爾可夫鏈 (reversible Markov chain),即其平穩(wěn)分布對任意兩個狀態(tài)滿足細(xì)致平衡(detailed balance)條件   :

馬爾可夫鏈

上述結(jié)論也可表述為平穩(wěn)馬爾可夫鏈與可逆馬爾可夫鏈互為充要條件。在馬爾可夫鏈蒙特卡羅(Markvo chain Monte Carlo, MCMC) 中,構(gòu)建滿足細(xì)致平衡條件的可逆馬爾可夫鏈,是確保其以采樣分布為平穩(wěn)分布的方法   。

特例

伯努利過程 (Bernoulli process)

馬爾可夫鏈
馬爾可夫鏈

伯努利過程也被稱為二項馬可夫鏈(Binomial Markov chain),其建立過程如下:給定一系列相互獨立的“標(biāo)識”,每個標(biāo)識都是二項的,按概率 取正和負(fù)。令正隨機(jī)過程 表示n個標(biāo)識中有k個正標(biāo)識的概率,則其是一個伯努利過程,其中的隨機(jī)變量服從二項分布(binomialdistribution)   :

由建立過程可知,增加的新標(biāo)識中正標(biāo)識的概率與先前正標(biāo)識的數(shù)量無關(guān),具有馬爾可夫性質(zhì),因此伯努利過程是一個馬爾可夫鏈   。

賭徒破產(chǎn)問題(gambler's ruin)

馬爾可夫鏈

假設(shè)賭徒持有有限個籌碼在賭場下注,每次下注以概率 贏或輸一個籌碼,若賭徒不斷下注,則其持有的籌碼總數(shù)是一個馬爾可夫鏈,且有如下轉(zhuǎn)移矩陣   :

馬爾可夫鏈
馬爾可夫鏈

賭徒輸光籌碼是吸收態(tài),由一步分析(one-step analysis)可知,當(dāng) 時,該馬爾可夫鏈必然進(jìn)入吸收態(tài),即賭徒無論持有多少籌碼,隨著賭注的進(jìn)行最終都會輸光。

隨機(jī)游走 (random walk)

馬爾可夫鏈

定義一系列獨立同分布(independent identically distributed, iid)的整數(shù)隨機(jī)變量 ,并定義如下隨機(jī)過程   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

則隨機(jī)過程 是整數(shù)集內(nèi)的隨機(jī)游走,而 是步長。由于步長是iid的,因此當(dāng)前步與先前步相互獨立,該隨機(jī)過程是馬爾可夫鏈   。伯努利過程和賭徒破產(chǎn)問題都是隨機(jī)游走的特例   。

馬爾可夫鏈
馬爾可夫鏈

由上述隨機(jī)游走的例子可知,馬爾可夫鏈有一般性的構(gòu)建方法,具體地,若狀態(tài)空間 內(nèi)的隨機(jī)過程 有滿足形式   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

其中, , 為空間 的iid隨機(jī)變量且獨立于 ,則隨機(jī)過程 是馬爾可夫鏈,其一步轉(zhuǎn)移概率為:   。該結(jié)論表明,馬爾可夫鏈可以由區(qū)間內(nèi)服從iid均勻分布的隨機(jī)變量(隨機(jī)數(shù))進(jìn)行數(shù)值模擬   。

推廣

馬爾可夫過程(Markov process)

馬爾可夫過程也被稱為連續(xù)時間馬爾可夫鏈,是馬爾可夫鏈或離散時間馬爾可夫鏈的推廣,其狀態(tài)空間是可數(shù)集,但一維指數(shù)集不再有可數(shù)集的限制,可以表示連續(xù)時間。馬爾可夫過程與馬爾可夫鏈的性質(zhì)是可以類比的,其馬爾可夫性質(zhì)通常有如下表示   :

馬爾可夫鏈

由于馬爾可夫過程的狀態(tài)空間是可數(shù)集,在連續(xù)時間下其樣本軌道幾乎必然(a.s.)是右連續(xù)的片段函數(shù),因此馬爾可夫過程可以表示為跳躍過程(jump process)并與馬爾可夫鏈相聯(lián)系   :

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

式中 是某個狀態(tài)的滯留時間(sojourn time), 是順序的指數(shù)集成員(時間片段)。滿足上述關(guān)系的馬爾可夫鏈 和滯留時間 是跳躍過程 在有限個時間片段下的局部嵌入過程(locally embedded process)   。

馬爾可夫模型(Markov model

馬爾可夫鏈或馬爾可夫過程不是唯一以馬爾可夫性質(zhì)為基礎(chǔ)建立的隨機(jī)過程,事實上,隱馬爾可夫模型、馬爾可夫決策過程、馬爾可夫隨機(jī)場等隨機(jī)過程/隨機(jī)模型都具有馬爾可夫性質(zhì)并被統(tǒng)稱為馬爾可夫模型。這里對馬爾可夫模型的其它成員做簡要介紹:

1. 隱馬爾可夫模型(Hidden Markov Model, HMM)

HMM是一個狀態(tài)空間不完全可見,即包含隱藏狀態(tài)(hidden status)的馬爾可夫鏈,HMM中可見的部分被稱為輸出狀態(tài)(emission state),與隱藏狀態(tài)有關(guān),但不足以形成完全的對應(yīng)關(guān)系。以語音識別(speech recognition)為例,需要識別的語句是不可見的隱藏狀態(tài),接收的語音或音頻是和語句有關(guān)的輸出狀態(tài),此時HMM常見的應(yīng)用是基于馬爾可夫性質(zhì)從語音輸入推出其對應(yīng)的語句,即從輸出狀態(tài)反解隱藏狀態(tài)   。

2. 馬爾可夫決策過程(Markov decision process, MDP)

MDP是在狀態(tài)空間的基礎(chǔ)上引入了“動作”的馬爾可夫鏈,即馬爾可夫鏈的轉(zhuǎn)移概率不僅與當(dāng)前狀態(tài)有關(guān),也與當(dāng)前動作有關(guān)。MDP的一個例子是下棋,智能體對下一步棋的決策取決于當(dāng)前的盤面和對手當(dāng)前的動作,其中決策(policy)是狀態(tài)到動作的映射。MDP是強(qiáng)化學(xué)習(xí)(reinforcement learning)方法的重要實現(xiàn),被用于計算決策所得到的“回報”,即值函數(shù)(value function)。深度強(qiáng)化學(xué)習(xí)是使用深度學(xué)習(xí)(deep learning)方法求解值函數(shù)極大值所對應(yīng)決策的優(yōu)化過程   。MDP的推廣之一是部分可觀察馬爾可夫決策過程(partially observable Markov decision process, POMDP),即考慮了HMM中隱藏狀態(tài)和輸出狀態(tài)的MDP。

3. 馬爾可夫隨機(jī)場(Markov Random Field, MRF)

MRF是馬爾可夫鏈由一維指數(shù)集向高維空間的推廣。MRF的馬爾可夫性質(zhì)表現(xiàn)為其任意一個隨機(jī)變量的狀態(tài)僅由其所有鄰接隨機(jī)變量的狀態(tài)決定。 類比馬爾可夫鏈中的有限維分布,MRF中隨機(jī)變量的聯(lián)合概率分布是所有包含該隨機(jī)變量的團(tuán)(cliques)的乘積。MRF最常見的例子是伊辛模型(Ising model)     。

哈里斯鏈(Harris chain)

馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈
馬爾可夫鏈

哈里斯鏈?zhǔn)邱R爾可夫鏈從可數(shù)狀態(tài)空間向連續(xù)狀態(tài)空間的推廣,給定可測空間上的平穩(wěn)馬爾可夫鏈,若對可測空間的任意子集和子集的返回時間,該馬爾可夫鏈滿足   :

馬爾可夫鏈
馬爾可夫鏈

則該馬爾可夫鏈?zhǔn)枪锼箍芍噩F(xiàn)(Harris recurrent)的,被稱為哈里斯鏈,式中的是可測空間的σ-有限測度(σ-finite measure)   。

應(yīng)用

MCMC

構(gòu)建以采樣分布為極限分布的馬爾可夫鏈?zhǔn)邱R爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo, MCMC)的核心步驟,MCMC通過在馬爾可夫鏈上運行大量的時間步得到近似服從采樣分布的隨機(jī)數(shù),并使用這些隨機(jī)數(shù)逼近求解目標(biāo)對采樣分布的數(shù)學(xué)期望     :

馬爾可夫鏈

馬爾可夫鏈的極限分布性質(zhì)決定了MCMC是無偏估計(unbiased estimation),即采樣數(shù)趨于無窮時會得到求解目標(biāo)數(shù)學(xué)期望的真實值,這將MCMC與其替代方法,例如變分貝葉斯估計(variational Bayesian inference)相區(qū)分,后者計算量通常小于MCMC但無法得到無偏估計   。

其它

在物理學(xué)和化學(xué)中,馬爾可夫鏈和馬爾可夫過程被用于對動力系統(tǒng)進(jìn)行建模,形成了馬爾可夫動力學(xué)(Markov dynamics)   。 在排隊論(queueing theory)中,馬爾可夫鏈?zhǔn)桥抨犨^程的基本模型   。在信號處理方面,馬爾可夫鏈?zhǔn)且恍┬蛄袛?shù)據(jù)壓縮算法,例如Ziv-Lempel編碼的數(shù)學(xué)模型   ,在金融領(lǐng)域,馬爾可夫鏈模型被用于預(yù)測企業(yè)產(chǎn)品的市場占有率   。

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
馬爾可夫鏈詳細(xì)解釋
?馬爾可夫性質(zhì)和馬爾可夫鏈的一個直觀且簡單的解釋
常用決策分析方法(基本方法)
馬爾可夫鏈 ▏小白都能看懂的馬爾可夫鏈詳解
隱馬爾可夫模型的原理及實現(xiàn) HMM(一)
風(fēng)險評估技術(shù)-29 馬爾可夫分析(Markov analysis)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服