高中數學/機率與統計/隨機性的描述與機率模型
閱讀指南
[編輯]預備知識
[編輯]考試要求
[編輯]後續課程聯繫
[編輯]機率論應用極廣。除了統計學以及從機率論自身發展出來的隨機過程、貝葉斯推斷、決策論等分支學科以外,模糊數學、密碼學、機器學習、量子力學、金融數學、電子遊戲策劃等課題也都是完全離不開機率論的。
玩笑:機率論與賭博的關係也很密切,雖然還沒有形成賭博學這個獨立學科。雖然很多機率論普及文章會論述就賭必輸、回頭是岸的道理,但是誰知道數學家們研究機率論時心裏面不是為了更好地贏一把呢?
玩笑:每一個看多了科幻片的沙發土豆即使沒學過機率論,也一定都聽說過「遇事不決,量子力學」的說法吧。很多沒有才能的科幻片導演,編出了一些胡編亂造的技術名詞,難以通過已知的物理法則解釋,就說將其歸結為新的量子原理敷衍觀眾。
基礎知識
[編輯]知識引入
[編輯]生活中許多事情是否發生是難以預料的。習慣上,我們傾向於用一個0到1之間的數字描述一件事發生的可能性大小,數字越小代表越不可能發生,越大代表越有可能發生。這種簡單的想法引申出了對可能性大小的定義。
講到隨機性,最俗套的例子就是拋2個面的硬幣和拋6個面的骰子。經驗告訴我們,較為均勻的硬幣和骰子,胡亂扔出去並落地以後,以任何一面朝上的可能性都存在,而且看起來應該是均等可能地出現。硬幣的正面在英文中叫做大頭(head),反面叫做尾巴(tail),所以擲硬幣遊戲也叫做大頭還是尾巴(heads or tails)。數學中經常會用H和T這2縮寫字母代表單次擲硬幣的結果[1]。
玩笑:你們在考試遇到不知道答案應該選什麼的選擇題時,也是會需要一個硬幣或骰子這種道具的(不要迷信「亂選一個C就好」的說法,這是對自己的不負責任,有的人連英語判斷題都習慣性在答題卡上填C),或者恨不得突然擁有一個。如果你碰到了喜歡一邊搖骰子,一邊決定選項順序的,那麼正好棋逢對手。這在機率論中的確是有意義的問題。另外,不要把擲硬幣遊戲和海飛絲(Head and Shoulders)洗髮水混為一談。從電影《進化危機》(Evolution)中我們可以得知海飛絲可以消滅許多外星怪獸,硬幣則沒有這麼多花哨的功能(除了還可以許願)。
事件的分類和機率的概念
[編輯]在指定條件下[2]:
- 可能會發生,也可能不會發生的事件叫做隨機事件(random event);
- 一定會發生的事件叫做必然事件(certain event);
- 一定不會發生的叫做不可能事件(impossible event)。
粗略地講,如果能用一個(在[0, 1]之間的)數字明確地衡量一個事件發生的可能性大小,那麼這樣的數字就叫做該事件的機率(probability)或機率。[3]
必然事件發生的機率為1,不可能事件的發生機率為0。
提示:機率是事件本身的固有特性,數學上只考慮範圍描述明確、可以用機率值描述的事件。
由以上規定可知任意事件A的機率P(A)一定滿足:。
注意:雖然必然事件發生的機率為1,不可能事件的發生機率為0,但是反過來未必如此。仔細推敲可以發現,我們沒有規定機率為1的事件就是必然事件,也沒有規定機率為0的事件就是不可能事件。在本節即將介紹的幾何機率模型中就會見到這樣的例子。
一般來說,對於一個複雜、一般性的問題,我們會將事件細分為更小、可能更明確的基本事件(elementary event)[4]。基本事件是機率論中無法嚴格定義的基本概念之一[5]。如果一個事件不可以繼續被劃分為顆粒度(或者說包含範圍)更小的子事件,那麼這樣的事件就可以被當作基本事件。
事件像集合一樣,也可以規定包含關係。如果事件A發生則B一定發生,就說事件B包含事件A(記作),或者事件A包含於事件B(記作)。類似地,還可以定義2個事件A和B的並(即其中任一事件發生,記為)與事件A和B的交(即其中所有事件都發生,記為或AB),並可以用文氏圖表示出來。[6][7][8]
知識背景:從集合觀點談論機率是很有啟發性的。尤其是大學課本對機率的嚴格定義就是基於事件集合的。事件集合也被稱為樣本空間,單個事件被稱為其中的樣本點[5]。而一個具體的事件集合連同此集合上合理規定的事件運算、機率這三者一同被合稱為機率空間[9][10]。當然只有事件集合明確的問題才有討論事件機率的前提。在大學的機率論課程中將會看到,這種抽象使機率脫離了具體的問題背景,但是又保留了機率的運算本質,從而也減少了語境束縛,使得更一般性、更純粹化的機率理論研究成為可能。
相關例題1: 已知A和B是任意的2個事件,利用集合的容斥原理求證關係式:。[11]
相關例題2: 求證對於任意2個事件A、B成立的邦費羅尼(Bonferroni)不等式:。[12]
頻數和頻率
[編輯]多次重複進行同一試驗時,事件A發生的次數叫做頻數(frequency),頻數占總試驗次數的比例叫做頻率(relative frequency)[13][14]。
將事件的相關條件準備好,檢測單次事件的發生情況叫做進行一次試驗(trail)[2]。
提示:有的高中教科書默認頻率當試驗次數增大時會趨近於機率,並將這個趨近值直接定義為機率[15]。這種先入為主地對基於頻率定義機率的做法並不符合目前占主流的頻率學派(frequentist school)的觀點。
提示:從文字本義來說,試驗(trial)是嘗試性的過程,和驗證性的實驗(experiment)是不同的概念。
顯而易見,頻率的數值穩定性是估算機率的前提[14]。它啟發我們當頻率的取值總是接近一個唯一的數值時,就將其取為機率[3]。使用頻率代替機率是有條件的,只有當試驗次數足夠多時,頻率才有可能接近機率,當然這個想法也需要嚴格證明[16]。如果是遇到不太穩定的頻率,單憑一個近似化的想法也是無法很好地估計機率的。這個可以證明的結論被叫做大數定理。由於目前的知識鋪墊還不充分,我們會等到在大數定律與蒙特卡羅方法一節中再作正式介紹。
提示:生產和生活中事件頻率的穩定性是一種經驗之談[3]。如無特殊說明,不應該假定物理世界中所有事件的頻率一定具有穩定性,也不能說頻率不穩定的事件不能算作隨機事件。出於許多方便性和實用性的考慮,數學上只是不去考慮不能用一個確定機率描述的隨機性事件。
頻率有時也用於在難於某些複雜事件難以直接求解出機率或其機率的表達式中存在未知量時,近似地計算出機率[14]。我們從本節開始就會逐漸講到,有很多經典的蒙特卡羅方法就是從這個思路去想的。不過先提一句,利用頻率估計機率利用了數形結合思想,做法簡單直接,但也是效率很低的做法[17],是不得已時(比如用於計算機率的理論公式還沒找到或者形式非常複雜)才會考慮的辦法。
古典機率模型
[編輯]法國數學家皮埃爾-西蒙·拉普拉斯曾在1812年[18]給出了現在被稱為古典機率模型的早期機率定義:
滿足下列條件的機率問題稱為古典機率模型(classical model of probability)或簡稱為古典概型[4][19][18]:
- 試驗中所有可能出現的基本事件只有有限個;
- 每個基本事件出現的可能性相等。
在古典機率模型中,所有的可能情況為離散、有限多個的。反過來,所有情形離散、總數量有限的問題都可以視作古典機率模型問題處理。
關於古典機率模型的事件機率計算,有如下容易理解的規定:
如果一次試驗中最多可能涉及n個基本事件,而且假設所有這n個基本事件的出現可能性都相等,那麼其中每一個基本事件的發生機率都是。此時如果某個事件A包含了m個基本事件,那麼事件A的機率就是。[2][19]
易知在古典機率模型中,有關係式恆成立。[2]
從集合的觀點看,如果把所有基本事件組成一個集合S,包含m個基本事件的事件A就對應於S的含有m個元素的子集A(為了方便把事件A對應的集合也記作A)[2]。如果這些基本事件都可以假設是等可能性的,那麼事件A的機率就是這2集合元質數目的比值[2]:
常見的古典概型問題大體有3類:抽球問題、分房間問題、隨機取數問題。[20]
幾何機率模型
[編輯]人們在幾何學研究中還發現另一種常見的等機率模型,但是因為涉及無窮個基本事件,所以無法直接被算作古典機率模型[18]。
如果每個事件發生的機率只與構成該事件區域的幾何度量(例如長度、面積或體積)成比例,這樣的機率模型稱為幾何機率模型(geometric model of probability)或簡稱為幾何概型[21][17][19]。
在幾何機率模型中,事件A的機率計算方法如下[21]:
- P(A) := 構成事件A的區域的度量值試驗涉及的全部結構所構成的總的度量值
在幾何機率模型中,所有的可能情況為連續、無限多個的。反過來,所有情形連續、總數量無限的問題都可以視作幾何機率模型問題處理。
- (1) 機率為0的事件不一定是不可能事件。
- (2) 機率為1的事件不一定是必然事件。
注意:敘述不清晰的幾何機率問題很可能容易引發歧義。我們會在伯特蘭悖論與公理化機率論簡介一節中介紹伯特蘭悖論這個著名的例子。
注意:實際上不是所有點集的長度、面積、體積的概念都是有意義的。在現代機率論中,我們使用測度的概念為長度、面積和體積下嚴格定義,並會試圖證明有測度不存在的點集。這暗示不是所有的點集問題都是有意義的機率問題。[9]
補充習題
[編輯]- 舉出一個既不是純粹古典機率模型,也不是純粹幾何機率模型的機率問題。
參考資料
[編輯]- ↑ William Feller. 第1章「樣本空間」第1.2節「例子」. (編) 王麗萍. 概率論及其應用. 圖靈數學·統計學叢書 1. 胡迪鶴 (漢譯者) 1 (原書第3版). 北京市崇文區夕照寺街14號: 人民郵電出版社. 2006: 10. ISBN 978-7-115-14729-5 (中文(中國大陸)).
- ↑ 2.0 2.1 2.2 2.3 2.4 2.5 人民教育出版社中學數學室. 第11章「概率」第11.1節「隨機事件的概率」. 數學. 全日制普通高級中學教科書 (必修). 第2冊 (下B) 1. 中國北京沙灘后街55號: 人民教育出版社. 2004: 124–126. ISBN 7-107-17987-X (中文(中國大陸)).
- ↑ 3.0 3.1 3.2 李賢平. 第1章「事件與概率」第1.1節「隨機現象與統計規律性」中的「頻率穩定性」部分和「頻率與概率」部分. (編) 李蕊 (策劃編輯); 楊帆 (責任編輯). 概率論基礎. 普通高等教育「十一五」國家級規劃教材. 王超 (責任校對) 3. 中國北京市崇西城區德外大街4號: 高等教育出版社. 2010: 3–7. ISBN 978-7-04-028890-2 (中文(中國大陸)).
- ↑ 4.0 4.1 張淑梅 (本冊主編); 李建華; 宋莉莉(作者+責任編輯); 楊照宇; 左懷玲; 章建躍; 李勇. 第3章「概率」第3.2節「古典概型」第3.2.1小節「古典概型」. (編) 劉紹學 (主編); 錢珮玲 (副主編). 高中數學 (A版) 必修3 1. 中國北京市沙灘后街55號: 人民教育出版社. 2004: 118–123. ISBN 7-107-17707-9 (中文(中國大陸)).
- ↑ 5.0 5.1 William Feller. 第1章「樣本空間」第1.1節「經驗背景」. (編) 王麗萍. 概率論及其應用. 圖靈數學·統計學叢書 1. 胡迪鶴 (漢譯者) 1 (原書第3版). 中國北京市崇文區夕照寺街14號: 人民郵電出版社. 2006: 6–7. ISBN 978-7-115-14729-5 (中文(中國大陸)).
- ↑ 張淑梅 (本冊主編); 李建華; 宋莉莉(作者+責任編輯); 楊照宇; 左懷玲; 章建躍; 李勇. 第3章「概率」第3.1節「隨機事件的概率」第3.1.3小節「概率的基本性質」. (編) 劉紹學 (主編); 錢珮玲 (副主編). 高中數學 (A版) 必修3 1. 中國北京市沙灘后街55號: 人民教育出版社. 2004: 112–114. ISBN 7-107-17707-9 (中文(中國大陸)).
- ↑ 王梓坤. 第1章「事件與概率」第1.1節「概率論的現實背景」中「(二)事件的運算」部分. (編) 岳昌慶 (責任編輯); 李菡 (責任校對). 概率論基礎及其應用. 新世紀高等學校教材·數學及應用數學專業主幹課程系列教材. 賴德勝 (出版人) 3. 中國北京市新街口外大街19號: 北京師範大學出版社. 2007: 2–4. ISBN 978-7-303-03632-5 (中文(中國大陸)).
- ↑ 李賢平. 第1章「事件與概率」第1.2節「樣本空間與事件」中「三、事件的運算」部分. (編) 李蕊 (策劃編輯); 楊帆 (責任編輯). 概率論基礎. 普通高等教育「十一五」國家級規劃教材. 王超 (責任校對) 3. 中國北京市崇西城區德外大街4號: 高等教育出版社. 2010: 12–16. ISBN 978-7-04-028890-2 (中文(中國大陸)).
- ↑ 9.0 9.1 王梓坤. 第1章「事件與概率」第1.3節「概率空間」中「(一)概率的公理化定義」部分. (編) 岳昌慶 (責任編輯); 李菡 (責任校對). 概率論基礎及其應用. 新世紀高等學校教材·數學及應用數學專業主幹課程系列教材. 賴德勝 (出版人) 3. 中國北京市新街口外大街19號: 北京師範大學出版社. 2007: 19–21. ISBN 978-7-303-03632-5 (中文(中國大陸)).
- ↑ 李賢平. 第1章「事件與概率」第1.5節「概率空間」中「五、概率空間」部分. (編) 李蕊 (策劃編輯); 楊帆 (責任編輯). 概率論基礎. 普通高等教育「十一五」國家級規劃教材. 王超 (責任校對) 3. 中國北京市崇西城區德外大街4號: 高等教育出版社. 2010: 53–55. ISBN 978-7-04-028890-2 (中文(中國大陸)).
- ↑ William Feller. 第1章「樣本空間」第1.7節「基本定義和規則」. (編) 王麗萍. 概率論及其應用. 圖靈數學·統計學叢書 1. 胡迪鶴 (漢譯者) 1 (原書第3版). 中國北京市崇文區夕照寺街14號: 人民郵電出版社. 2006: 17–19. ISBN 978-7-115-14729-5 (中文(中國大陸)).
- ↑ 李賢平. 第1章「事件與概率」第1.5節「概率空間」中「三、概率」部分. (編) 李蕊 (策劃編輯); 楊帆 (責任編輯). 概率論基礎. 普通高等教育「十一五」國家級規劃教材. 王超 (責任校對) 3. 中國北京市崇西城區德外大街4號: 高等教育出版社. 2010: 47–51. ISBN 978-7-04-028890-2 (中文(中國大陸)).
- ↑ 張淑梅 (本冊主編); 李建華; 宋莉莉(作者+責任編輯); 楊照宇; 左懷玲; 章建躍; 李勇. 第3章「概率」第3.1節「隨機事件的概率」第3.1.1小節「隨機事件的概率」. (編) 劉紹學 (主編); 錢珮玲 (副主編). 高中數學 (A版) 必修3 1. 中國北京市沙灘后街55號: 人民教育出版社. 2004: 102. ISBN 7-107-17707-9 (中文(中國大陸)).
- ↑ 14.0 14.1 14.2 王梓坤. 第1章「事件與概率」第1.1節「概率論的現實背景」中「(四)頻率」部分. (編) 岳昌慶 (責任編輯); 李菡 (責任校對). 概率論基礎及其應用. 新世紀高等學校教材·數學及應用數學專業主幹課程系列教材. 賴德勝 (出版人) 3. 中國北京市新街口外大街19號: 北京師範大學出版社. 2007: 8–9. ISBN 978-7-303-03632-5 (中文(中國大陸)).
- ↑ 張淑梅 (本冊主編); 李建華; 宋莉莉(作者+責任編輯); 楊照宇; 左懷玲; 章建躍; 李勇. 第3章「概率」第3.1節「隨機事件的概率」第3.1.3小節「概率的基本性質」. (編) 劉紹學 (主編); 錢珮玲 (副主編). 高中數學 (A版) 必修3 1. 中國北京市沙灘后街55號: 人民教育出版社. 2004: 104–105. ISBN 7-107-17707-9 (中文(中國大陸)).
- ↑ 王梓坤. 第3章「獨立隨機變數序列的極限定理」第3.3節「大數定理與強大數定理」中「(一)問題的一般提法」部分和「(二)大數定理」部分. (編) 岳昌慶 (責任編輯); 李菡 (責任校對). 概率論基礎及其應用. 新世紀高等學校教材·數學及應用數學專業主幹課程系列教材. 賴德勝 (出版人) 3. 中國北京市新街口外大街19號: 北京師範大學出版社. 2007: 187–190. ISBN 978-7-303-03632-5 (中文(中國大陸)).
- ↑ 17.0 17.1 李賢平. 第1章「事件與概率」第1.4節「幾何概型」. (編) 李蕊 (策劃編輯); 楊帆 (責任編輯). 概率論基礎. 普通高等教育「十一五」國家級規劃教材. 王超 (責任校對) 3. 中國北京市崇西城區德外大街4號: 高等教育出版社. 2010: 35–42. ISBN 978-7-04-028890-2 (中文(中國大陸)).
- ↑ 18.0 18.1 18.2 李賢平. 第1章「事件與概率」第1.3節「古典概型」中「一、模型與計算公式」部分. (編) 李蕊 (策劃編輯); 楊帆 (責任編輯). 概率論基礎. 普通高等教育「十一五」國家級規劃教材. 王超 (責任校對) 3. 中國北京市崇西城區德外大街4號: 高等教育出版社. 2010: 17–20. ISBN 978-7-04-028890-2 (中文(中國大陸)).
- ↑ 19.0 19.1 19.2 王梓坤. 第1章「事件與概率」第1.1節「概率論的現實背景」中「(三)概率」部分. (編) 岳昌慶 (責任編輯); 李菡 (責任校對). 概率論基礎及其應用. 新世紀高等學校教材·數學及應用數學專業主幹課程系列教材. 賴德勝 (出版人) 3. 中國北京市新街口外大街19號: 北京師範大學出版社. 2007: 4–8. ISBN 978-7-303-03632-5 (中文(中國大陸)).
- ↑ 王梓坤. 第1章「事件與概率」第1.2節「古典型概率」中「(三)古典型隨機試驗中的概率計算」部分. (編) 岳昌慶 (責任編輯); 李菡 (責任校對). 概率論基礎及其應用. 新世紀高等學校教材·數學及應用數學專業主幹課程系列教材. 賴德勝 (出版人) 3. 中國北京市新街口外大街19號: 北京師範大學出版社. 2007: 12–13. ISBN 978-7-303-03632-5 (中文(中國大陸)).
- ↑ 21.0 21.1 張淑梅 (本冊主編); 李建華; 宋莉莉(作者+責任編輯); 楊照宇; 左懷玲; 章建躍; 李勇. 第3章「概率」第3.3節「幾何概型」. (編) 劉紹學 (主編); 錢珮玲 (副主編). 高中數學 (A版) 必修3 1. 中國北京市沙灘后街55號: 人民教育出版社. 2004: 129–134. ISBN 7-107-17707-9 (中文(中國大陸)).