Skip to content

第十章 概率

本章核心问题:概率是什么?如何计算概率?频率与概率有何关系?这三个问题贯穿全章,理解这些问题即可把握概率的核心内容。


一、概率概念的历史演进

1.1 从赌博问题中诞生

概率论起源于17世纪法国贵族的赌博问题。1654年,梅雷(Chevalier de Méré)向帕斯卡(Blaise Pascal)提出了著名的"分赌注问题":两人约定先赢6局者获得全部赌注,但赌博因故中断,此时甲赢了5局,乙赢了3局,赌注该如何分配?

该问题涉及尚未发生的事件(未来可能的结果),此前数学主要研究确定性现象。帕斯卡与费马(Pierre de Fermat)就此展开通信讨论,开创了用数学方法研究随机现象的开端。此后,惠更斯(Christiaan Huygens)、伯努利家族(Bernoulli)、棣莫弗(De Moivre)、拉普拉斯(Laplace)等数学家持续发展该领域,概率论逐渐成为数学的重要分支。

1.2 从频率到公理化:概率的三次定义演进

第一阶段:古典定义(拉普拉斯,1812年)

P(A)=事件A包含的基本事件数样本空间的基本事件总数

这一定义要求"有限个等可能结果",适用范围狭窄(如掷骰子、抛硬币),无法处理无限样本空间或非等可能情形。

第二阶段:频率定义(19世纪末—20世纪初)

当试验次数 n 充分大时,事件 A 发生的频率 fn(A)=nAn 会稳定在某个常数附近,这个常数就是概率。

这一定义将概率与可观测的频率联系起来,但存在逻辑困境:"稳定"是什么意思?频率本身就是随机变量,它"收敛"到什么意义下?无法作为严格的数学定义。

第三阶段:公理化定义(柯尔莫哥洛夫,1933年)

柯尔莫哥洛夫(Andrey Kolmogorov)借鉴测度论,提出了概率的公理化体系:

  • 样本空间 Ω:随机试验所有可能结果的集合
  • 事件域 FΩ 的某些子集构成的集合族
  • 概率测度 P:满足三条公理的函数
    1. 非负性P(A)0
    2. 规范性P(Ω)=1
    3. 可列可加性:对两两互斥的事件 A1,A2,,有 P(i=1Ai)=i=1P(Ai)

柯尔莫哥洛夫的贡献:他不讨论"概率是什么"的哲学定义,而是规定概率所满足的公理条件。类似于欧几里得几何通过公理刻画点、线、面而不给出其本质定义,柯尔莫哥洛夫通过公理化方法使概率论成为严格的数学分支。

1.3 为什么教材用"频率稳定性"引入概率?

教材的逻辑编排依据

人教A版以"频率稳定性"作为概率概念引入的桥梁,这是基于学生认知规律的精心设计:

  1. 直观性:频率是可以观测的——做了100次试验,事件发生32次,频率就是0.32。学生可在实验中体验"稳定性"。

  2. 从具体到抽象:直接引入公理化定义对高中生而言较为抽象。先通过频率建立"概率≈稳定频率"的认识,再过渡到严格的古典概型和性质推导,符合"具体—抽象—具体"的认知路径。

  3. 统计与概率的融合:2019版新课标强调"数据分析"素养,用频率引入体现了统计学思维——通过数据推断规律。这与大数定律的核心思想一致。

  4. 操作性的需要:很多实际问题的概率无法通过古典概型计算(如产品合格率、投篮命中率),此时"频率估计概率"是最实用的方法。

深层理解:教材中的"频率稳定性"不是严格的数学定义,而是一种启发式引入。它回答的是"我们如何感知概率",而不是"概率的数学本质是什么"。在大学阶段学习依概率收敛与强大数定律后,可明确这种"稳定"的严格含义。


二、样本空间与事件运算

2.1 四个核心概念的层级关系

样本点(Sample Point)

随机试验的每一个可能的结果称为样本点,通常用 ω 表示。

关键特征

  • 不可再分解:样本点是基本结果,不能再细分
  • 互斥性:任何一次试验,只会出现一个样本点

样本空间(Sample Space)

所有样本点构成的集合,用 Ω 表示。

试验样本空间 Ω注意
抛一枚硬币{H,T}H=正面,T=反面
掷一枚骰子{1,2,3,4,5,6}点数
掷两枚骰子{(i,j)i,j{1,2,3,4,5,6}共36个有序对
某网站1小时内的访问次数{0,1,2,3,}可数无限
灯泡的使用寿命[0,+)不可数无限

教材限定:高中教材主要研究有限样本空间(有限个样本点),这是学习古典概型的前提。

随机事件(Random Event)

样本空间 Ω子集称为随机事件,通常用 A,B,C 等大写字母表示。

事件的层级

样本点基本事件随机事件样本空间
  • 基本事件:只包含一个样本点的事件(如"掷出3点")
  • 复合事件:包含多个样本点的事件(如"掷出奇数点"={1,3,5}
  • 必然事件Ω 本身,每次试验一定发生
  • 不可能事件,每次试验一定不发生

集合论视角:概率论的事件运算,本质上就是集合运算。样本空间 Ω 对应全集,事件是子集,概率是定义在子集上的"测度"。这正是柯尔莫哥洛夫公理化的核心思想——把概率论建立在集合论和测度论的基础之上。

2.2 事件的关系与运算(对应集合运算)

包含关系 AB

  • 含义:事件 A 发生,则事件 B 一定发生
  • 集合解释A 的所有样本点都在 B
  • 概率推论ABP(A)P(B)

并事件(和事件)AB

  • 含义A 发生 B 发生(至少一个发生)
  • 关键词:"至少一个"、"或"、"A或B"
  • 集合解释:两个集合的并集

交事件(积事件)AB(简记 AB

  • 含义A 发生 B 发生(同时发生)
  • 关键词:"同时"、"且"、"都"、"既...又..."
  • 集合解释:两个集合的交集

互斥事件(Mutually Exclusive / 不相容)

  • 含义AB 不能同时发生
  • 符号AB=
  • 关键词:"不能同时"、"要么...要么..."(在只有两种选择时)

对立事件(Complementary)

  • 含义A 不发生
  • 符号A¯Ac,满足 AA¯=ΩAA¯=
  • 概率关系P(A¯)=1P(A)
  • 关键区分:对立 互斥,但互斥 对立(除非 AB=Ω

2.3 事件运算的完整对应表

概率语言集合语言符号概率公式
事件 A 发生ωA
A 包含于 BABABP(A)P(B)
AB 发生AB 的并集AB加法公式
AB 发生AB 的交集AB乘法公式
A 不发生A 的补集A¯P(A¯)=1P(A)
AB 互斥AB 不相交AB=P(AB)=P(A)+P(B)
AB 对立B=A¯AB=,AB=ΩP(A)+P(B)=1

三、古典概型

3.1 古典概型的两个条件——缺一不可

定义:若试验满足

  1. 有限性:样本空间的样本点个数有限
  2. 等可能性:每个样本点发生的可能性相等

则对任意事件 A

P(A)=A包含的样本点数Ω中的样本点总数=n(A)n(Ω)

为什么两个条件缺一不可?

条件缺失反例后果
不满足有限性抛硬币直到出现正面,记录抛掷次数样本空间 {1,2,3,} 无限,无法用"数个数"计算
不满足等可能性掷一枚不均匀骰子各点数概率不等,不能用 1/6

"等可能性"的判断是难点也是易错点

很多题目不直接声明"等可能",需要我们自己判断。判断标准:对称性

  • 均匀硬币:正面、反面在几何上对称 等可能
  • 均匀骰子:六个面在几何上对称 等可能
  • 从袋中随机摸球:每个球被摸到的概率相同 等可能

经典反例:抛两枚硬币,若将样本空间写成 {HH,HT,TH,TT},四个结果是等可能的。但若错误地认为"两个正面、一正一反、两个反面"是等可能的,就会出错——因为"一正一反"包含了 HTTH 两种情况,概率应该是 1/2,而不是 1/3

3.2 抽签的"公平性"——为什么与顺序无关?

问题:袋中有 a 个白球和 b 个红球,不放回地逐个抽取。第 k 个人抽到白球的概率是多少?

条件概率与无条件概率的区别:在无放回抽取中,若已知前面抽取的结果,后续抽取的条件概率确实会改变。但无条件概率(即抽签前)为:

P(k个人抽到白球)=aa+b

k 无关!

严格证明

Ωa+b 个球的全排列,共有 (a+b)! 种等可能排列。

k 个位置是白球:先从 a 个白球中选1个放在第 k 位,剩下 a+b1 个位置任意排列。

n(A)=a(a+b1)!
P(A)=a(a+b1)!(a+b)!=aa+b

对称性分析:在不放回抽取中,所有球在任意位置上的分布具有对称性。对第 k 个位置而言,每个球被置于此位置的概率均等。由于抽签前无法获知先前抽取的结果,无条件概率下每个位置抽到特定球的概率相同。

实际应用:在不放回抽取机制下,先抽与后抽的无条件概率相同,故抽签顺序不影响公平性。

3.3 古典概型的计算策略

策略一:列举法(适合样本点少)

掷两枚骰子,点数之和为7的概率。

样本空间:36个等可能结果

有利事件:(1,6),(2,5),(3,4),(4,3),(5,2),(6,1) ——共6个

P=636=16

策略二:排列组合法(适合样本点多)

关键区分:有序(排列)vs 无序(组合)

  • 有放回抽取且关注顺序:nkk 次,每次 n 种)
  • 无放回抽取且关注顺序:Ank=n(n1)(nk+1)
  • 无放回抽取且不关注顺序:Cnk=n!k!(nk)!

例题:从5男3女中选3人,至少有1名女生的概率。

解法一(直接法):

  • 1女2男:C31C52=3×10=30
  • 2女1男:C32C51=3×5=15
  • 3女0男:C33=1
P=30+15+1C83=4656=2328

解法二(补集法):

P=1P(全男)=1C53C83=11056=4656=2328

四、概率的基本性质

4.1 概率的六条性质

由概率的公理化定义(尤其是可列可加性),可推出以下性质:

性质1:对任意事件 A0P(A)1

性质2:必然事件的概率为1,即 P(Ω)=1

性质3:若 AB 互斥,则 P(AB)=P(A)+P(B)

性质4:若 A1,A2,,Am 两两互斥,则

P(A1A2Am)=P(A1)+P(A2)++P(Am)

性质5P(A¯)=1P(A)

性质6:若 AB,则 P(A)P(B),且 P(BA)=P(B)P(A)

4.2 一般加法公式(容斥原理)

对于任意两个事件:

P(AB)=P(A)+P(B)P(AB)

为什么减 P(AB)

因为 AB 的交事件被算了两次——一次在 P(A) 中,一次在 P(B) 中。韦恩图可以直观展示这一点。

三个事件的加法公式

P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC)

一般规律:奇数个事件交项相加,偶数个事件交项相减。


五、事件的相互独立性

5.1 独立性的定义

概念说明:事件 A 的发生与否,不影响事件 B 发生的概率。

数学定义:若

P(AB)=P(A)P(B)

则称事件 AB 相互独立

等价定义(当 P(A)>0 时):

P(B|A)=P(B)

即"已知 A 发生,B 发生的概率不变"。

5.2 独立性的性质

性质1:若 AB 独立,则 AB¯ 独立,A¯B 独立,A¯B¯ 独立。

性质2:若 P(A)=0P(A)=1,则 A 与任何事件独立。

性质3:独立性是事件之间的关系,不是概率数值的关系。两个事件可以有相同的概率,但不独立;也可以概率不同但独立。

5.3 独立与互斥的根本区别

互斥与独立是本章中易混淆的核心概念。

互斥(互不相容)独立
本质事件的集合无交集事件的发生互不影响
集合关系AB=P(AB)=P(A)P(B)
概率关系P(AB)=P(A)+P(B)P(AB)=P(A)P(B)
关键词"不能同时发生""发生与否互不影响"
典型场景单次试验的不同结果不同试验或不同人

核心命题

P(A)>0P(B)>0,则互斥与独立不能同时成立。

证明

  • 若互斥,则 AB=P(AB)=0
  • 若独立,则 P(AB)=P(A)P(B)>0
  • 矛盾!

概念辨析:互斥指两个事件不能同时发生(AB=),即集合层面无交集;独立指一个事件的发生不影响另一个事件发生的概率(P(AB)=P(A)P(B)),即概率层面无关联。对于概率均大于0的两个事件,互斥意味着二者具有强相关性,故不可能同时独立。

5.4 多个事件的独立性

两两独立

对任意 ij,有 P(AiAj)=P(Ai)P(Aj)

相互独立

对任意 k 个事件的子集,交事件的概率等于概率的积。

注意:两两独立 相互独立。

经典反例(伯恩斯坦反例):

设样本空间 Ω={1,2,3,4},四个样本点等可能。

定义:

  • A={1,2}P(A)=1/2
  • B={1,3}P(B)=1/2
  • C={1,4}P(C)=1/2

验证:

  • AB={1}P(AB)=1/4=P(A)P(B)
  • AC={1}P(AC)=1/4=P(A)P(C)
  • BC={1}P(BC)=1/4=P(B)P(C)

两两独立成立!但:

  • ABC={1}P(ABC)=1/4
  • P(A)P(B)P(C)=1/8

1/41/8,故不相互独立

说明:高中教材主要讨论两个事件的独立性。了解两两独立与相互独立的区别即可,无需进一步展开。


六、互斥、对立、独立的关系

6.1 三者关系的韦恩图表示

        ┌─────────────────────────────┐
        │      样本空间 Ω 中的所有事件对   │
        │  ┌───────────────────────┐  │
        │  │    互斥事件 (A∩B=∅)    │  │
        │  │  ┌─────────────────┐  │  │
        │  │  │  对立事件 (A∪B=Ω) │  │  │
        │  │  │     且 A∩B=∅     │  │  │
        │  │  └─────────────────┘  │  │
        │  └───────────────────────┘  │
        │                             │
        │    独立事件 (P(AB)=P(A)P(B)) │
        │    ——与互斥基本不相交(非零概率时)│
        └─────────────────────────────┘

关系总结

条件结论
对立 互斥
互斥 + AB=Ω 对立
互斥 + P(A)>0,P(B)>0 不独立
独立 + P(A)>0,P(B)>0 不互斥
P(A)=01与任何事件独立(包括互斥的)

6.2 频率与概率的本质区别与联系

维度频率(Frequency)概率(Probability)
性质统计概念,随机变量数学概念,常数
可变性每次试验结果不同固定不变
计算方式fn(A)=nAn(事后统计)P(A)(事前确定)
与试验的关系依赖于具体进行的试验不依赖于具体试验
精确性有限次试验有随机波动理论上的精确值

联系

大数定律:当 n 时,fn(A)P(A)

严格地说,大数定律有多种形式:

  • 弱大数定律fn(A) 依概率收敛P(A)
  • 强大数定律fn(A) 几乎必然收敛P(A)

教材中的"频率稳定性",是这两种大数定律的简化表述。

理论分析:频率是基于试验观测的统计量,具有经验性;概率是刻画随机现象规律性的理论常数。频率估计概率体现了统计学基于数据进行推断的基本思想。概率一经确定(如均匀硬币 P(H)=1/2),即不依赖于任何具体试验——这体现了数学演绎与经验归纳的本质差异。


七、常见错误类型与解题技巧

7.1 "至多/至少"问题的转化技巧(补集法)

原则:当直接计算需要分类太多时,考虑用对立事件转化。

表述直接含义对立事件
至少一个1全不发生
至多一个1至少两个
至少两个2至多一个
至多 kk至少 k+1

例题:掷4枚硬币,至少一枚正面的概率。

直接法:1正3反、2正2反、3正1反、4正 —— 分类较多。

补集法:P(至少1正)=1P(全反)=1116=1516

补集法的适用条件

  • "至少"、"至多"问题
  • 对立事件易于计算时
  • 正面情况分类超过3类时

7.2 有放回vs无放回抽取的概率差异

这是考试中的高频易错点

特征有放回无放回
每次试验条件相同改变
各次是否独立独立不独立
概率计算乘法公式直接乘条件概率/排列组合
超几何分布不适用适用
二项分布适用不适用

例题:袋中有3白2红共5球,抽2次。

有放回

  • P(两次都白)=35×35=925

无放回

  • P(两次都白)=35×24=620=310
  • 或用组合:P=C32C52=310

识别要点

  • "放回"、"重新抽取"、"重复试验" 有放回
  • "不放回"、"一次取多个"、"逐个抽取不放回" 无放回

7.3 "先抽后抽概率相等"的再证明

这不仅是抽签公平性,也是考试常考的结论。

例题:10张奖券中有3张中奖,甲、乙、丙依次抽取(不放回),求各自的获奖概率。

P(甲中奖)=310
P(乙中奖)=P(甲中且乙中)+P(甲不中且乙中)
=31029+71039=6+2190=2790=310
P(丙中奖)=310(同理可证)

推广结论n 个签中有 m 个"好签",不放回地逐个抽取,第 k 个人抽到好签的概率都是 mn

7.4 独立重复试验的识别

二项分布的前提

  1. n 次独立重复试验
  2. 每次只有"成功"/"失败"两种结果
  3. 每次成功概率都是 p

识别要点

  • "独立"意味着各次试验互不影响(通常是有放回,或总体极大近似有放回)
  • "重复"意味着每次条件相同、概率不变

非独立重复的例子

  • 从10件产品(含2件次品)中不放回地取3件,求次品数 非独立,用超几何分布
  • 同一射手连续射击10次(熟练度变化) 非重复,概率可能变化

八、认知层面的常见错误分析

8.1 混淆"互斥"与"独立"

错误根源:没有理解两个概念的本质区别。

  • 互斥是集合层面的概念:AB=,说的是集合无交集
  • 独立是概率层面的概念:P(AB)=P(A)P(B),说的是发生互不影响

典型错题

掷一枚骰子,A="掷出奇数",B="掷出偶数"。AB 是否独立?

错误答案:部分学生认为"独立,因为非奇即偶"——这是将对立关系误作独立关系。

正确答案AB 互斥(且对立),但不独立(除非概率为0)。因为 A 发生则 B 一定不发生,二者存在显著影响。

验证:P(A)=1/2P(B)=1/2P(AB)=0,而 P(A)P(B)=1/401/4

8.2 古典概型中"等可能性"判断失误

典型错误:将不等可能的结果当作等可能。

例1:抛两枚硬币,样本空间写成 {HH,HT,TH,TT}(正确,等可能) vs {两正,一正一反,两反}(错误,不等可能)。

例2:从1,2,3,4,5中随机取2个数,求和为偶数的概率。

错误做法:和的可能值为 3,4,5,6,7,8,9,认为这些和"等可能"。

实际上:1+2=3,1+3=4,,不同和出现的组合数不同。正确做法是从 C52=10 种等可能的数对出发。

等可能性判定原则

样本点应该是最基本的、不可再分的、对称的。任何"合并"后的结果都要警惕是否等可能。

8.3 复杂事件的分解遗漏

错误根源:分类不全面,漏掉某些情况。

例题:掷两枚骰子,点数之积大于10的概率。

常见错误:仅考虑较大数值的乘积,遗漏了部分组合。

正确策略:系统列举或用表格法。

123456
1123456
224681012
3369121518
44812162024
551015202530
661218243036

积大于10的结果有19个(表格中加粗),P=1936

避免遗漏的方法

  1. 用表格、树状图等可视化工具
  2. 分类时采用"不重不漏"的原则
  3. 计算后验证各类概率之和是否为1

九、概率中的数学思维

9.1 分类讨论(事件分解)

核心思想:将复杂事件分解为若干个互斥的简单事件之和。

公式化表达

A=A1A2An,且 AiAj=ij),则

P(A)=P(A1)+P(A2)++P(An)

例题:袋中有3白2红球,取2球,求恰有1白1红的概率。

分类:先白后红、先红后白(不放回)。

P=3524+2534=6+620=1220=35

或用组合:P=C31C21C52=610=35

9.2 补集思想(对立事件)

核心思想:当直接求解困难时,转求对立事件的概率。

公式P(A)=1P(A¯)

适用场景

  • "至少"、"至多"问题
  • "不全"、"都"的否定
  • 正面情况复杂,反面情况单一

例题:某批产品次品率为0.05,有放回地抽取10件,求至少有1件次品的概率。

直接算"至少1件次品" = 1件次品 + 2件次品 + ... + 10件次品,太繁琐。

反面:P(至少1次品)=1P(全正品)=1(0.95)1010.5987=0.4013

9.3 数形结合(韦恩图)

核心思想:用集合的韦恩图(Venn Diagram)直观表示事件关系和运算。

应用场景

  1. 理解 ABABA¯ 的含义
  2. 理解加法公式 P(AB)=P(A)+P(B)P(AB) 的"重叠扣除"
  3. 分解复杂事件(如"恰有一个发生"、"至少两个发生")

韦恩图解法示例

用韦恩图表示"A 发生且 B 不发生":

这是区域 AB=AB¯,概率为 P(A)P(AB)

9.4 转化化归思想

核心思想:将陌生的概率问题转化为已知的模型。

常见转化

问题类型转化方向
"第 k 次首次成功"几何分布模型
"n 次独立重复,成功 k 次"二项分布模型
"不放回取 n 个,其中 k 个某类"超几何分布模型
"频率估计概率"大数定律思想

十、全章知识网络

                    ┌─────────────────────┐
                    │     随机试验与样本空间   │
                    │   (Ω, 样本点, 事件)    │
                    └──────────┬──────────┘

           ┌───────────────────┼───────────────────┐
           ▼                   ▼                   ▼
    ┌──────────────┐   ┌──────────────┐   ┌──────────────┐
    │  事件的关系与运算 │   │   古典概型    │   │  频率与概率   │
    │  (包含/并/交/   │   │  (有限+等可能) │   │  (稳定性/    │
    │   互斥/对立)   │   │   P(A)=n(A)/n(Ω)│   │   大数定律)  │
    └───────┬──────┘   └───────┬──────┘   └───────┬──────┘
            │                  │                  │
            ▼                  ▼                  ▼
    ┌──────────────┐   ┌──────────────┐   ┌──────────────┐
    │  概率基本性质  │   │  事件的独立性  │   │  随机模拟/   │
    │  (加法/减法/  │◄──►│  (P(AB)=P(A)P(B))│   │  频率估计    │
    │   对立/单调)  │   │  (与互斥的区别) │   │              │
    └──────────────┘   └──────────────┘   └──────────────┘


                    ┌─────────────────────┐
                    │   应用:概率计算与决策   │
                    │  (补集法/分类讨论/     │
                    │   数形结合/转化化归)     │
                    └─────────────────────┘

全章核心公式速查

公式内容适用条件
古典概型P(A)=n(A)n(Ω)有限、等可能
加法公式P(AB)=P(A)+P(B)P(AB)任意事件
互斥加法P(AB)=P(A)+P(B)AB=
对立公式P(A¯)=1P(A)任意事件
乘法公式P(AB)=P(A)P(B|A)条件概率
独立乘法P(AB)=P(A)P(B)AB 独立
频率估计P(A)nAnn 充分大

本章小结:概率论是研究随机现象不确定性的数学理论。它为信息不完备条件下的理性推断提供了方法,广泛应用于量子力学、天气预报、人工智能等领域。掌握本章内容,有助于建立随机现象的分析框架,理解确定性数学与随机性数学之间的内在联系。