1 什么是假设检验?

你说你的硬币是公平的，也就是”花”和”字”出现的概率是差不多的。
然后，你想和我打赌,作为一个资深的理智赌徒,我怎能听信你的一面之词,我提出要检查下你的
硬币到底是不是公平的，万一是两面“花”怎么办?电影里面不是经常出现这样的桥段?

你神色紧张，死活不让我检查,后来我们提出了折衷的方案，抛几次硬币，看看结果是不是公平的。

总共扔了十次，也都是"花” 朝上,那我就认为很可能你这枚硬币不是公平的。
这就是<mark>假设检验</mark>:

你提出假设:说你的硬币是公平的
我提出要检验你的假设:扔十次，看实验的结果是不是和你的假设相符

2 P值

为为完成假设检验,需要先定义一个概念: P值。我们这里就来解释什么是P值?
根据上面的描述,这里假设检验的思路就是: .

假设:硬币是公平的
检验:认为假设是成立的，然后扔十次，看结果与假设是否相符
反复扔硬币应该符合二项分布(这就不解释了)，也就是:

在我们认为硬币是公平的前提下，扔10次硬币应该符合以下分布：

下图表示的就是，假如硬币是公平的情况下的分布图：

我扔了十次之后得到的结果是，有八次正面：

这个时候有个数学大佬出来定义了一个称为P值（p-value)的概念：

把八次正面的概率，与更极端的九次正面、十次正面的概率加起来：

其实，出现两次正面、一次正面、零次正面的概率也是很极端的：

所以（双侧P值）：

2.1 为什么要把更极端的情况加起来？

根据扔硬币这个例子，可能你会觉得，我知道八次正面出现不正常就行了，干嘛要把九次、十次加起来?
我觉得有这么一个现实原因，比如我要扔1000次硬币来测试假设是否正确。
扔1000次硬币用二项份布来计算很麻烦,根据中心极限定理，我们知道，可以用正态分布来近似:

比如，我扔了1000次,得到了530次正面，脏态分布来计算就比较简单。
但是，对于正态分布,我没有办法算单点的概率(连续分布单点概率为0)，我只能取一个区间来算极限，所以就取530、以及更极端的点组成的区间: .