写在前面
网上有很多关于米勒拉宾素性测试算法的博客 但是大多数都是转载,或者只有模板代码没有分析讲解的,甚至还有的分析的都是错的。花了一早上,借鉴了几十篇博客,总算是把这个算法理解了差不多,并且详细整理了一下我的理解。
讲解很细,篇幅较长,要是想看,准备好耐心。
个人理解,如有不对,欢迎指正。
米勒-拉宾(MillerRabbin)素性测试算法
米勒-拉宾(MillerRabbin)素性测试算法是一个高效判断素数的方法
首先 在学习米勒拉宾素性测试涉及到两个定理 先放出来 下文会详细解释
1、费马小定理: 如果p为质数
(在mod p 的情况下)
2、对于任意一个小于p的正整数x,发现1(模p)的非平凡平方根存在,则说明p是合数。
首先说 费马小定理
费马素性测试
关于 费马小定理 他的证明 这里就不赘述了 感兴趣可以自行百度
我们要用的是费马小定理的逆推
费马小定理说, 如果p为质数 则满足 (在mod p 的情况下)
那么是不是意味着 如果任意一个数p 满足 (mod p ) 就可以断定p是质数了呢?
如果这样来检测素数 这个方法就叫做费马素性测试 但是答案是 不可以这样!
要注意 p是质数 一定满足费马小定理 但是 满足费马小定理的数 并不能证明就是质数
有些数字 满足费马小定理,但是并不是质数 他们叫做伪质数 Carmichael(伪质数的个数是无穷的 文末附有伪质数表哦)
所以说 如果我们用费马检测去判断素数是会出错的
那么这个出错的概率是多大呢 在一定范围内 有多少个数是伪素数呢? 这个和a的选取有关系
当a = 2时,前十亿个正整数中能满足费马小定理且不是素数的只有5597个 ,也就是说 出错的概率是0.011%
虽然这个错误率不高 但是还是存在那么多的伪素数 费马检测无法检测出来
我需要一个新的方法 来判断这些伪素数
这个时候也就是米勒拉宾算法的核心部分了 二次探测
二次探测
这里就要用到一开始放出来的那个定理二
2、对于任意一个小于p的正整数x,发现1(模p)的非平凡平方根存在,则说明p是合数。
乍一看是不是根本看不懂这个定理说的啥意思
其实翻译下来就是下面这样
如果p是一个素数,0 < x< p, 则方程
≡ 1(mod p) 的解为 x=1 ,x= p-1
反之 如果 x^ 2 ≡ 1(mod p) 的解不是 x=1 ,x= p-1 那 p 就不是素数
(我们把 1和-1称为 平凡根 其他的根都称为非平凡根
而 如果一个数x 的平方 模 p =1 或-1 我们就称这个数是1 或 -1 模p 的非平凡平方根
然而 ≡ -1 (mod p) 那x就是虚数了 不在我们讨论范围内 所以 我们只用关心
≡ 1(mod p)
也就是只用关心 1(模p)的非平凡平方根 而如果p是素数 那么 他的根只可能是 1或者 p-1
若根不是1或者p-1 那他就是个合数 关于证明 在下边)
我们用这条性质 进行二次探测
关于这条性质的证明: (如果不想看证明直接跳过 往下看
--------------------------------证明-----------------------------------------
≡ 1(mod p) 可以移项 变成
-1 ≡ 0 (mod p)
那么就是 ( x - 1 )( x + 1 ) ≡ 0(mod p) 就是说 ( x - 1 )( x + 1 ) % p = 0
那如果p是个质数
因为p是质数 所以 p不可能 %( x - 1 )=0 也不可能 %( x + 1 )=0
既然%他俩都不可能为0 也就是他俩都不是p的因子(x<p) 那他俩的乘积也不可能%p = 0
那 ≡ 1(mod p) 这怎么成立呢
只有一个答案 ( x - 1 )( x + 1 )本身就=0 那么也就是 x=1 或 p-1
由此可证明 p为素数的时候 ≡ 1(mod p) 只有两个解 x=1 或 p-1
--------------------------------证毕--------------------------------------------
有了这条性质
那么 满足x^ 2 ≡ 1(mod p) 的 x 值 只可能等于 1 或 p-1 如果不是这俩 那就不是素数 (x<p)
那么我们去怎样验证呢 总不能把比 p 小的数一个一个验证吧 那样也太费时间了吧
所以 米勒拉宾算法就提供了一个 快速的办法(但不准确~~后面会讲)
我们转换个角度看问题
既然 我们遍历所有 x 让它 mod p 结果有很多种 我们需要的只是那些结果为1的 x
那我们反过来 把所有结果为 1 的 x 拿出来 看他们 是不是等于 p - 1 或 1
写这里 你可能要说了 what? 怎么根据结果找这些 x 我不经过计算怎么知道结果是不是1 ?
别着急 可以的 首先要明白 我们要找的 这些 x 都是满足 x ^ 2 ≡ 1 (mod p) (别忘记了~~)
那么 再看下刚才的费马素性检测
能通过费马检测的数 一定满足 (mod p)
而 p - 1是一个偶数
(如果p是个偶数 我们不需要任何复杂的算法 因为偶数只有2是质数 直接判断即可 所以只有p是奇数 我们才进来判断 p是奇数 p - 1 自然是偶数了)
然后 来看个很好理解的性质
任何一个偶数 都可以写成
的形式 比如 6 可以写成 2^1 * 3
所以 p-1 也可以写成
那么 就等于
也就可以写成
那么式子就变成了 (mod p)
我们把 看作 k 那么式子就是
1(mod p)
为什么把费马小定理化简成这个样子呢? 我们来看看我们要找的 x x是满足 x ^ 2 ≡ 1 (mod p) 解为 x=1 ,x= p-1的
而 的计算过程 是不是
....
................
在 的变化过程中 一定会存在
那么 此时 这些k相乘 就是我们要找的 x
这就是满足 x ^ 2 ≡ 1 (mod p) 的那些 x 这个x是存在于 的变化过程中的
所以我们只需要在的变化过程中不停的判断 只要它等于1 或者 p - 1 就说明他是素数!
当然 这里还有一个重点 如果 x 在这个过程中一直不等于 1或 p-1 就能说明他不是素数吗
不能! 思路不要晕 我们要彻底明白米勒拉宾的核心
核心是 根据二次探测定理 我们要找满足 x ^ 2 ≡ 1 (mod p) 的所有 x
要看这些x是不是全部为 1 或 p-1
但是挨个遍历太慢了
然后我们发现 满足x ^ 2 ≡ 1 (mod p) 的x 都存在于
里面
然后我们去
里面找 x 但是
是和 k 有关的
严格来说 你想判断一个数不是素数 需要找遍所有满足条件的 x
而想找遍 x 你必须找遍所有k的取值
明白了这个 你可能会说 找遍所有k 肯定超时啊 扯了半天 这不还是判断不了吗。。。
别急 确实 米勒拉宾不能百分百的判断出一个数是不是素数
但是 我们只尝试几个 k 值 去找x 如果x取值都不是 1或 p-1 虽然理论上不能断定他百分百不是素数
但是 此时他是素数的概率很小 很小很小 比你买的新电脑刚打开突然爆炸了的概率还小
所以 你可以认为他就不是个素数
那么多尝试几个k 其实就是多尝试几个a k值取决于 a 的值
所以 多试几个a 这个算法的错误概率就可以降低到忽略不计
一般试个十几次 二三十次就差不多
而且据说按照下表取a的值 在一定范围内 可以使正确率达到百分之百 变成一个确定的算法
- if n < 1 373 653 a = 2 and 3.
- if n < 9 080 191 a = 31 and 73.
- if n < 4 759 123 141 a = 2, 7, and 61.
- if n < 2 152 302 898 747 a = 2, 3, 5, 7, and 11.
代码
标有注释
模板题目51nod1106
#include<stdio.h>
#include<iostream>
#include<algorithm>
using namespace std;
typedef long long ll;
ll mul(ll a,ll b,ll mod){//高精度
a%=mod;
b%=mod;
ll c=(long double)a*b/mod;
ll ans=a*b-c*mod;
return (ans%mod+mod)%mod;
}
ll pow_mod(ll x,ll n,ll mod){//快速幂
ll res=1;
while(n){
if(n&1)
res=mul(res,x,mod);
x=mul(x,x,mod);
n>>=1;
}
return (res+mod)%mod;
}
bool Miller_Rabbin(ll a,ll n){
//把n-1 转化成 (2^r)*d
ll s=n-1,r=0;
while((s&1)==0){
s>>=1;r++;
}
//算出 2^d 存在 k 里
ll k=pow_mod(a,s,n);
//二次探测 看变化过程中是不是等于1 或 n-1
if(k==1)return true;
for(int i=0;i<r;i++,k=k*k%n){
if(k==n-1)return true;
}
return false;
}
bool isprime(ll n){
//这里可以随机取a值进行探测 探测次数可以自己定
//我写了几个我喜欢用的探测数据
ll times=7;
ll prime[100]={2,3,5,7,11,233,331};
for(int i=0;i<times;i++){
if(n==prime[i])return true;
if(Miller_Rabbin(prime[i],n)==false)return false;//未通过探测 返回假
}
return true;//所有探测结束 返回真
}
伪素数表
常用的
18位素数:154590409516822759
19位素数:2305843009213693951 (梅森素数)
19位素数:4384957924686954497
Carmichael-list:
