## $C_a^b$的多种场景下的求法
### [一、$AcWing$ $885$. 求组合数 $I$](https://www.acwing.com/problem/content/887/)
理论依据:$\large C_a^b=C_{a-1}^b+C_{a-1}^{b-1}$
> 限制条件:
> $\large a<=2000,b<=2000$
>
> **受限原因**:需要二维数组,$2000*2000=4000000=4e6$,占据太大的空间。
**证明:**
有$a$个苹果,现在需要选出$b$个苹果,一共有多少种选法呢?
**答**:走到第一个苹果面前,面临两个选择:
- 选择它
- 放弃它
如果选择它,将要面对$a-1$个苹果中选$b-1$个苹果的问题
如果放弃它,将要面对$a-1$个苹果中选$b$个苹果的问题
根据加法原理,两种选择方法加在一起,就是选法总数,也就是上面的递推式。
```c++
#include
using namespace std;
const int N = 2010;
const int p = 1e9 + 7;
int c[N][N];
void init() {
/*
功能:第0列初始化为1,现实意义:C(n,0)=1
理解:从n个元素中,每次取出0个元素,也就是每次都不取出元素,有几种取法?
很明显只有1种取法,就是什么都不取这样一种情况。类似:C(n,0)=C(n,n)=1
这是递归的base case,如果没有这个1打底,以后再怎么加法原理都是白费
*/
for (int i = 1; i < N; i++) c[i][0] = 1, c[i][i] = 1; // base case
for (int i = 1; i < N; i++)
for (int j = 1; j < i; j++)
// 递归式最重要!这是根据数学公式得到的递推式
// 从递推式由右向左看过去,需要由小到大填充i,j,并且,i>j
c[i][j] = (c[i - 1][j] + c[i - 1][j - 1]) % p;
}
int n;
int main() {
init();
cin >> n;
while (n--) {
int a, b;
cin >> a >> b;
cout << c[a][b] << endl;
}
return 0;
}
```
### [二、$AcWing$ $886$. 求组合数 $II$](https://www.acwing.com/problem/content/888/)
上个办法把$C_a^b$的值预处理出来,用的是$c[N][N]$,$N$最大$2010$.
本题的$a$,$b$都是上限$10^5$,如果按上题来,就是$c[10^5][10^5]$,
直接报 $Memory\ Limit\ Exceeded$. 所以不能直接递推求出所有解。
> 限制条件:
> $a<=1e5,b<=1e5$
理论依据:$\large C_a^b=\frac{a!}{(a-b)! * b!}$
举栗子:
$\large C_3^2=\frac{3 \times 2}{2 \times 1}=3$
#### 前导知识
##### 模逆元
定义与用途
若$b,p$互质,$b \times b^{-1} \equiv 1 \ (mod \ p)$,称$b^{-1}$是$b$的模$p$逆元。
有 $$a \equiv a \ (mod \ p) \ \equiv a \times 1 \ (mod \ p) \equiv a \times (b \times b^{-1}) \ (mod \ p)$$
若$b \mid a$,则$\frac{a}{b} \equiv a \times b^{-1} \ (mod \ p)$
##### 阶乘模逆元
若
$a \times a^{-1} \equiv 1 \ (mod \ p) \\ b \times b^{-1} \equiv 1 \ (mod \ p)$
则
$$ab \times a^{-1} b^{-1} \equiv 1 \ (mod \ p)$$
根据逆元定义,则
$$(ab)^{-1} \equiv a^{-1}b^{-1} \ (mod \ p)$$
因此
$\large \displaystyle (n!)^{-1}= \prod_{i=1}^{n}i^{-1} \ (mod \ p)$
本题要求结果 $mod\ (1e9+7)$, **模是质数(~~一般取模的都是质数~~)**,如果有除法,可以直接使用 **费马小定理+快速幂** 求逆元转化为乘法求解。
现在要求计算出 $a!$, ${b!}^{-1}$, ${(a-b)!}^{-1}$,可以使用两个数组来递推得到:
$\large fact[i] = i!\ \% \ p$
$\large infact[i] = (i!)^{-1}\ \% \ p = ((i-1)!^{-1}*i^{-1}\ ) \% \ p$
> **解释**:上面推导的阶乘模逆元
所以: $C_a^b=\frac{a!}{(a-b)! * b!} = (fact[a] * infact[a-b] * infact[b] )\ \% \ p$
#### C++ 代码
```cpp
#include
using namespace std;
#define int long long
#define endl "\n"
const int N = 100010;
const int p = 1e9 + 7;
int fact[N]; // 阶乘结果数组
int infact[N]; // 阶乘逆元结果数组
// 快速幂
int qmi(int a, int k) {
int res = 1;
while (k) {
if (k & 1) res = res * a % p;
a = a * a % p;
k >>= 1;
}
return res;
}
signed main() {
// base case
fact[0] = infact[0] = 1;
for (int i = 1; i < N; i++) {
fact[i] = fact[i - 1] * i % p;
infact[i] = infact[i - 1] * qmi(i, p - 2) % p;
}
int n;
cin >> n;
while (n--) {
int a, b;
cin >> a >> b;
printf("%lld\n", fact[a] * infact[b] % p * infact[a - b] % p);
}
}
```
### [$AcWing$ $887$. 求组合数 $III$](https://www.acwing.com/problem/content/889/)
数据范围:$b<=a<=1e18$,$p<=1e5$,$p$是质数
本题中$a,b$都太大了,如果像上一题一样预处理出$fact[],infact[]$,直接就炸了,肯定行不通!
还好,它的$p$比较小,而且是质数,我们有一种武器叫$Lucas$公式:
#### 1.$Lucas$公式
$\large C_a^b \equiv C_{a\%p}^{b\%p} * C_{a \div p}^{b \div p} (mod \ p)$
>
> 注意:
> 这个$p$是小于$1e5$的,看到要求模$1e9+7$可不能用$Lucas$定理啊!不是干那个的啊!适合$a,b$很大,$p$很小的场景啊!!
#### 2.此种情况下如何求解$C_a^b$
$C_a^b=\frac{a!}{(a-b)! \times b!}=\frac{a \times (a-1) \times (a-2) \times ...\times(a-b+1) \times (a-b) \times ... \times 1}{(a-b) \times (a-b-1) \times ... \times 1 \times b!}= \frac{a \times (a-1) \times (a-2) \times ...(a-b+1)}{b!}=\frac{a \times (a-1) \times (a-2) \times ...(a-b+1)}{b \times (b-1) \times (b-2) \times ... \times 2 \times 1}$
根据这个变形:
- 对于$a$来讲,需要变量$j$从$a$一直遍历到$a-b+1$
- 对于$b$来讲,需要变量$i$从$1$一起遍历到$b$
从$a$倒着走到$a-b+1$是$b$次($a>=b$),比如$10$遍历到$8$,就是$10,9,8$三次,即$b=3$,也就是$10-3+1=8$。
而$i$也是遍历$b$次,太巧了!它们两个可以在一个$b$次的循环中一起变动 (代码能省则省啊~)!
``` c++
int C(int a, int b) {
if (a < b) return 0;
int down = 1, up = 1;
for (int i = a, j = 1; j <= b; i--, j++) {
up = up * i % p;
down = down * j % p;
}
return up * qmi(down, p - 2, p) % p;
}
```
#### $Code$
```cpp
#include
using namespace std;
#define int long long
#define endl "\n"
// 快速幂
int qmi(int a, int k, int p) {
int res = 1;
while (k) {
if (k & 1) res = res * a % p;
a = a * a % p;
k >>= 1;
}
return res;
}
// 功能:组合数模板
int C(int a, int b, int p) {
if (a < b) return 0;
int down = 1, up = 1;
for (int i = a, j = 1; j <= b; i--, j++) {
up = up * i % p;
down = down * j % p;
}
return up * qmi(down, p - 2, p) % p;
}
// Lucas公式
int lucas(int a, int b, int p) {
if (a < p && b < p) return C(a, b, p);
return C(a % p, b % p, p) * lucas(a / p, b / p, p) % p; // 递归套用公式
}
int n, p;
signed main() {
cin >> n;
while (n--) { // n组询问
int a, b;
cin >> a >> b >> p;
cout << lucas(a, b, p) << endl; // 利用lucas公式计算组合数
}
return 0;
}
```
### [四、$AcWing$ $888$. 求组合数 $IV$](https://www.acwing.com/problem/content/890/)
**不让取模怎么办?**
#### 1、与前三道题的区别
不再是数据上限的问题了,而是一直不$mod$,有多大都保留,这无疑可能会爆$long\ long$,需要使用高精度。
#### 2、公式一【从定义出发的组合数公式】:
(1) $\large C_a^b=\frac{a \times (a-1) \times ... \times(a-b+1)}{b\times (b-1) \times ... \times 1}=\frac{a \times (a-1) \times ... \times (a-b+1) \times (a-b)!}{ b \times (b-1) \times ... \times 1 \times (a-b)!} =\frac{a!}{b! \times (a-b)!}$
#### 3、是不是我们利用高精度+上面的组合数公式直接算就行了?
不是的,因为$yxc$(大雪菜老师)说,这样的效率太低,不可以,需要再想一个好办法。
#### 4、公式二 【算术基本定理】
算术基本定理:$\large C_a^b=p_1^{\alpha_1} \times p_2^{\alpha_2} \times p_3^{\alpha_3} ... \times p_k^{\alpha_k}$
其中$p_1$,$p_2$...是质数,$\alpha 1$,$\alpha 2$,...是指质数$p_1$,$p_2$,...的个数。 如果能分解质因数成功的话,那么就可以通过 **高精度乘法** 解决掉这个问题。
(1) 那么$p_1$和$p_2$这些东东怎么求?
**思路**:因为$a,b$都是在$[1,5000]$之间的数,所以可以通过筛质数的方法,提前获取到一个质数数组,然后逐个去看,是不是含有这个质数。就能知道有哪些$p_1,p_2,...$了。
(2) $\alpha_1$,$\alpha_2,...,\alpha_k$又该怎么求呢?
#### 5、公式三【求质数$p$在$a!$中出现的次数】
$\large cnt=\lfloor \frac{a}{p} \rfloor + \lfloor \frac{a}{p^2} \rfloor + \lfloor \frac{a}{p^3} \rfloor + ...+ \lfloor \frac{a}{p^k} \rfloor$
[参考资料](https://blog.csdn.net/spidy_harker/article/details/88414504)
计算$n$的阶乘中质数$p$的个数:
```cpp {.line-numbers}
int get(int n, int p) {
int res = 0;
while (n) {
res += n / p;
n /= p;
}
return res;
}
```
**举个栗子**:
$ 5!=1 \times 2 \times 3 \times 4 \times 5$,求$2$的个数,
则$1 \sim 5$之间含$2$的个数就是 $\lfloor \frac{5}{2} \rfloor$,就是$2$个。
则$1 \sim 5$之间含$2^2$的个数就是 $\lfloor \frac{5}{2^2} \rfloor$,就是$1$个。
$2^3$就大于$5$,就不再继续。那么一共的个数就是$2+1=3$个。表示在 $5!$这个数字中,存在$3$个$2$,就是$2$中有$1$个$2$,$4$中有两个$2$。
#### 6、算法流程
(1)、筛素数,把$1-5000$之间的素数筛出来。
(2)、计算$C_a^b$中每个已求得素数的个数。
(3)、利用高精度,计算$C_a^b$$=p_1^{\alpha1} \times p_2^{\alpha2} \times p_3^{\alpha3} ... \times p_k^{\alpha k}$的值。
#### $Code$
```cpp
#include
using namespace std;
const int N = 5010;
int primes[N], cnt;
bool st[N];
// 欧拉筛
void get_primes(int n) {
for (int i = 2; i <= n; i++) {
if (!st[i]) primes[cnt++] = i;
for (int j = 0; primes[j] <= n / i; j++) {
st[primes[j] * i] = true;
if (i % primes[j] == 0) break;
}
}
}
// 高精乘低精
void mul(int a[], int &al, int b) {
int t = 0;
for (int i = 1; i <= al; i++) {
t += a[i] * b;
a[i] = t % 10;
t /= 10;
}
while (t) {
a[++al] = t % 10;
t /= 10;
}
}
/**
* 功能:n的阶乘中包含的质因子p的个数
* @param n n的阶乘
* @param p 质因子p
* @return 有多少个
*/
int get(int n, int p) {
int cnt = 0;
while (n) { // p^1的个数,p^2的个数,p^3的个数...
cnt += n / p;
n /= p;
}
return cnt;
}
// C(a,b)的结果,高精度保存到c数组,同时,返回c数组的长度len
void C(int a, int b, int c[], int &cl) {
// 乘法的基数是1
c[1] = 1, cl = 1; // 由于高精度数组中只有一位,是1,所以长度也是1
for (int i = 0; i < cnt; i++) { // 枚举区间内所有质数
int p = primes[i];
/*
C(a,b)=a!/(b! * (a-b)!)
a!中有多少个质数因子p
减去(a-b)!的多少个质数因子p,
再减去b!的质数因子p的个数,就是总个数
s记录了p这个质数因子出现的次数
*/
int s = get(a, p) - get(b, p) - get(a - b, p);
while (s--) mul(c, cl, p); // 不断的乘p,结果保存到数组c中。len将带回c的有效长度
}
}
int a, b;
int c[N], cl;
int main() {
cin >> a >> b;
// 筛质数
get_primes(N - 1);
// 计算组合数
C(a, b, c, cl);
// 输出高精度结果
for (int i = cl; i >= 1; i--) printf("%d", c[i]);
return 0;
}
```
#### 7、这段代码如何理解?
```
s = get(a, p) - get(a - b, p) - get(b, p);
```
看公式一:
$C_a^b=\frac{a \times (a-1) \times ... \times(a-b+1)}{b\times (b-1) \times ... \times 1}$ $=\frac{a \times (a-1) \times ... \times (a-b+1) \times (a-b)!}{ b \times (b-1) \times ... \times 1 \times (a-b)!}$ $=\frac{a!}{b! \times (a-b)!}$
$a!$中质数$p$的个数,减去$b!$中质数$p$的个数,再减去$(a-b)!$中质数$p$的个数,就是公因子消掉的意思。