You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

450 lines
21 KiB

2 years ago
## 珂朵莉树
### 珂朵莉
珂朵莉·诺塔·瑟尼欧里斯是动画《 末日时在做什么?有没有空?可以来拯救吗?》中的女主角,五位成体妖精兵之一。最强圣剑“瑟尼欧里斯”的适合者 。
在第28号浮游岛上意外跌落而与威廉相遇并受到他的帮助。
性别:女性 年龄15 种族:黄金妖精 -leprechaun- 发色:苍空 瞳色:凪の海 所属成体妖精兵等级S 表层信念:不去反抗无可奈何的命运 里层信念:不能阻止无可救药的感情
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/{year}/{month}/{md5}.{extName}/202308251415608.png)
### 一、引入
**[$CF896C$ $Willem$, $Chtholly$ $and$ $Seniorious$](https://codeforces.com/problemset/problem/896/c)**
-- 威廉...
-- 怎么了?
-- 瑟尼欧里斯好像出了什么问题...
-- 我会看看的...
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/{year}/{month}/{md5}.{extName}/202308251049607.png)
瑟尼欧里斯是一把由特殊护符按特定顺序排列组成的剑。
已经 $500$ 年过去了,现在剑的状态很差,所以威廉决定检查一下。
瑟尼欧里斯由$n$ 片护符组成,威廉把它们排成一列,每个护符上有一个数字 $a_i$
为了保养它,威廉需要进行 $m$ 次操作。
这里有四种操作:
- $1$ $l$ $r$ $x$ : 将区间 $[l,r]$ 上的数加上 $x$。
- $2$ $l$ $r$ $x$ : 将区间 $[l,r]$ 上的数全部变为$x$。
- $3$ $l$ $r$ $x$ : 查询区间 $[l,r]$ 的第 $x$ 大数。
- $4$ $l$ $r$ $x$ $y$ : 查询区间 $[l,r]$ 上的数的 $x$ 次方之和对 $y$ 取模的值。
本题输入较为特殊,输入格式如下:
一行四个整数,分别为 $nmseedvmax$,前两个变量意义如题目所述,后两个变量用于生成随机数据,数据生成伪代码如下:
```cpp {.line-numbers}
def rnd():
ret = seed
seed = (seed * 7 + 13) mod 1000000007
return ret
for i = 1 to n:
a[i] = (rnd() mod vmax) + 1
for i = 1 to m:
op = (rnd() mod 4) + 1
l = (rnd() mod n) + 1
r = (rnd() mod n) + 1
if (l > r):
swap(l, r)
if (op == 3):
x = (rnd() mod (r - l + 1)) + 1
else:
x = (rnd() mod vmax) + 1
if (op == 4):
y = (rnd() mod vmax) + 1
```
### 二、柯朵莉树
#### 0x01 为什么很多题解不对,照着写会$RE$
因为如果要用 $split$ 操作,截取一段区间的时候,必须要先 $split(r+1)$ ,再 $split(l)$ ,否则会有 $RE$ ,具体原因我后面会细说。请大家参考其他题解或者资料的时候,也注意这一点。
#### 0x02 什么是珂朵莉树
珂朵莉树,还有个名字叫老司机树($Old$ $Driver$ $Tree$, $ODT$),是一个暴力数据结构。甚至都不一定可以将其称之为数据结构了,我们不妨认为它是一类题目的暴力做法,对于随机数据比较有效。
#### 0x03 珂朵莉树可以解决什么问题
有一类问题,对一个序列,进行一个 **区间推平操作**。就是把一个范围内,比如$[l,r]$ 范围内的数字变成同一个。可能除了推平以外,还夹杂其他操作。**如果数据是随机的,就可以用珂朵莉树啦**。比如这道题中的操作$2$ ,将 $[l,r]$ 区间内的所有数都改成 $x$,这就是一个区间推平操作。
#### 0x04 珂朵莉树的基本原理
暴力的地方来喽,刚才不是提到有推平操作么?那么推平操作结束以后,被推平的区间内的每个数字都是相同的。其实经过若干次推平以后,我们可以看成,这个序列上的数字是一段一段的,每一小段里面数字相同,整个区间由若干个小段组成。类似这样:
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/{year}/{month}/{md5}.{extName}/202308250940742.png)
这个时候,我们定义一个结构体,用一个结构体变量,来表示每个数字相同的段。
```cpp {.line-numbers}
struct Node {
int l, r; // l和r表示这一段的起点和终点
mutable int v; // v表示这一段上所有元素相同的值是多少,注意关键字 mutable,使得set中结构体属性可修改
bool operator<(const Node &b) const {
return l < b.l; //
}
};
```
相关变量的含义,注释里面已经解释了。这里有个细节是, $v$ 变量前面加个了 `mutable` 关键字。 `mutable` 的意思是,即使它是个常量,也允许修改$v$的值,具体我在下面区间修改的地方解释。
当每个数字相同的区间都用一个结构体变量表示以后,我们把这四段插入到一个 $set$ 里面, $set$ 会按照每段的左端点顺序进行排序,这样这个序列就维护好了,类似下图:
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/{year}/{month}/{md5}.{extName}/202308250943644.png)
当然,对于本题,一开始的时候,每段都只有一个数,所以我们的$set$里面维护$n$个长度为$1$的段。
#### 0x05 核心操作 $split$
天下大势,分久必合,合久必分,珂朵莉树也一样。随着推平操作的进行,有一些位置被合并到了一个 $Node$ 里面,但是也有可能一个 $Node$ 要被拆开,其中的一部分要被改变值。
$split$ 操作就是干这个用的,参数是一个位置 $x$ ,以 $x$ 去做切割,找到一个包含 $x$ 的区间,把它分成 $[l,x-1] , [x,r]$ 两半。当然:
-**如果 $x$ 本身就是一个区间的开头,就不用切割了,直接返回这个区间的迭代器**
-**如果切割成功了,就返回两半中后面那么$[x,r]$区间的迭代器**
先看代码
```cpp {.line-numbers}
// 分裂:[l,x-1],[x,r]
set<Node>::iterator split(int x) {
auto it = s.lower_bound({x});
if (it != s.end() && it->l == x) return it; // x是区间开头直接返回it迭代器
it--; // 先减1位置再说
if (it->r < x) return s.end(); // rx,s.end()
int l = it->l, r = it->r, v = it->v; // 记录下来
s.erase(it); // 删除整体区间
s.insert({l, x - 1, v}); //[l,x-1]拆分
return s.insert({x, r, v}).first; //[x,r]拆分.insert函数返回pair其中的first是新插入结点的迭代器
}
```
首先,第一行里面的 $s$ 是一个全局变量,是那个装 $Node$ 的 $set$ 。大家知道 $set$ 里面有个函数叫 `lower_bound` ,它的作用是返回跟参数相等的,或者比参数更大的第一个 $set$ 中元素的位置,返回的是一个迭代器。
那么我们按照 $pos$ 创建一个 $Node$ ,然后去查询,就找到了 $it$ 这个位置。这个时候有三种情况,一种是我们正好找到了一个区间,它是以 $x$ 开头的,所以就对应了代码中的第一个 $if$ 判断,这时候直接返回这个区间的迭代器 $it$。
还有两种情况是,我们找到的这个区间是正好比包含 $x$ 的区间大一点点的,或者$x$太大了,超过了最后一个区间的右端点。不管怎样先把$it$往前挪一个格,然后这时候看看$it$的右端点,如果比$x$小,说明是$x$太大了,就直接返回$s$的$end()$迭代器。否则的话,现在$it$就是应该包含了$x$的那个区间。这时候,我们要把它一分为二,把原来的那个区间删掉,然后插入两个新区间,分别是$[l,x-1]$和$[x,r]$。
这里还有个小技巧,$insert$这个函数是有返回值的,它返回的是一个$pair$$pair$的第一个字段正好是新插入的那个$Node$的位置的迭代器,所以$return$那个东西就行了。
#### 0x06 推平操作$assign$
刚刚的$split$作用是分,现在还需要一个相反的操作,就是合并。当出现对区间的推平操作的时候,我们可以把整个$set$中所有要被合并掉的$Node$都删掉,然后插入一个新区间表示推平以后的结果。
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/{year}/{month}/{md5}.{extName}/202308250946693.png)
如图,按照上面的例子,$set$里面有$4$个$Node$,此时我们想进行一次推平操作,把$[2,8]$区间内的元素都改成$666$.首先我们发现,$[8,10]$是一个区间,那么需要先$split(9)$,把$[8,8]$和$[9,10]$拆成两个区间。同理,原来的$[1,2]$区间,也需要拆成$[1,1]$和$[2,2]$。
> **注**:为啥要$split(9)$?因为$split(x)$划分开的是$[l,x-1],[x,r]$,$split(9)$就会把$[l,8],[9,r]$割开,使得我们想操作的边界暴露出来,否则是一体化的没法整体操作。同理,$split(2)$就会把$[1,1],[2,2]$割开。
接下来,我们把要被合并的从$2$到$8$的所有$Node$都从$set$里面删掉,再重新插入一个$[2,8]$区间就行了。删除某个范围内的元素可以用$set$的$erase$函数,这个函数接受两个迭代器$s$和$t$,把$[s,t)$范围内的东西都删掉。
代码如下:
```cpp {.line-numbers}
// 区间赋值
void assign(int l, int r, int x) {
auto R = split(r + 1), L = split(l);
s.erase(L, R); // 删除旧区间
s.insert({l, r, x}); // 增加新区间
}
```
#### 0x07 推平操作里面$RE$的坑
现在说一下为啥大部分题解都不对,注意刚刚$assign$函数里面调用的那两次$split$,我是先$split(r+1)$,计算出$itr$,然后再$split(l)$,计算$itl$的。这个顺序不能反。
为啥不能反?举个具体例子,比如现在有个区间是$[1,4]$,我们想从里面截取$[1,1]$出来,那么我们需要调用两次$split$,分别是$split(2)$和$split(1)$。
![](https://dsideal.obs.cn-north-1.myhuaweicloud.com/HuangHai/BlogImages/{year}/{month}/{md5}.{extName}/202308250947159.png)
假设先调用$split(1)$,如图中间的结果:
现在的$itl$指向的还是原来的那个$Node$,没有什么变化。但是当我们后续调用$itr$的时候,出事儿了。因为这时候,我们把原来的$[1,4]$区间删掉了,拆成了两份,$itr$指向的是后面那个,但是原来$itl$指向的那个已经被$erase$掉了。这时候用$itl$和$itr$调用$s.erase$的时候就会出问题,直接$RE$。
有同学说我顺序反了没$RE$啊,也$AC$。恭喜你,你人品好。这东西理论上会$RE$,但是实际上概率不大,我对拍了一下,大概$1\%$的概率$RE$吧。但是人品不好的同学,可能上来就$RE$一片,而且是随机$RE$,同一个数据,一会儿能过,一会儿过不了。所以,还是别给自己找麻烦了。
#### 0x08 修改操作$add$
区间内每个数都加上$x$,这个实现方式和前面的推平差不多,我们还是找到这个区间的首尾,然后循环一遍区间内的每个$Node$,把每个$Node$的$v$都加上$x$就行
```cpp {.line-numbers}
// 区间加
void add(int l, int r, int x) {
// 必须先计算itr,后计算itl
auto R = split(r + 1), L = split(l);
for (auto it = L; it != R; it++) it->v += x;
}
```
这里是用一个迭代器$it$遍历每个位置,把每个位置的$v$都加$x$。大家发现前面提到的$mutable$的作用了么?因为这里$it$是个常量迭代器,它不能修改它指向的那个$Node$,而我们这里要改$Node$里面的$v$,所以就把$v$声明为$mutable$,就可以改了。否则会得到类似这样的编译错误:
`error: cannot assign to return value because function 'operator->' returns a const value`
#### 0x09 其他操作
其他操作都是类似的暴力操作。比如要找区间第$k$小,那么就把区间内所有的$Node$拿出来,按照$v$从小到大排序,把每个$Node$里面的区间长度相加,看看啥时候加够为止。这里就不细致展开,有问题可以去看代码。
```cpp {.line-numbers}
// 排名第x位的数值
int rnk(int l, int r, int x) {
vector<PII> v;
auto R = split(r + 1), L = split(l);
for (auto it = L; it != R; it++)
v.push_back({it->v, it->r - it->l + 1}); // 值,个数
sort(v.begin(), v.end()); // 默认按PII的第一维也就是值由小到大排序
// 暴力拼接出排名第x大数的数值是多少
for (auto c : v)
if (c.second < x)
x -= c.second;
else
return c.first;
}
// 快速幂 (x^y)%p
// #define int long long
int qmi(int x, int y, int p) {
int res = 1;
x %= p;
while (y) {
if (y & 1) res = res * x % p;
y >>= 1;
x = x * x % p;
}
return res;
}
int calc(int l, int r, int x, int y) {
auto R = split(r + 1), L = split(l);
int res = 0;
for (auto it = L; it != R; it++)
// it枚举的是每个区间段每个区间段内的值是一样的it->v
// 区间段的长度 = it->r - it->l + 1
// 总和 = SUM(区间段的值 * 区间段的长度)
// 注意一步一取模
res = (res + qmi(it->v, x, y) * (it->r - it->l + 1) % y) % y;
return res;
}
// 用C++翻译伪代码
int rnd() {
int ret = seed;
seed = (seed * 7 + 13) % MOD;
return ret;
}
```
#### 0x0A 复杂度
因为本题数据是随机的,所以每次$assign$操作的区间长度大概在$vmax/3$,所以经过很多次$assign$以后,区间个数不会太多,大概在$log$这个数量级上。这样每次暴力操作的复杂度差不多也是这个数量级。详细的分析,可以参考 **[这篇博客](https://www.luogu.com.cn/blog/blaze/solution-cf896c)**
#### 0x0B 代码时间
 珂朵莉树的核心其实就二十行左右的代码,并不是什么很难的算法,但是由于其对于数据的要求,很少有题将其作为正解,但是考场骗分还是很有用的。
```cpp {.line-numbers}
#include <bits/stdc++.h>
using namespace std;
#define int long long // 太多的long long,太讨厌了我喜欢重定义成int
const int MOD = 1000000007;
const int N = 100010;
typedef pair<int, int> PII;
int n, m; // n 片护符,m 次操作
int seed, vmax; // 后两个变量用于生成随机数据,生成办法给了一段伪代码
// 柯朵莉树模板
struct Node {
int l, r; // l和r表示这一段的起点和终点
mutable int v; // v表示这一段上所有元素相同的值是多少,注意关键字 mutable,使得set中结构体属性可修改
bool operator<(const Node &b) const {
return l < b.l; //
}
};
set<Node> s; // 柯朵莉树的区间集合
// 分裂:[l,x-1],[x,r]
set<Node>::iterator split(int x) {
auto it = s.lower_bound({x});
if (it != s.end() && it->l == x) return it; // 一击命中
it--; // 没有找到就减1个继续找
if (it->r < x) return s.end(); // ,s.end()
int l = it->l, r = it->r, v = it->v; // 没有被返回,说明找到了,记录下来,防止后面删除时被破坏
s.erase(it); // 删除整个区间
s.insert({l, x - 1, v}); //[l,x-1]拆分
// insert函数返回pair其中的first是新插入结点的迭代器
return s.insert({x, r, v}).first; //[x,r]拆分
}
// 区间加
void add(int l, int r, int x) {
// 必须先计算itr,后计算itl
auto R = split(r + 1), L = split(l);
for (auto it = L; it != R; it++) it->v += x;
}
// 区间赋值
void assign(int l, int r, int x) {
auto R = split(r + 1), L = split(l);
s.erase(L, R); // 删除旧区间
s.insert({l, r, x}); // 增加新区间
}
// 排名第x位的数值
int rnk(int l, int r, int x) {
vector<PII> v;
auto R = split(r + 1), L = split(l);
for (auto it = L; it != R; it++)
v.push_back({it->v, it->r - it->l + 1}); // 值,个数
sort(v.begin(), v.end()); // 默认按PII的第一维也就是值由小到大排序
// 暴力拼接出排名第x大数的数值是多少
for (auto c : v)
if (c.second < x)
x -= c.second;
else
return c.first;
}
// 快速幂 (x^y)%p
// #define int long long
int qmi(int x, int y, int p) {
int res = 1;
x %= p;
while (y) {
if (y & 1) res = res * x % p;
y >>= 1;
x = x * x % p;
}
return res;
}
//[l,r]之间每个值的x次方求和对y取模
int calc(int l, int r, int x, int y) {
auto R = split(r + 1), L = split(l);
int res = 0;
for (auto it = L; it != R; it++)
// it枚举的是每个区间段每个区间段内的值是一样的it->v
// 区间段的长度 = it->r - it->l + 1
// 总和 = SUM(区间段的值 * 区间段的长度)
// 注意一步一取模
res = (res + qmi(it->v, x, y) * (it->r - it->l + 1) % y) % y;
return res;
}
// 用C++翻译伪代码
int rnd() {
int ret = seed;
seed = (seed * 7 + 13) % MOD;
return ret;
}
/*
参考答案:
2
1
0
3
*/
signed main() {
#ifndef ONLINE_JUDGE
freopen("CF896C.in", "r", stdin);
#endif
// 加快读入
ios::sync_with_stdio(false), cin.tie(0);
cin >> n >> m >> seed >> vmax;
for (int i = 1; i <= n; i++) { // n 片护符
int ai = (rnd() % vmax) + 1; // 每个护符上有一个数字 a[i]
s.insert({i, i, ai}); // 一个格子一个数从i~i,值为a[i],这是在初始化构建柯朵莉树啊
}
for (int i = 1; i <= m; i++) { // m 个操作
int op, l, r, x, y;
op = (rnd() % 4) + 1;
l = (rnd() % n) + 1;
r = (rnd() % n) + 1;
if (l > r) swap(l, r);
if (op == 3)
x = (rnd() % (r - l + 1)) + 1;
else
x = (rnd() % vmax) + 1;
if (op == 4)
y = (rnd() % vmax) + 1;
// 上面的都是翻译伪代码
// 真正的处理开始了
if (op == 1)
add(l, r, x); // 区间全部加
else if (op == 2)
assign(l, r, x); // 区间全部改
else if (op == 3)
cout << rnk(l, r, x) << endl; // x
else
cout << calc(l, r, x, y) << endl; // [l,r] x y
}
return 0;
}
```
---
$Q$: 为什么要$Split(r + 1)$
$A$:便于取出 $[l,r+1)$ 的部分,即 $[l,r]$
$Q$:为什么要先$Split(r + 1)$,再$Split(l)$
$A$: 因为如果先$Split(l)$,返回的迭代器会位于所对应的区间以$l$为左端点,此时如果$r$ 也在这个节点内,就会导致$Split(l)$返回的迭代器被$erase$掉,导致$RE$。
$Q$:
这些操作里面全是$Split$,复杂度理论上会退化成暴力(不断分裂直到无法再分),怎么让它不退化?
这便涉及到珂朵莉树不可或缺的操作:$Assign$。
$Assign$操作也很简单,$Split$之后暴力删点,然后加上一个代表当前区间的点即可。
<<<<<<< HEAD
### 三、习题
#### [$P3740$ $[HAOI2014]$ 贴海报](https://www.cnblogs.com/littlehb/p/17656780.html)
#### [$P1204$ $[USACO1.2]$ 挤牛奶$Milking$ $Cows$](https://www.cnblogs.com/littlehb/p/17656983.html)
#### [$P4979$ 矿洞:坍塌](https://www.cnblogs.com/littlehb/p/17661421.html)
#### [$P2787$ 语文$1$$chin1$- 理理思维](https://www.cnblogs.com/littlehb/p/17662149.html)
#### [$SP13015$ $Counting$ $Primes$](https://www.cnblogs.com/littlehb/p/17662387.html)
#### [$CF915E$ $Physical$ $Education$ $Lessons$](https://www.cnblogs.com/littlehb/p/17664882.html)
**【线段树,柯朵莉树】**
#### [$P4344$ [$SHOI2015$]脑洞治疗仪](https://www.cnblogs.com/littlehb/p/17671651.html)
**【线段树维护区间最大连续子序列和,柯朵莉树】**
#### [$P2253$ 好一个一中腰鼓!](https://www.cnblogs.com/littlehb/p/17679450.html)
**【线段树,相邻不相同,最长长度】**
#### [$P2572$ [$SCOI2010$] 序列操作](https://www.cnblogs.com/littlehb/p/17677903.html)
**【线段树,$8$个属性,$2$个懒标记的线段树,难度立即提升!柯朵莉树只能过$3$个测试点】**
### 珂朵莉树($ODT$)专项训练
https://www.luogu.com.cn/training/91563
[P4690 [Ynoi2016] 镜中的昆虫](https://www.luogu.com.cn/problem/P4690)
[DZY Loves Colors](https://www.luogu.com.cn/problem/CF444C)
[#10115. 「一本通 4.1 例 3」校门外的树](https://loj.ac/p/10115)
[校门外的树](https://vijos.org/p/1448)
https://www.cnblogs.com/Multitree/p/17650799.html
$TODO$
#### [CF343D Water Tree涉及到树链剖分](https://www.luogu.com.cn/problem/CF343D)
=======
>>>>>>> e52e246c9082571c684ffd7ea8565883fd93e8cf