Tsawke 的十二月模拟赛 题解

God does not play dice with the universe

原题是 LG-P3779 [SDOI2017] 龙与地下城

关于自适应辛普森 Simpson - 辛普森法 学习笔记

题面

给定一个 m 面的骰子,等概率产出 0,1,2,,m1,投 n 次,求投出来的数之和在区间 [A,B] 的概率。

Solution

首先介绍一点前置知识:

正态分布:图形不再赘述,唯一需要注意的就是随机变量 X 的正态分布只需要它的期望 μ 和方差 σ2 即可描述,记作 N(μ,σ2),不难发现这恰好对应着题干。

概率密度函数:依然考虑一个随机变量 X,若其为离散的那么显然可以简单的求出任意点的概率。但若其为连续型的,那么一个点的概率在极限意义下为 0,然然而查询一段区间的时候显然不为 0,所以我们便引入了概率密度函数来描述这个概率,对于随机变量 X 的概率密度函数 f(x),需要满足 f(x) 在区间内的积分等于 X 落在该区间的概率。

然后有个结论:正态分布的概率密度函数为:

f(x)=12πσ2e(xμ)22σ2

关于这个东西的证明。。。完全不是人看的,似乎只能强行记下来这个公式。。。如果你一定要看一下证明,网上倒是也有一个 正态分布推导过程

然后还有就是 C++ 库里自带了个 erferfc,大概求的是误差函数的积分和互补误差函数之类的,(我不会),有兴趣可以看看。

然后所以如果我们能够证明本题这玩意是正态分布的,那么就直接对这个 f(x) 做自适应辛普森,求一下积分就行了。

独立同分布:首先独立比较好理解,就是两个随机变量之间无影响,和高中数学里面的独立事件差不多。然后同分布就是指一些随机变量服从相同的分布。

Tips:概率论中 E(X) 表示期望,D(X) 表示方差。

中心极限定理:对于 n 个独立同分布(如本题中的相同骰子)的随机变量 X1,X2,,Xn,若 E(Xi)=μ,D(Xi)=σ2,令:

Yn=i=1nXinμnσ2

n 足够大,则我们认为 YnN(0,1)

然后还有一个常用推论,当然首先我们需要知道正态分布的一点运算规则,即:

XN(a,b)cXN(ca,c2b),从期望和方差的意义不难理解。

XN(a,b)X+cN(a+c,b),同理不难得出。

所以我们可以将刚才的中心极限定理式子转化为:

i=1nXiN(nμ,nσ2)

也就是说,本题里求的这些骰子的点数和,实际上就是 n 个独立同分布的和,所以一定服从 N(nμ,nσ2),用我们刚才写的正态分布概率密度函数带进去这个期望和方差然后求个积分即可。

然后发现这东西套个自适应辛普森就可以在 O(玄学) 的复杂度完成。

但是我们不难发现这个东西还有点问题,就是中心极限定理需要一个前提,n 足够大,对于一些 n=1 之类的数据点用这个就显然寄了,所以我们要考虑一些数据点分治的做法。

显然对于 n 较小的数据,我们可以考虑多项式,多项式 i 次方项的系数为骰子值为 i 的概率,显然当 n=1 时,假设骰子面数为 m,不难想到多项式为 1mxm1+1mxm2++1mx1+1mx0。然后很容易想到对于其它的 n 结果就是这个多项式的 n 次方,我们只需要用 FFT 优化一下然后在结果里求出指数在 [A,B] 之间的系数和即可,这东西可以用多项式快速幂优化(这个实际上不算是多项式快速幂,因为最终多项式总长度较小,所以在正常 FFT 时写个复数的快速幂就行),我们可以分析一下,显然多项式初始项数最多为 m,所以时间复杂度大概是 O(nmlognm),常数不小,然后 nm4e6 级别的,总之 nm1e5 应该不成问题,而且因为我们的中心极限定理一般要求 n30 就可以了,所以这个理论上就可以过了。

Tips:仅用多项式快速幂期望得分 60~70。

upd:上述过程就可以通过本题了,需要注意的一个问题是不要忘记在自适应辛普森的过程中限制层数,后文是我最开始写这道题时的因为没有限制层数的一些误区与另一种类似的方法,仅供参考。


如果不在自适应辛普森中限制层数,那么会有精度问题,原因除此之外还可能因拟合 N(0,1) 的概率密度函数会比拟合 N(nμ,nσ2) 精度更高一点,可能因为 nμnσ2 的值域范围太大了,再加上自适应辛普森本来精度就很玄学,所以会导致最终答案精度爆炸。

总之还可以考虑另一个方法,即中心极限定理的初始式子:

Yn=i=1nXinμnσ2

不难发现我们知道了限定的 i=1nXi 的范围,也就可以带进式子里直接推出 Yn 的范围,然后用自适应辛普森跑一下 N(0,1) 的概率密度函数,因为 YnN(0,1),所以求出对应范围之后直接求 N(0,1) 的概率密度函数在新范围里的积分即为答案。不过这样会发现依然是错误的如果在自适应辛普森中限制层数那么就没有问题了。

检查发现,对于正态分布中,在角落可能很小,从而导致 [l,mid],[mid,r],[l,r] 都很小,从而直接返回 0,可以感性理解一下,所以可能会导致拟合的误差过大,于是考虑每次求范围 [A,B] 的时候分别拟合 [0,A][0,B],然后用 [0,B] 的值减去 [0,A] 的,这样是等效的,且会更多的引入较大的值使得精度更高,改成此方法后即使不限制层数也可以通过本题。

Tips:代码中注释部分即为后半部分的实现方式。

Code

真正的OIer从不女装

原题 LG-P5500 [LnOI2019]真正的OIer从不女装

显然一次反转和多次反转等效,即对应题目背景。同时亦等效为将查询区间的某个前缀拼在其最后,换句话说每一次反转操作代表着转换为任意一个循环同构的序列,同时这也印证了一次反转与多次反转等效。所以线段树维护区间最长相同子串,左端点的子串,右端点的子串,左右端点颜色,区间长度等,支持区间修改区间查询和初始化,然后询问的时候判一下 k 是不是 0 即可,随便写写就过了,很好写很好调。

简单数据结构

原题 LG-P5350 序列

emm 感觉没什么好说的,就是无脑写个 ODT 即可,唯一需要注意的就是维护 ODT 的时候需要注意尽量保证序列里元素连续,也就是复制的时候先复制再删除,否则会有奇怪的未知错误。

然后如果你非要写可持久化平衡树我也不拦你。

什么???NP问题???

原题 LG-P4727 [HNOI2009]图的同构计数

题解在这里有 Group Theory - 浅析群论

首先称两个图同构,当且仅当两个图可以通过对顶点的重标号使得两图完全相同。

然后这个东西的答案是一个数列,OEIS 上的编号是 A000088

然后我们再次回到 Burnside定理,集合 X 即为 n 个顶点可能构成的 2(n2)=2n(n1)2 个简单无向图。置换群 G 即为 [1,n] 的全排列。

然后我们的难点依然在于求不动点的数量。也就是说对于一个置换 g,有多少图在经过置换 g 之后与原图同构。

下面将会有一个与上一题,即 Polya定理 模板,或者说群论的标准套路。我们可以考虑先将图认为是完全图,然后用两种颜色对边进行染色,两种颜色表示该边存在或不存在。于是此时我们就会发现对于某一个置换 g,仍然存在一个等价类中,所有边必须均存在或不存在。

举个例子,对于一个标号为 1,2,3 的三角形完全图,如果有置换 g=(2,3,1),那么此时不难发现三条边同属一个等价类,因为你要么使三条边均存在,要么均不存在,否则按照这个置换的意义,旋转一下三角形,就会使得图不同构。此时的 g 对应的不动点即为 21=2 个。

所以说上面我们说的这一对,就是标准的 Polya定理,即 |Xg|=2c(g)

所以现在关键就在于我们如何求这个 c(g)

首先我们会发现,对于一个置换 g,其是可以被分成多个不相交的部分的,用双行表示法举个例子:

(123456231546)=(123231)+(4554)+(66)

考虑若将置换 g 拆成 k 个循环,长度分别为 b1,b2,,bk。然后不难发现有两种边:

首先考虑对于两个点均在同一段循环内的边

然后我们考虑对于一种置换中的一个长度为 b 的循环,有一个结论,这样的循环共有 b2 个等价类。

我们可以将对应的点数排成一个正 n 边形,比如 n=6 的时候,如果有这样一个置换 g=(123456234561),存在这样的图和边:

img

不难发现对于长度相同的边都是等价的,其必须同时染或不染,否则置换后将会不同构。而不难想到,由于正 b 边形存在对称性,所以线段的长度共有 b2 种,所以等价类也就共有这些种。

于是其贡献的等价类数量为:i=1kbi2

然后考虑在不同循环中的边

举个例子:

g=(123231)+(4554)+(66)

这个东西的图大概是这样的:

img

如对于长度为 b1,b2 的两个循环,那么两者之间共有 b1×b2 条边,所以在这两者之间的边,每次经过 lcm(b1,b2) 次置换之后就会回到原位,则等价类的大小,或者说环长为 lcm(b1,b2),那么此时等价类个数,也就是环种类数,即为 b1×b2lcm(b1,b2),也就是 gcd(b1,b2)

所以这些边的贡献的等价类个数即为:

i=1kj=1i1gcd(bi,bj)

所以最终等价类的个数即为:

c(g)=i=1kbi2+i=1kj=1i1gcd(bi,bj)

答案即为:

1n!gG2c(g)

不过 Gn! 的,复杂度肯定不行,尝试优化;

考虑发现很多置换会被重复计算,如:

(123231)+(4554)+(66)(11)+(2332)+(456645)

这样的 bk 都是 1,2,3,那么 c(g) 的值是相同的。

也就是说对于相同的 n 的拆分贡献是相同的,所以可以考虑枚举 n 的拆分。

考虑对于一种拆分,计算有多少种对应的置换,首先总共有 n!,但是对于每一段长度为 b 的循环,都需要使其从普通排列转换为圆排列,也就是先去掉重复的 b!,然后再乘上圆排列的 (b1)!,并且对于相同长度的多个循环,假设有 c 个,那么这里又会重复 c! 个,那么在去重后应该为:

n!bi(ci!)

然后这里再枚举每个 n 的拆分,答案即为:

1n!n!bi(ci!)2c(g)

然后化简一下即为:

2c(g)bi(ci!)
c(g)=i=1kbi2+i=1kj=1i1gcd(bi,bj)

这样便可以通过了。然后尝试分析一下复杂度:

枚举 n 的拆分是 A000041,然后对于拆分长度为 k 的求解为 O(k2) 的,最终应为 A296010,然后这个东西完全不知道怎么分析,总之最后的复杂度大约在 O(10n),虽然我也不知道是怎么分析出来的。。。