专栏文章

题解:P12532 [XJTUPC 2025] Primal Core Optimization: Attribute Balance

P12532题解参与者 3已保存评论 2

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
2 条
当前快照
1 份
快照标识符
@mip9ebxm
此快照首次捕获于
2025/12/03 08:18
3 个月前
此快照最后确认于
2025/12/03 08:18
3 个月前
查看原文
给个不同的观察。
考虑题目涉及到的函数 L(x,y,z)=max(x,y,z,0)min(x,y,z,0)L(x,y,z) = \max(x,y,z,0)-\min(x,y,z,0),它满足下列条件:
正定性
L(x,y,z,0)0L(x,y,z,0) \ge 0,当且仅当 x=y=z=0x=y=z=0 时取等。
绝对一次齐次性
L(ax,ay,az,0)=aL(x,y,z,0)L(ax,ay,az,0) = |a|L(x,y,z,0),这要分 aa 的正负证明:
a0a\ge 0 是平凡的,此时:
max(ax,ay,az,0)=amax(x,y,z,0)min(ax,ay,az,0)=amin(x,y,z,0)L(ax,ay,az)=aL(x,y,z)\begin{aligned} \max(ax,ay,az,0) &= a \max(x,y,z,0)\\ \min(ax,ay,az,0) &= a \min(x,y,z,0)\\ L(ax,ay,az) &= aL(x,y,z) \end{aligned}
a<0a < 0 时:
max(ax,ay,az,0)=amin(x,y,z,0)L(ax,ay,az)=a(min(x,y,z,0)max(x,y,z,0))=aL(x,y,z)\begin{aligned} \max (ax,ay,az,0) &= a\min (x,y,z,0) \\ L(ax,ay,az) &= a(\min(x,y,z,0) - \max(x,y,z,0))\\ &= -aL(x,y,z) \end{aligned}
三角不等式
我们记 Mi=max(xi,yi,zi,0)M_i=\max(x_i,y_i,z_i,0)mi=min(xi,yi,zi,0)m_i=\min(x_i,y_i,z_i,0),则 L(xi,yi,zi)=MimiL(x_i,y_i,z_i) = M_i - m_i
另记 M12=max(x1+x2,y1+y2,z1+z2,0)M_{12} = \max(x_1+x_2,y_1+y_2,z_1+z_2,0)m12=min(x1+x2,y1+y2,z1+z2,0)m_{12} = \min(x_1+x_2,y_1+y_2,z_1+z_2,0),则有:L(x1+x2,y1+y2,z1+z2)=M12m12L(x_1+x_2,y_1+y_2,z_1+z_2)=M_{12} - m_{12}
由于 relu 函数 max(a,0)\max(a,0) 显然有性质 max(a,0)+max(b,0)max(a+b,0)\max(a,0)+\max(b,0) \ge \max(a+b,0),不难推广到:
M1+M2M12M_1+M_2 \ge M_{12}
同理,因为 min(a,0)\min(a,0) 满足 min(a,0)+min(b,0)min(a+b,0)\min(a,0)+\min(b,0) \le \min(a+b,0),可以推广到:
m1+m2m12m_1+m_2\le m_{12}
所以会有:
L(x1,y1,z1)+L(x2,y2,z2)=M1m1+M2m2=(M1+M2)(m1+m2)M12+m12=L(x1+x2,y1+y2,z1+z2)\begin{aligned} L(x_1,y_1,z_1) + L(x_2,y_2,z_2)&=M_1-m_1+M_2-m_2\\ &=(M_1+M_2)-(m_1+m_2)\\ &\ge M_{12} + m_{12}\\ &= L(x_1+x_2,y_1+y_2,z_1+z_2) \end{aligned}
由于 L(x,y,z)L(x,y,z) 满足上面三个性质, LL 成功升格为 R3\mathbb R^3 空间上的一个范数。我们记作 L\Vert\cdot\Vert_L
那么 (R3,+,L)(\mathbb R^3,+, \Vert\cdot\Vert_L) 就是一个赋范线性空间
这个范数可以诱导一个度量d(u,v)=uvLd(\mathbf u,\mathbf v) = \Vert \mathbf u - \mathbf v\Vert_L(R3,d)(\mathbb R^3, d) 就是一个度量空间。
这时候,我们想知道的凸性什么的都已经是代数里的基本结论了。
而且,不难发现题目要求等价如下:
minuR3i=1nd(u,xi)\min_{\mathbf u\in \mathbb R^3} \sum_{i=1}^n d(\mathbf u, \mathbf x_i)
如果是 L2L_2 范数,结论是取 xi\bf x_i 平均值;如果是 L1L_1 范数,结论是取 xi\bf x_i 每坐标分别的中位数。
由于所有范数在拓扑上的等价性,可以考虑一些乱搞做法:初值选在平均值或中位值,然后用一些一阶优化算法(梯度下降什么的)或者零阶优化算法(模拟退火、爬山什么的)。

评论

2 条评论,欢迎与作者交流。

正在加载评论...