给个不同的观察。
考虑题目涉及到的函数
L(x,y,z)=max(x,y,z,0)−min(x,y,z,0),它满足下列条件:
正定性:
L(x,y,z,0)≥0,当且仅当
x=y=z=0 时取等。
绝对一次齐次性:
L(ax,ay,az,0)=∣a∣L(x,y,z,0),这要分
a 的正负证明:
max(ax,ay,az,0)min(ax,ay,az,0)L(ax,ay,az)=amax(x,y,z,0)=amin(x,y,z,0)=aL(x,y,z)
max(ax,ay,az,0)L(ax,ay,az)=amin(x,y,z,0)=a(min(x,y,z,0)−max(x,y,z,0))=−aL(x,y,z)
三角不等式:
我们记
Mi=max(xi,yi,zi,0),
mi=min(xi,yi,zi,0),则
L(xi,yi,zi)=Mi−mi。
另记
M12=max(x1+x2,y1+y2,z1+z2,0),
m12=min(x1+x2,y1+y2,z1+z2,0),则有:
L(x1+x2,y1+y2,z1+z2)=M12−m12。
由于 relu 函数
max(a,0) 显然有性质
max(a,0)+max(b,0)≥max(a+b,0),不难推广到:
M1+M2≥M12
同理,因为
min(a,0) 满足
min(a,0)+min(b,0)≤min(a+b,0),可以推广到:
m1+m2≤m12
所以会有:
L(x1,y1,z1)+L(x2,y2,z2)=M1−m1+M2−m2=(M1+M2)−(m1+m2)≥M12+m12=L(x1+x2,y1+y2,z1+z2)
由于
L(x,y,z) 满足上面三个性质,
L 成功升格为
R3 空间上的一个
范数。我们记作
∥⋅∥L。
那么
(R3,+,∥⋅∥L) 就是一个
赋范线性空间。
这个范数可以诱导一个
度量:
d(u,v)=∥u−v∥L。
(R3,d) 就是一个度量空间。
这时候,我们想知道的凸性什么的都已经是代数里的基本结论了。
而且,不难发现题目要求等价如下:
u∈R3mini=1∑nd(u,xi)
如果是
L2 范数,结论是取
xi 平均值;如果是
L1 范数,结论是取
xi 每坐标分别的中位数。
由于所有范数在拓扑上的等价性,可以考虑一些乱搞做法:初值选在平均值或中位值,然后用一些一阶优化算法(梯度下降什么的)或者零阶优化算法(模拟退火、爬山什么的)。