0 A: e$ e, p4 @4 y. C5 d为什么?因为价格代表的是隐含概率。从 50% 变到 60%,是一个温和的观点调整。从 5% 变到 15%,是一个巨大的信念翻转——一个几乎不可能的事件突然变成了「有点可能」。 # a: j+ T% O7 S3 } $ ^1 p/ c$ O3 q% g" v) V想象你在称体重。从 70 公斤变到 80 公斤,你会说「胖了一点」。但从 30 公斤变到 40 公斤(如果你是成年人),那就是「从濒死变成了严重营养不良」。同样是 10 公斤的变化,意义完全不同。价格也是一样——越接近 0 或 1 的价格变动,信息量越大。 3 L( v0 Z/ Y6 v3 k' y# g5 Y) S/ W6 ?; H7 Y3 h Bregman 散度:正确的「距离」9 V. i% t" }/ i& f& F Polymarket 的做市商使用的是 LMSR(对数市场评分规则)[4],价格本质上代表概率分布。 : H& B( u& A& }+ q" f4 c; f; S : Y. m" w6 @7 R# x6 v$ `在这种结构下,正确的距离度量不是欧几里得距离,而是 Bregman 散度。[5]9 a$ e4 V4 }! Y2 Y0 a7 w
2 h* W, j% j( Y6 ~# Z4 F! r9 o# o
对于 LMSR,Bregman 散度就变成了 KL 散度(Kullback-Leibler 散度)[6]——一个衡量两个概率分布之间「信息论距离」的指标。. V: z7 V; _- |+ k b& B. [' O
: o) ~7 P/ ?9 I4 h 你不需要记住公式。你只需要理解一件事: 0 |& R; [& o/ a$ g* o: g! u9 i3 g! q4 |8 i4 m2 m/ Y9 p1 d- b
KL 散度会自动给「极端价格附近的变动」更高的权重。从 $0.05 到 $0.15 的变动,在 KL 散度下比从 $0.50 到 $0.60 的变动「更远」。这正好符合我们的直觉——极端价格的变动意味着更大的信息冲击。 ( z# r* {1 D0 G8 X4 r& R1 W3 V. ~3 \& n
一个比较好的例子,就是上次 @zachxbt 的预测市场中,Axiom 在最后关头反超 Meteora,也是以极端价格变动,作为一切变化的。 1 |8 Z/ K$ L5 l9 c) V. K# m! E" X ' d9 O2 r+ A. ]$ z0 G$ L l" e1 }. y1 \( x套利利润 = Bregman 投影的距离 6 z9 Q$ V% j) s/ {这是原文作者参考整篇论文最核心的结论之一:" D% m$ g# X4 @
: f$ p6 E7 d7 D0 ?8 k 任何交易能获得的最大保证利润,等于当前市场状态到无套利空间的 Bregman 投影距离。 : c {7 g. c& l& R $ s+ d( U8 B/ r- p$ |8 A C# o换人话说:市场价格偏离「合法空间」越远,能赚的钱越多。而 Bregman 投影会告诉你:5 b& Z( t, R/ _" u
+ x* J+ L0 W) D! [) P% R8 v Z* `
1. 该买卖什么(投影方向告诉你交易方向) 5 w3 T9 a/ @5 Q. a' e0 g3 G& U ; {1 X }3 P% v+ w6 y2. 该买卖多少(考虑订单簿深度)1 S$ v1 _4 [4 U! k* f4 y- K2 u) ]
+ m. Q! e |1 b! G, o$ j
3. 能赚多少(投影距离就是最大利润) 0 ~2 q) A% p/ I6 g" i3 H 2 e. s3 T. J4 I1 A- b排名第一的套利者一年赚了 $2,009,631.76。[2]他的策略就是比所有人更快、更准地解这道优化题。7 y1 f8 @& Y+ @7 \$ U
# b5 _' U0 c9 @: B' r打个比方来说,想象你站在一座山上,山脚下有一条河(无套利空间)。你现在的位置(当前市场价格)离河有一段距离。 ) w; r/ f W5 N* ~3 ^' d- j! F$ Y
Bregman 投影就是帮你找到「从你的位置到河边的最短路径」——但不是直线距离,而是考虑了地形(市场结构)之后的最短路径。这条路径的长度,就是你能赚到的最大利润。. w3 w/ H A8 Y" C
' v$ C. H% `% g8 c4 j 第三章:Frank-Wolfe 算法——让理论变成可执行的代码 h8 k' q. k% Y h
好,现在你知道了:要算最优套利,就要做 Bregman 投影。* r! W9 F/ m7 Q; F c* B
. ^9 K* m' M# X# E1 N但问题是——直接计算 Bregman 投影是不可行的。, N2 ?- ?; L0 U* M: z
) ?1 \6 M6 C/ ~# H. |" ~. { p! _
为什么?因为无套利空间(边际多面体 M)有指数级多的顶点。标准的凸优化方法需要访问完整的约束集,也就是枚举每一个合法结果。我们刚才说了,这在规模化场景下是不可能的。8 K6 d; ?7 m. w9 d9 O
% r9 g4 P5 |3 U/ {Frank-Wolfe 的核心思想 0 f; s: F* i Y& hFrank-Wolfe 算法 [7] 的天才之处在于:它不试图一次性搞定整个问题,而是一步一步逼近答案。 2 c# S( ~! E1 U s" _2 X% N; W/ T0 j/ G: n1 `4 E4 U3 S9 [' ` 它的工作方式是这样的:+ B' C5 E7 R. x5 t5 U5 p2 d K