符号の限界

概要

誤り訂正符号には, 符号の性質に関する限界がいくつか存在します. ここでは, その中でも特に重要な限界について述べます.

Singleton限界

Singleton限界とは, 誤り訂正符号のレートと距離の間の大雑把なトレードオフを表す不等式です(ちなみにSingletonは人名です).

命題(Singleton限界).

符号長$n$, レート$r$, 距離$\delta$の任意の符号は$r+\delta\le 1+1/n$を満たします.

符号長$n\to\infty$における漸近的なオーダーを議論する文脈ではSingleton限界は$r+\delta\le 1$と表記されることが多いです. 一般に符号の一意復号の限界は半径$\frac{\delta}{2}$であるため, Singleton限界と組み合わせると, この限界は高々$\frac{1-r}{2}$です.

なお, Singleton限界を等号で満たす符号, すなわち$r+\delta = 1+1/n$を満たす符号をMDS符号といいます. MDS符号の例として代表的なものはReed-Solomon符号です.

Johnson限界

「任意の符号$\calC\subseteq\F_q^n$であって距離$\delta$であるようなものを考えたとき, 任意の半径$R$のボールとの共通部分が$L$個以下である」という形のバウンドをリスト復号半径に対するJohnson限界といいます. より詳細な設定を述べます. パラメータ$n\in\Nat$, $\delta>0$, $R\in[0,1]$に対し, 半径$R$の球に含まれる点集合$S\subseteq\F_q^n$であって, 相異なる各二点の距離が$\delta$以上であるようなもののうち, 要素数最大のときの$\abs{S}$を$A’_q(n,\delta,R)$とします. すなわち

\[\begin{align*} A'_q(n,\delta,R) = \max\set{\abs{S}\colon \exists x\in\F_q^n,\,S\subseteq\ball(x,R), \forall a,b\in S, a\neq b\Rightarrow \dist(a,b)\ge R}. \end{align*}\]

距離$\delta$の符号$\calC\subseteq\F_q^nは, (情報理論的には)半径$R$のボール内に高々$A’_q(n,\delta,R)$個の符号語を持ちます. 従って$A’_q(n,\delta,R)$を上から抑えると, 符号の構成によらずリスト復号可能性に関するポジティブな結果が得られます.

定理(Johnson限界).

有限体$\F_q$を考えます. 自然数$L\in\Nat$に対し,

\[\begin{align*} J(\delta,L) := \qty(1-\frac{1}{q})\qty( 1-\sqrt{1-\frac{q}{q-1}\frac{L-1}{L}\delta} ) \end{align*}\]

とします. このとき, 任意の$R\le J(\delta,L)$に対して, $A’_q(n,\delta,R)\le L$が成り立ちます.

つまり, リストサイズを$L$で抑えたいときには半径を$R_J$にすれば良いということになります. また, $L$や$q$が十分大きく$\delta\approx 1$のとき, $R_J\approx 1$となるため,
符号の距離が大きければリスト復号半径を大きくできることがわかります.

リストサイズ$L$を$L\to \infty$とした時の極限

\[\begin{align*} J(\delta) := \lim_{L\to\infty} R_J(n,\delta,L) = \qty(1-\frac{1}{q})\qty( 1-\sqrt{1-\frac{q}{q-1}\delta} ) \end{align*}\]

をJohnson限界ということもあります. また, $q$が非常に大きいときは$q\to\infty$における$J(\delta)$をJohnson限界ということもあります. 例えばReed-Solomon符号の場合, Johnson限界は$1-\sqrt{1-\delta} = 1-\sqrt{r}$となります($r$はレート). このように「Johnson限界」という言葉は文脈によって異なる意味で使われることがあるので注意が必要です.

符号によってはこのバウンドがタイトになることもありますし, リスト復号半径がもっと大きくなりうることもあります.

Gilbert-Varshamov限界 (GV限界)

リスト復号の限界

符号$\calC\subseteq\F_q^n$が$(R,L)$-リスト復号可能であるとは, 任意の$x\in\F_q^n$に対して$\abs{ \calC \cap \ball(x,R) } \le L$が成り立つことをいいます. 有限体$\F_q$を考え, $r\in[0,1]$に対し, $q$進エントロピー関数を

\[\begin{align*} H_q(R)=R\log_q \frac{1}{R}+(1-R)\log_q\frac{1}{1-R} \end{align*}\]

で定義します. Stirling近似により, $\F_q^n$上の半径$R$の球の体積がおよそ$q^{nH_q(R)}$で与えられます.

命題(list-decoding capacity)

有限体$\F_q$を考え, $R\in (0,1-1/q)$と$\varepsilon>0$を任意の定数とします.

  1. レート$1-H_q(R)-\varepsilon$かつ$(R,\lceil 1/\varepsilon\rceil)$-リスト復号可能な符号$\mathcal{C}\subseteq\mathbb{F}^n$が存在します.

  2. レート$1-H_q(R)+\varepsilon$の符号$\mathcal{C}\subseteq\mathbb{F}^n$が$(R,L)$-リスト復号可能であるためには, $L \ge q^{\Omega(\varepsilon n)}$を満たさなければなりません.

ポジティブな結果1はランダム線形符号を考えることによって得られます. 2の結果は単純な数え上げによって得られます.

二つ目の主張の証明

確率変数$X$を, 一様ランダムな点$x\sim\F_q^n$を中心とした半径$R$のボールに含まれる符号語の個数とします. 符号$\calC$の要素数は$\abs{\calC}=q^{n(1-H_q(R)+\varepsilon)}$なので, $X$の期待値は

\[\begin{align*} \E[X] &= \sum_{z\in\calC}\Pr[x\in\ball(z,R)] \\ &= \abs{\calC}\Pr[x\in\ball(0,R)] \\ &\approx \abs{\calC}q^{-n+nH_q(R)} \\ &= q^{n(1-H_q(R)+\varepsilon)-n+nH_q(R)} \\ &= q^{n\varepsilon} \end{align*}\]

となります. よって, ある点$x\in\F_q^n$に対して$\abs{\ball(x,R)\cap \calC}>q^{n\varepsilon} $となるので, リストサイズは$L\ge q^{\varepsilon n}$でなければなりません.