LINEスタンプ制作代行サービス・LINEスタンプの作り方!

お電話でのお問い合わせ:03-6869-8600

stampfactory大百科事典

クラフトの不等式

クラフトの不等式(くらふとのふとうしき、)は、符号理論における不等式の1つで可変長符号が一意復号可能である為の必要条件を与える。等号成立条件は符号が完全である事である。クラフトの不等式は可変長符号が一意復号可能である為の十分条件ではないが、クラフトの不等式を満たす任意のパラメータに対し、そのパラメータを実現する一意復号可能な可変長符号の存在性が保証される。計算機科学や情報理論で利用される接頭符号やトライ木で応用されている。元々のクラフトの結果は接頭符号に対してのものだった。後にマクミランは任意の一意復号可能符号でも同様の不等式が成立することを示した。このためクラフト・マクミランの不等式とも呼ばれる。クラフトの不等式について述べる為に、まず記号と用語を導入する。集合Sに対し、Sの元を有限個並べてできる文字列全体の集合formula_1をformula_2と書く。formula_3及びformula_4を二組のアルファベットとする。本稿では、「符号」や「符号化関数」といった言葉は、1文字ずつ符号化する符号だけに用いるものとする。すなわち我々は符号化関数formula_5で以下の性質を満たすもののみを考える:φが単射であるとき、φは一意に復号可能であるという。formula_5を符号化関数とし、formula_8の文字数をformula_9とする。このとき、φが一意に復号可能なら、が成立する。この不等式をクラフトの不等式と呼ぶ。(なおクラフトの不等式において等号が成立する必要十分条件は、φが完全な符号である事である。)逆に自然数formula_10がクラフトの不等式を満たすなら、ある一意に復号可能な符号化関数formula_11が存在し、任意のiに対しformula_8の文字数がformula_9となる。一意に復号可能な符号の典型的な特殊例として接頭符号がある。上述の定理を接頭符号の場合に対して証明する。よく知られているように、接頭符号は次のようなformula_14-分木で表す事ができる:各頂点には formula_14 個のアルファベットのうち1つが割り振られ、各符号語は根から葉までの経路で表される。この木の各頂点に以下のルールで0以上1以下のラベルを再帰的に割り振る:各頂点はr個以下の子しか持たないので、頂点iの子に割り振られたラベルの総和は頂点iに割り振られたラベル以下である。この事実を葉から根に向かって再帰的に適応する事で次の事実が分かる:前述したように、各符号語は根から葉までの経路に対応している。今グラフは木であるから、根から葉までの経路は、経路の終点である葉と一対一対応している。従って各符号語は木の葉と自然に対応付けられる。ラベルの定義より、深さformula_9の頂点のラベルはformula_17である。木の作り方より符号語の長さは葉の深さに一致しているので、長さformula_9の符号語に対応する葉のラベルはformula_17である。以上の議論より、符号語に対応する葉のラベルの総和formula_20は根に割り振られたラベル(=1)以下である。よってクラフトの不等式が示せた。また以上の議論から分かるように、頂点が丁度r個の子を持てば、その頂点の子に割り振られたラベルの総和は頂点iに割り振られたラベルに一致する。従って木が完全であるとき、葉に割り振られたラベルの総和は根に割り振られたラベル(=1)に一致する。木の作り方より、木が完全である必要十分条件は、符号が完全である事である。よってクラフトの不等式の等号成立条件は符号が完全である事である。最後に定理の逆を示す。今自然数formula_10がクラフトの不等式を満たすとする。必要ならformula_22を付け加える事で、等号formula_23が成立していると仮定しても一般性を失わない。総和が1であるので、formula_24をなんらかの確率と解釈する事ができる。定理の逆は、i番目の符号語が生起する確率がformula_24であるとしたときのハフマン符号を作る事で証明できる。接頭符号とは限らない一般の符号に対してクラフトの不等式を示す。なお、定理の逆は、既に接頭符号が構成できる事を示しているので、証明の必要がない。さて、formula_5を符号化関数とし、以下の母関数を考える:ただしここで、formula_27はformula_28のビット数を表す。"m" を任意の自然数とするとき、formula_29が成立する。右辺を次数毎にまとめたものをformula_30と書くと、φの単射性より、formula_31は長さformula_32の符号語の数に等しい。長さformula_32の語はformula_34個しかないので、が成立する。さて、formula_35の中で最も短い語の長さをmin、最も長い語の長さをmaxとする。すると formula_36 の定義より、多項式formula_30の最低次の項の次数はm minであり、最高次の項の次数はm maxである。以上の議論より、が成立する。mは任意だったので上の不等式は任意のmに対して成立する。mを無限大に飛ばしたとき、左辺は指数関数的に変化するのに対し、右辺は線形にしか増加しない。従って任意のmに対して上の不等式が成立する事からが成立する。formula_38 とすれば、 formula_36の定義より、が成立する。すなわち、クラフトの不等式が証明された。二分木について、クラフトの不等式を適用すると、次が成り立つ。これは、木の葉ノードに関する総和である。深さとは、根からの距離を意味する。右図の木で言えば、この総和は次のようになる。アルゴリズム的情報理論において、チャイティンの定数は次のように定義される。これは、文法的に正しく停止する全てのプログラム毎にある被加数の総和である。|"p"| は "p" のビット列の長さを表す。プログラムは他のプログラムの接頭部とはならない。つまり、ある被加数は別の文法的に妥当で停止するプログラムを表す被加数の接頭部にはならない。従って、このビット列群は接頭符号であり、クラフトの不等式から formula_40 が成り立つ。

出典:wikipedia

LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。