SMV()は CDMA2000 ネットワークで利用される可変ビットレートの音声符号化方式である。それ以前から CDMA ネットワークで使われている符号化方式の EVRC のように通話中に音声の内容によりビットレートを変えることができることに加え、モード指定により基地局側から音質と平均ビットレートの制御を行うことができる特徴がある。この特徴はその後に規格化された CDMA2000 ネットワーク用の音声符号化方式である VMR-WB や EVRC-B 以降の仕様などにも引き継がれている。SMV は CDMA ネットワークのために提案された音声符号化方式で、1999年に CDMA 方式の業界団体である CDG()が要求仕様を作成しその後様々な評価を経て 2001年6月に 3GPP2 の標準規格 C.S0030-0 として採用されたビットレートは入力となる音声信号の種類(有声音/無声音/無音状態など)と指定されているモードとの組み合わせにより動的に変わる。音声信号の内容に応じて8.55 kbps(フルレート)、4.0 kbps(ハーフレート)、2.0 kbps(1/4レート)0.8 kbps(1/8レート)のいずれかのビットレートに符号化する。1/8レートは無音状態(しゃべっていない状態)のみで使われる。これらの符号化データはそれぞれ CDMA2000 ネットワークのレートセット1(9.6 Kbps を基準とする通信レート)でのフレームレート 9600 bps、4800 bps、2400 bps、1200 bps を使い送受信される。CDMA2000 ネットワークで使われている CDMA 方式は、各利用者のビットレートが下がるほど多くの利用者が同時接続できる特性があり、コーデックのビットレートを可変にして平均ビットレートを下げることは1基地局あたりの収容数(同時に通話可能な利用者数)の向上に役立っている。平均ビットレートは基地局側が指示する「符号化モード」(パラメータ名 "RATE_REDUC")で制御する。符号化モードは、基地局当たりの収容数や携帯電話と基地局との間の無線状態など通信ネットワーク側の状態と、要求される通信品質(QoS)により決められる。平均ビットレートは符号化モード 0 が最も高く 1、2 と順次低くなり、また音声の品質も同様に低下する。符号化モードは 0 から 3 までの4モードがあり、それぞれプレミアムモード、スタンダードモード、エコノミーモード、キャパシティセービングモードとも呼ばれる。加えて、最大ビットレートをハーフレート(4.0 kbps)に抑えるハーフレートマックスモード(half-rate max mode)があり、モード 0 とモード 1 に適用できる。平均ビットレートは音声の内容により変わるが、符号化モードと平均的な会話での想定平均ビットレート(符号化のレート)との関係は以下のようになるSMV で使うアルゴリズムは、CELPの一種である eX-CELP()を用いる。これは1つの技術ではなく、EVRC で使用されている RCELP アルゴリズムなど様々なアイデアを組み合わせ選択して使うものであるまた、それ以前に開発された EVRC と同様の雑音抑制の機能が仕様に組み込まれており、フロントエンドとして使われる。SMV の特徴は以下の通りである。CDMA2000 ネットワークでのサービス種別を表すサービスオプションとしては SO56(Service Option 56)が割り当てられている。SMV の符号化データを RTP を用いインターネット上で送るためのデータ形式は、IETF標準の RFC 3558 で定義されているSMV は 3GPP2 でのマルチメディア用ファイルフォーマットである 3G2 でも使うことができる。携帯電話での音声通信用以外に、マルチメディアメッセージングサービスやマルチメディアストリーミングサービスなどの 3GPP2 で定義された各種マルチメディアサービスで使用することができる。SMV では CELP の一種である eX-CELP()と呼ばれる技術を用いる。一般的な CELP は人間の音声を声道に相当する線形予測フィルターと声帯に相当する適応型と固定型のコードブックとでモデル化し、「合成による分析」()の手法を用いてコードブックから誤差が最小になるものを探索する。eX-CELP の基本的となる考え方は、通常の CELP が固定的なアルゴリズムを使い入力信号とできるだけ同じ波形になるように符号化しようとするのに対し、様々なアルゴリズムを組み合わせて知覚上重要な部分を強化した符号化を行うことである具体的には、 CELP をベースとしながら、以下のような方法で聴感上の音質を落とすことなくビットレートの低減を行っている。SMV と CDMA2000 ネットワークで長く使われている EVRC(EVRC revision 0)の、MOS 値は以下のようになる。 MOS 値は、総合的な音質を表す主観評価値で1から5の値をとり、5が最も音質が高く1が最も低い。ここで "MOS (Clean)" は背景雑音が無い時の、"MOS (Noisy)" は背景雑音がある時の MOS 値である。同じ平均ビットレートでの総合的な音質は EVRC より高く、7 割程度の平均ビットレート(モード1)でも EVRC とさほど変わらない。
出典:wikipedia
LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。