LINEスタンプ制作代行サービス・LINEスタンプの作り方!

お電話でのお問い合わせ:03-6869-8600

stampfactory大百科事典

Google 日本語入力

Google 日本語入力(グーグル にほんごにゅうりょく)とは、Googleが開発した日本語入力システム(IME)である。2009年12月3日にベータ版として公開され、2010年12月16日に正式版が公開された。また、Mozc(モズク)という名称で公開されたオープンソース版についても本記事にて説明する。Google 日本語入力の一番の特徴は、変換辞書の豊富な語彙とそのファイルの小ささである。Google 日本語入力ではインターネット上から自動的に辞書を生成することにより、予測変換機能・タイプミスに対して「もしかして機能」を実装している。専門用語や学術用語・話題の人名(〈存命の〉芸能人・政治家や、漫画・アニメ・ゲームに登場する架空のキャラクター名など)から、流行り廃りの激しいインターネットスラングにまで対応する高い変換精度を誇る。特に、固有名詞の語彙力が他の日本語入力システムと比べて極めて高い。Google検索の語句入力から生成されたビッグデータが辞書にもたらす変換精度の高さは、インターネット上で大きな話題となった。一方、文字のつながりを認識して適切な単語に変換する機能が弱かったり、連濁が正しく変換されないこともある。他のIME(日本語入力システム)との設計上の違いとして、他のソフトウェアに依存する部分を小さくしてプロセスを分けることで、Google 日本語入力がクラッシュした場合にも、他のソフトウェアを巻き込んで落ちることがないようにした特徴がある。この設計のおかげで、辞書のアップデート時に、再起動が不要になる利点ももたらした。Googleで「もしかして機能」を担当、形態素解析エンジン・MeCabの開発者でもある技術者の工藤拓が、その経験から日本語入力ソフトウェアとしての可能性を感じ、またオープンソースの日本語入力ソフトウェア・PRIMEの開発経験を持つ技術者の小松弘幸もアイディアを温めていた。その後、この2人が中心となって「20%ルール」(勤務時間の20%を自由に使って良いというGoogleの社内ルール)のプロジェクトとして開発を開始し、この分野に詳しい貢献者を徐々に増やしながら公開に至った。2010年2月17日から、新機能のテストとバグの早期発見を目的に開発版(アルファ版)がリリースされ、同年12月16日には正式版がリリースされた。開発版は今もダウンロードして使用することが可能だが、Google 日本語入力チームは安全性の観点から通常の使用には正式版を勧めている。2010年5月11日、オープンソース版のGoogle 日本語入力であるmozcがリリースされた。そして2011年12月15日にはAndroid向けのベータ版がリリースされ、2013年4月に正式版となった。主としてPC用のGoogle 日本語入力の更新履歴である。Android向けのGoogle 日本語入力は2011年12月15日にベータ版がリリースされ、2013年4月に正式版に昇格した。Android版では、Google 日本語入力としての変換エンジンのほかにフロントエンドとなるソフトウェアキーボードも1つのパッケージとして配布されている。Androidの中でも特にタッチパネル端末ではソフトウェアキーボードで文字を入力することが主となるため、QWERTY配列のほかiOSでも採用されているテンキーをフリックして入力する方式(フリック入力)のほかに、Android版Google 日本語入力独自のキー配列であるGodanキーボードというローマ字入力をテンキーで行うことに主眼をおいた配列も実装されている。バージョン1.9では、Androidの日本語IMEで主流の拡張機能であるマッシュルームにも対応した。Mozcとは、Google 日本語入力のオープンソース版である。これは2010年5月11日にGoogle日本語入力をGoogle Chrome OSに移植するために必要な部分をオープンソースしたものである。オープンソース版のMozcとGoogle 日本語入力との大きな違いは、Mozcは日本語変換エンジンでありこれを用いて日本語入力を行うにはibus、uim、Fcitxのようなインプットメソッドを別途インストールする必要がある点である。またGoogle 日本語入力の売りであるインターネット上の語句を収集して生成される変換辞書を使わず、代わりにMozcプロジェクトが作成した変換辞書を使う点も異なる。変換辞書などを含めた完全にオープンソース化に対応しないのは、インターネットから収集してきたデータが変換辞書として使われている関係上、SEO対策に悪用されないようにするためであるという。2014年現在のMozcプロジェクトの成果物(ソフトウェア)では、言葉と言葉のつながり(コロケーション)をもって変換精度を高める処理や、言い間違いを訂正する処理については実装されているものの、それを実現するための対応するデータが実質的に含まれていない点もGoogle 日本語入力と異なる点である。。波ダッシュ「」は、音声記号等として用いられるチルダ「~、~」とは異なる文字記号であるが、Google 日本語入力の Windows 版のみ互換性問題の回避・解決のため、波ダッシュ「」にチルダ「~、~」がマッピングされている。この背景には、かつてUnicode 仕様書が間違っていたことに端を発し、その仕様書通りに実装・マッピングしたマイクロソフト社の Windows では波ダッシュとして全角チルダが不適切に長年使用されてきた歴史がある。その結果、Windows 版のみ「なみ」や「から」と入力・変換を試みると候補に『~ [半] 波ダッシュ』と『~ [全] 波ダッシュ』が列挙・表示される。これらはチルダである。差別用語や猥語など社会通念上好ましくない乃至マスメディアが表現の自主規制している言葉は、Google日本語のサジェスト機能では表示されない。ただし、スペースキーを押した変換からは、当該の単語がちゃんと変換される様にはなっている。同様の「言葉狩り」はATOK及びMicrosoft IMEでも行われている。

出典:wikipedia

LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。