Google 日本語入力
Google 日本語入力(グーグルにほんごにゅうりょく、英: Google Japanese Input)とは、Googleが開発した日本語入力システム(日本語IME)である。
2009年12月3日にベータ版として公開され、2010年12月16日に正式版が公開された。
また、 特徴
Google 日本語入力の一番の特徴は、変換辞書の豊富な語彙とそのファイルサイズの小ささである。 Google 日本語入力ではインターネット上から自動的に辞書を生成することにより、予測変換機能やタイプミスに対して「もしかして機能」を実装している。 専門用語や学術用語、話題の人名((存命の)芸能人や政治家、または漫画やアニメ、ゲームに登場する架空の人物等)から、流行り廃りの激しいインターネットスラングにまで対応する。 特に固有名詞の語彙は、他の日本語入力システムと比べ極めて多い[3]。 予測変換に用いる辞書は、Google 検索の検索ワードからなるビッグデータを使用し生成するため、検索されやすい流行言葉などの予測精度は、インターネット上で大きな話題となった[4]。 他方、検索ワードが予測変換に影響するため、一般的な語彙と同音な流行言葉が予測変換を埋めてしまう[5]。 プログラムの設計は、他の日本語IME(日本語入力システム)と違い、他のソフトウェアに依存する部分を小さくし、プロセスを分けている。 このため、Google 日本語入力のクラッシュに巻き込まれる(依存関係にある)ソフトウェアが少ない。 加えて辞書のアップデート時の再起動が不要になる利点ももたらした[6]。 開発の概略Googleで「もしかして機能」を担当、形態素解析エンジン・MeCabの開発者でもある技術者の工藤拓が、その経験から日本語入力ソフトウェアとしての可能性を感じ、またオープンソースの日本語入力ソフトウェア・PRIMEの開発経験を持つ技術者の小松弘幸もアイディアを温めていた[7]。 その後、この2人が中心となって「20%ルール」(勤務時間の20%を自由に使って良いというGoogleの社内ルール)のプロジェクトとして開発を開始し、この分野に詳しい貢献者を徐々に増やしながら公開に至った。 2010年2月17日から、新機能のテストとバグの早期発見を目的に開発版(アルファ版)がリリースされ、同年12月16日には正式版がリリースされた。開発版は今もダウンロードして使用することが可能だが、Google 日本語入力チームは安全性の観点から通常の使用には正式版を勧めている[8]。 2010年5月11日、オープンソース版のGoogle 日本語入力であるMozcがリリースされた。そして2011年12月15日にはAndroid向けのベータ版がリリースされ、2013年4月に正式版となった[9]。 更新履歴主としてPC用のGoogle 日本語入力の更新履歴である。更新頻度は多くないが、確実に行われている。
Android 版Android向けのGoogle 日本語入力は2011年12月15日にベータ版がリリースされ、2013年4月に正式版に昇格した[9]。2020年8月よりGboardへの統合が予告され、GoogleがユーザーにGboardアップグレードを推奨するようになる[36]。2021年3月31日、サポート終了[37][38]。 Android版では、Google 日本語入力としての変換エンジンのほかにフロントエンドとなるソフトウェアキーボードも1つのパッケージとして配布されている。Androidの中でも特にタッチパネル端末ではソフトウェアキーボードで文字を入力することが主となるため、QWERTY配列のほかiOSでも採用されているテンキーをフリックして入力する方式(フリック入力)のほかに、Android版Google 日本語入力独自のキー配列であるGodanキーボードというローマ字入力をテンキーで行うことに主眼をおいた配列も実装されている[41]。 バージョン1.9では、Androidの日本語IMEで主流の拡張機能であるマッシュルームにも対応した[42]。 2021年3月31日に、Google 日本語入力のAndroid版はサポートが終了した[37]。 Gboard 版GoogleがAndroid/iOS向けに開発している仮想キーボードGboardにはGoogle 日本語入力が組み込まれている。こちらはPC版とは異なり更新は通常通りである。 ただしスタンドアロン版の「Google 日本語入力」アプリ[43]とは別物であり、既にGoogle 日本語入力を別途インストールしたAndroid端末では「Gboard」、「Google 日本語入力」アプリの両者共存が可能である。 「Google 日本語入力」アプリのサポート終了後も、Gboardに組み込まれたGoogle 日本語入力のエンジンは更新されている。 →「Gboard」も参照
Mozc
Mozcとは、Google 日本語入力のオープンソース版である。これは2010年5月11日にGoogle日本語入力をChrome OSに移植するために必要な部分をオープンソース化したものである[48]。Gboardほどの更新頻度ではないが、確実に更新されている。 オープンソース版のMozcとGoogle 日本語入力との大きな違いは、Mozcは日本語変換エンジンでありこれを用いて日本語入力を行うにはibus、uim、Fcitxのようなインプットメソッドを別途インストールする必要がある点である。またGoogle 日本語入力の売りであるインターネット上の語句を収集して生成される変換辞書を使わず、代わりにMozcプロジェクトが作成した変換辞書を使う点も異なる。変換辞書などを含めた完全にオープンソース化に対応しないのは、インターネットから収集してきたデータが変換辞書として使われている関係上、SEO対策に悪用されないようにするためであるという[48]。
2014年現在のMozcプロジェクトの成果物(ソフトウェア)では、言葉と言葉のつながり(コロケーション)をもって変換精度を高める処理[注釈 4]や、言い間違い[注釈 5]を訂正する処理については実装されているものの、それを実現するための対応するデータが実質的に含まれていない点もGoogle 日本語入力と異なる点である[49]。 仕様波ダッシュ「〜」は、音声記号等として用いられるチルダ「~、~」とは異なる文字記号であるが、Google 日本語入力の Windows 版のみ互換性問題の回避・解決のため、波ダッシュ「〜」にチルダ「~、~」がマッピングされている。
この背景には、かつてUnicode 仕様書が間違っていたことに端を発し、その仕様書通りに実装・マッピングしたマイクロソフト社の Windows では波ダッシュとして全角チルダが不適切に長年使用されてきた歴史がある。その結果、Windows 版のみ「なみ」や「から」と入力・変換を試みると候補に『~ [半] 波ダッシュ』と『~ [全] 波ダッシュ』が列挙・表示される。これらはチルダである。 →詳細は「Unicode § 波ダッシュ・全角チルダ問題」、および「波ダッシュ」を参照
制限差別用語や猥語など社会通念上好ましくない、ないしマスメディアが表現の自主規制している言葉は、Google日本語のサジェスト機能では表示されない。ただし、スペースキーを押した変換からは、当該の単語が変換される様にはなっている。同様の制限はATOK及びMicrosoft IMEでも行われている。 脚注注釈出典
関連項目
外部リンク
|