- 731 名前:login:Penguin mailto:sage [2010/05/11(火) 10:08:13 ID:dY6jg4HL]
- > - 辞書の構成の違いは何ですか
> Webデータから自動抽出された大規模語彙データは含まれていません。 語彙集合は基本的に IPAdic と同一です。 > そのため、固有名詞以外の変換精度は Google日本語入力 とほぼ同一です。 > 以下、Google 日本語入力で使用している辞書および IPAdic との主な違いです。 > > * IPAdic に収録されていない、表外動詞や形容詞が一部含まれています。 > * IPAdic に収録されていない、Web 上に多く出現するカタカナ語が含まれています。 > * IPAdic の中にある単語のみで構成され、Web上によく出現する複合語 が追加 されています。(例: 再起動, 社員証)。 > * Google 日本語入力で使用されている辞書に含まれている カタカナ→ 英語 は含まれていません (例:アンドロイド→Android)。 > * Google 日本語入力で使用されている辞書に含まれている 郵便番号 → 住所 は含まれていません。 > > - なぜオープンソース版の辞書はデータが違うのですか? > Google 日本語入力の辞書は、Web 上のデータなどから作成されており、膨大な量の単語のみならず、 > Google の検索のランキング・インデクシングアルゴリズムを反映するような単語の頻度情報も含まれております。 > Google 日本語入力で使用している辞書をオープンソース化するということは、辞書及び頻度情報を、 > 日本語入力以外の目的で使われることに許諾することを意味し、これは Google の意図するところではありません。 > 以上のような理由により、オープンソース版の辞書は異なるものを使用しています。 いつものグーグルでした^^
|

|