https://cysec148.hatenablog.com/entry/2025/07/08/173028

Hello there, ('ω')ノ

🔍 3つの共通点：意味を持った“単語ベクトル”を作る

まず、この3つには共通点があります。

特徴	内容
✅ 単語の意味や文脈を反映	「りんご」と「バナナ」は近く、「車」とは遠くなるような数値にする
✅ 機械学習やディープラーニングで学習される	大量のテキストから、自動的に「意味的な関係」を学び取る
✅ 自然言語処理の土台になる	翻訳・感情分析・要約・チャットボットなど、ほぼすべての言語AIで利用される

では、それぞれの特徴的な違いを見ていきましょう。

Word2Vecは、周囲にどんな単語が出てくるかを手がかりにして、単語の意味を学習する方法です（Googleによって2013年に公開）。

GloVeは、文章全体の中でどれくらい単語が一緒に出てくるか（共起回数）に注目した手法です（スタンフォード大学が開発）。

📌 Word2Vecは「局所的な文脈」重視、

📌 GloVeは「文章全体の統計」重視、という違いがあります。

FastTextは、Word2Vecに似ていますが、単語を「パーツ（サブワード）」に分解して学習するという違いがあります（Facebookが開発）。

項目	Word2Vec	GloVe	FastText
開発元	Google	Stanford	Facebook
学習方法	周囲の文脈	単語の共起行列	単語の構造（サブワード）も含む
学習対象	単語単位	単語単位	サブワード単位
未知語への対応	弱い	弱い	強い（つづりを使う）
特徴	軽くて速い	統計ベースで安定	表記ゆれや造語にも強い

用途や扱う言語、精度要求によって使い分けます：

📌 ChatGPTやBERTなどの最新AIでは、これらのアイデアを進化させた「学習可能な埋め込み（Embedding）」が使われています。

✅ 単語の意味や関係性を、数値ベクトルとして表現できる

✅ Word2Vecは文脈ベース、GloVeは統計ベース、FastTextは構造ベース

✅ どれも自然言語処理の基礎を支えている重要な技術！

Best regards, (^^ゞ