https://cysec148.hatenablog.com/entry/2025/07/11/121254

Hello there, ('ω')ノ

🧠 そもそもLLMの“訓練”って？

AIモデルにとっての訓練とは、

「大量のデータを読み込み、そこからルールやパターンを学ぶ」こと。

人間で言えば「本をたくさん読んで、自然と文章力が身につく」のと似ています。

AIが世界中の文章を読みまくる「読み書きの基礎体力作り」

📌 ここでAIはまだ「なんとなくそれっぽいことが言える」程度の力を持ちます。

特定の目的や業務に合うように“クセづけ”する工程

📌 ChatGPTのような会話AIは、この段階で“会話らしさ”を身につけます。

AIの返答に「人間らしさ」や「好ましさ」を加える最終仕上げ

① AIが複数の回答を出す ② 人間が「より良い回答」を選ぶ ③ AIはその選択を学習して、次から“より人間に好かれる回答”を出すように進化

📌 ChatGPTが「失礼のない表現」や「親しみやすい会話」ができるのは、ここで鍛えられた結果です。

LLMの学習データには以下のようなものがあります。

データの種類	具体例
ウェブデータ	ウィキペディア、ニュース記事、ブログ、Q&Aサイトなど
書籍	文学作品、専門書、教科書など（パブリックドメイン中心）
コード	GitHubなどのオープンなプログラムコード
会話データ	フォーラムやチャットのログ（匿名・加工済み）など
合成データ／人間作成	プロンプトと応答の例を人間が用意したもの、AIが出した結果を加工したものなど

📌 著作権やプライバシーに配慮したフィルタリングが行われることが一般的です。

LLMの学習には、とてつもない計算資源が必要です。

だからこそ、企業や研究機関でしかフルスケールのLLMをゼロから訓練するのは難しいのが現実です。

最近では以下のような方法で、個人や企業が小規模なLLMを訓練・活用することも増えています。

📌 「大規模」は無理でも、「自分たちにちょうどいいAI」を作ることは十分可能！

✅ LLMの訓練は、事前学習 → 微調整 → 人間フィードバックの3ステップ

✅ 大量のテキストデータを通して“ことばの感覚”を身につける

✅ RLHFによって「人間らしい振る舞い」が可能に

✅ コストは高いが、小規模モデルであれば企業でも導入・活用できる！

Best regards, (^^ゞ