以下の内容はhttps://cysec148.hatenablog.com/entry/2025/07/10/194331より取得しました。


第27回|実践:文章生成モデルをColabで動かしてみよう

Hello there, ('ω')ノ

💻 Google Colabとは?

✅ 無料で使えるGoogle提供の「オンラインPython実行環境」

  • ブラウザ上でPythonコードを実行できる(インストール不要)
  • GPUも無料で使える(※時間制限あり)
  • AI/機械学習の実験に最適!

つまり、プログラミングに不慣れな方でも手軽にAIモデルを試せる場所です。


🧰 今回使うもの

  • モデル:Hugging Faceの「GPT-2」(小型で扱いやすい)
  • ライブラリ:transformers, torch(PyTorchベース)
  • 実行環境:Google Colab(無料)

✍️ ステップ①:Colabノートブックを開こう

  1. Googleアカウントにログイン
  2. https://colab.research.google.com/ を開く
  3. 「新しいノートブック」をクリック

🧪 ステップ②:ライブラリをインストール

最初に必要なライブラリをインストールします。

!pip install transformers
!pip install torch

これで、文章生成モデルを扱うための準備が整います。


📦 ステップ③:モデルとトークナイザの読み込み

from transformers import GPT2LMHeadModel, GPT2Tokenizer

# モデルとトークナイザを読み込み(GPT-2の最小バージョン)
model_name = "gpt2"  # または "rinna/japanese-gpt2-small" で日本語もOK
tokenizer = GPT2Tokenizer.from_pretrained(model_name)
model = GPT2LMHeadModel.from_pretrained(model_name)

✨ ステップ④:テキストを入力して生成!

# 入力テキスト(プロンプト)
prompt = "今日はとてもいい天気ですね。だから"

# トークン化(数値化)
input_ids = tokenizer.encode(prompt, return_tensors="pt")

# 文章生成(最大50トークン分生成)
output = model.generate(
    input_ids,
    max_length=50,
    do_sample=True,       # サンプリング戦略
    top_k=50,             # 上位50単語から選ぶ
    top_p=0.95,           # 確率上位95%の単語から選ぶ
    temperature=0.7       # ランダム性の調整
)

# 結果をデコードして表示
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)

📌 補足:日本語モデルを使いたい場合は?

Hugging Faceでは、日本語に対応したGPT-2モデルも公開されています。

model_name = "rinna/japanese-gpt2-small"
tokenizer = GPT2Tokenizer.from_pretrained(model_name, use_fast=False)
model = GPT2LMHeadModel.from_pretrained(model_name)

この変更だけで、日本語の文章生成もOK!


🧠 実験してみよう!

以下のようなプロンプトで試してみると、生成AIの「表現力」が実感できます:

プロンプト例 予想される出力の傾向
「明日から新しい仕事が始まる。」 少し不安、期待などの展開
「AIと人間はこれからどう共存するのか。」 倫理や未来に関する自然な考察
「おすすめの旅行先を教えてください。」 実在する場所や時期に合った提案など

✅ まとめ:Colabで文章生成AIを体験しよう!

✅ Google Colabを使えば、誰でも無料で生成AIを体験できる

✅ GPT-2は軽量で、実験・学習にはぴったり

✅ Python数行で自然な文章生成が可能!

✅ 「サンプリング戦略」や「プロンプト工夫」で出力の個性を調整できる

Best regards, (^^ゞ




以上の内容はhttps://cysec148.hatenablog.com/entry/2025/07/10/194331より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14