皆さんこんにちは。
Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。
AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます(チーム紹介は こちら )。
生成AIモデルの多くは、提供元のベンダーが学習させたものを利用するのが一般的だと思いますが(クローズドな状態)、 最近、「オープンウェイトモデル」というものが注目されています。 これは、モデルのパラメータが公開されているため、利用者が変更・調整できるもので、ファインチューニングよりも簡単に様々な環境でチューニングが可能になります。
Amazon Bedrock でも、2025/08/05に、オープンウェイトモデル(gpt-oss) が利用可能になりました。
ただ、日本語の実務でどの程度使えるか(=どの程度の精度か)は、まだまだ分かりにくい状況があります。 そこで今回、日本語タスクに絞って精度検証を行い、その内容を AWSブログに寄稿させて頂きました。
今回、日本語の精度検証として、以下のようなユースケースを想定して、評価をしました。
- 要約(会議メモ、レポート、ニュースなど)
- 論理的推論(問い合わせの意図理解、複雑な質問応答、論理的な判断が必要なもの)
- 文章理解 / RAG(社内ドキュメント検索・FAQ 自動応答など)
ぜひ、内容を一読して頂ければと思います!
オープンウェイトモデル( gpt-oss )の日本語精度は? – AWS パートナー アクロクエストによる徹底検証
https://aws.amazon.com/jp/blogs/news/gpt-oss-japanese-evaluation/
Acroquest Technologyでは、キャリア採用を行っています。
- Azure OpenAI/Amazon Bedrock等を使った生成AIソリューションの開発
- ディープラーニング等を使った自然言語/画像/音声/動画解析の研究開発
- マイクロサービス、DevOps、最新のOSSやクラウドサービスを利用する開発プロジェクト
- 書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。