https://acro-engineer.hatenablog.com/entry/2025/11/27/152546

皆さんこんにちは。

Acroquest のデータサイエンスチーム「AcroYAMALEX」を率いるチームリーダー、@tereka114です。
AcroYAMALEX では、コンペティション参加・自社製品開発・技術研究に日々取り組んでいます（チーム紹介はこちら）。

生成AIモデルの多くは、提供元のベンダーが学習させたものを利用するのが一般的だと思いますが（クローズドな状態）、最近、「オープンウェイトモデル」というものが注目されています。これは、モデルのパラメータが公開されているため、利用者が変更・調整できるもので、ファインチューニングよりも簡単に様々な環境でチューニングが可能になります。

Amazon Bedrock でも、2025/08/05に、オープンウェイトモデル（gpt-oss）が利用可能になりました。

ただ、日本語の実務でどの程度使えるか（＝どの程度の精度か）は、まだまだ分かりにくい状況があります。そこで今回、日本語タスクに絞って精度検証を行い、その内容を AWSブログに寄稿させて頂きました。

aws.amazon.com

今回、日本語の精度検証として、以下のようなユースケースを想定して、評価をしました。

要約（会議メモ、レポート、ニュースなど）
論理的推論（問い合わせの意図理解、複雑な質問応答、論理的な判断が必要なもの）
文章理解 / RAG（社内ドキュメント検索・FAQ 自動応答など）

ぜひ、内容を一読して頂ければと思います！

オープンウェイトモデル（ gpt-oss ）の日本語精度は？ – AWS パートナーアクロクエストによる徹底検証
https://aws.amazon.com/jp/blogs/news/gpt-oss-japanese-evaluation/

Acroquest Technologyでは、キャリア採用を行っています。

Azure OpenAI／Amazon Bedrock等を使った生成AIソリューションの開発

ディープラーニング等を使った自然言語／画像／音声／動画解析の研究開発

マイクロサービス、DevOps、最新のOSSやクラウドサービスを利用する開発プロジェクト

書籍・雑誌等の執筆や、社内外での技術の発信・共有によるエンジニアとしての成長

少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

www.wantedly.com