https://stockmark-tech.hatenablog.com/entry/2026/03/02/085617

ストックマークの Research Manager の広田です。今日は、私たちのチームが言語処理学会年次大会2026 (NLP2026) で発表する論文についてご紹介します。

私たちのチームが取り組んでいるのは「ある技術が解決出来る世の中の課題は何か？」を見つけ出す、シーズニーズマッチング や 用途探索 と呼ばれる課題です。シーズニーズマッチングは製造業のお客様の新規事業創出において非常に重要な問題であり、自然言語処理がとても大きなインパクトを残せる分野です。また研究観点からも面白い問題が数多くあり、自然言語処理の研究者にとって非常に相性がよい・面白い分野だと私自身考えています。

この記事を書いてからちょうど1年、ストックマークでは様々な研究開発が行われてきました。事業が進むにつれ、以下の2つの問題が特に重要であることがわかってきました。

意外で妥当なニーズマッチング お客様は思いも寄らなかったマッチング結果を AI に求めています。一方ででたらめな結果ばかりでてきてしまっては、システムは使い物にならなくなります。「意外でいて、かつ妥当な課題マッチング」をどのように実現するか？これはシーズニーズマッチングの品質を左右する非常に重要な問題です。
きっちり評価を行うAI (ステージゲートAI) 新規事業の立ち上げはコストがかかるものですので、アイデアを実行に移す前に「本当に市場はあるのか？」「その顧客のニーズに本当に応えることができるのか？」「自社でやる意味は？強みが活かせる？」「それは技術的に筋の良いアイデアなのか？」など、様々な観点からマッチング結果を精査する必要があります。この評価は市場・技術の専門家レベルの高度な判断が要求され、単に LLM にプロンプトするだけでは満足のいく結果が得られないことがわかってきました。

ストックマークの2つの研究課題: 「意外で妥当なニーズマッチング」と「きっちり評価を行うAI」

この記事では、これらに関する私たちの発表をかいつまんで紹介します。どれも面白いテーマですので、ぜひ論文や当日の発表もご覧いただけると幸いです。

ニーズ知識グラフ構築による異業種アナロジーの探索

○朝倉卓人 (ストックマーク/NII/東大/理研), 広田航 (ストックマーク), 乾健太郎 (MBZUAI/東北大/理研), Heinzerling Benjamin (理研/東北大), Dai Qin (東北大), 有馬幸介 (ストックマーク)

ストックマークの朝倉さんと MBZUAI の乾教授らのチームによる論文です。シーズ (お客様の技術) とニーズ (世の中の課題) をそれぞれナレッジグラフとして構造化し、それらの意味的な共通ノードで結びつけることで「意外だが妥当性のある」マッチングができることを示しました。意外かつ妥当なマッチングは我々が目指すアイデアの理想像であり、ナレッジグラフのマッチングという枠組みのポテンシャルが見いだせた結果となりました。

LLM を用いた研究アイデア発想におけるネットワーク構造に基づく研究代表者選定

○中村仁 (阪大/産総研), 広田航 (ストックマーク), 上田佳祐 (EPFL/産総研), 石垣達也 (産総研)

こちらは産総研との共同研究の一環で行っている、中村さん (大阪大学) 主著の論文です。研究アイデアの発想タスクにおいては「研究者を模した LLM 同士が議論する」というフレームワークが提案されており、その有効性が示されています。過去に共著の上田さんの研究 (SIGDIAL 2025) においても「研究者のチームをどう編成するか」がアイデア品質における重要な要素だとわかりました。この問題に対し、本研究では社会学分野で提唱されている「弱い紐帯理論」の考え方を取り入れたチーム編成手法を提案しました。

PBIG-DATA: 専門家による評価スコア付き製品アイデアデータセット

○広田航 (ストックマーク), 谷口友紀, 大熊智子 (旭化成), Chung-Chi Chen (産総研), 高橋洸丞 (ストックマーク), 進藤尚希 (ストックマーク/電通大), 有馬幸介 (ストックマーク), 朝倉卓人 (ストックマーク/NII/東大/理研), 近江崇宏 (ストックマーク), 石垣達也 (産総研)

こちらは私自身が第一著者として発表します。製品アイデア生成タスクにおいて「そもそも良いアイデアとは何か？」を考えるため、私たちは昨年8月に産総研の石垣さんを筆頭に IJCAI にて Shared Task を開催しました。本論文では、ここで集まったアイデアデータを技術・市場の専門家がそれぞれ評価したデータを作成した上で分析を行い、「万人が納得する評価」を定めるのは難しく、ビジネスアイデアの評価では評価者の定義・モデリングが重要であるという示唆を得ました。

BizFermi : フェルミ推定によるビジネスアイデアの市場規模推定データセット

○高橋洸丞, 広田航 (ストックマーク), 進藤尚希 (ストックマーク/電通大), 有馬幸介 (ストックマーク), 石垣達也 (産総研)

「アイデアの市場性を評価する」という観点から、ストックマークの高橋さんによる BizFermi データセットの発表があります。市場規模の算出においてほぼ必ず用いられるフェルミ推定ですが、果たして LLM のフェルミ推定と人間のフェルミ推定の結果にはどれくらい乖離があるのかという問いがありました。この問いに対して弊社のコンサルチームと高橋さんがタッグを組んでデータセットを作ることで検証を行い、LLM の癖や改善ポイントを明らかにしました。

化学技術の応用領域拡張を目的とした用途探索フレームワーク (未来言語処理ワークショップ)

○ 進藤尚希, 広田航, 中川大輔, 高橋洸丞 (ストックマーク)，及川圭太，箕田拓水 (日本ガイシ株式会社)

こちらは「LLMは専門家レベルでアイデアの科学的・技術的な整合性を判定できるか？またその判定結果をアイデア生成器に戻すことで、より妥当性のあるアイデアにブラッシュアップできるか？」という問いを検証した研究です。この研究は、化学ドメインの専門家である日本ガイシ様と LLM の専門家であるストックマークの進藤さんとのコラボレーションにより実現した、非常に興味深い研究です。

その他にも、お客様・産総研様・東北大学様・RA の方々とのコラボレーションを通して、面白い研究テーマがまだまだ走っています。興味のある方はぜひ言語処理学会にてストックマークのブースにお越しください！

ニーズ知識グラフ構築による異業種アナロジーの探索

LLM を用いた研究アイデア発想におけるネットワーク構造に基づく研究代表者選定

PBIG-DATA: 専門家による評価スコア付き 製品アイデアデータセット

BizFermi : フェルミ推定によるビジネスアイデアの市場規模推定データセット

化学技術の応用領域拡張を目的とした用途探索フレームワーク (未来言語処理ワークショップ)

PBIG-DATA: 専門家による評価スコア付き製品アイデアデータセット