たった1晩の睡眠から100以上の病気リスクを予測するAIモデルが開発される

2026年1月16日 12時0分

GIGAZINE（ギガジン）

睡眠は心身の健康と密接に関わっていることが知られており、健康状態が悪化すると睡眠にも悪影響が及ぶことが多々あります。新たにスタンフォード大学医学部の研究チームが、1晩の睡眠から100以上の病気のリスクを予測するAIモデル「SleepFM」を開発したと報告しました。

A multimodal sleep foundation model for disease prediction | Nature Medicine

https://www.nature.com/articles/s41591-025-04133-4

New AI model predicts disease risk while you sleep

https://med.stanford.edu/news/all-news/2026/01/ai-sleep-disease.html

A Single Night's Sleep Could Predict Your Risk For More Than 100 Diseases : ScienceAlert

https://www.sciencealert.com/a-single-nights-sleep-could-predict-your-risk-for-more-than-100-diseases

研究チームはSleepFMを開発するにあたり、6万5000人の被験者から5秒単位で収集された合計約58万5000時間の睡眠データを利用しました。この睡眠データは、さまざまなセンサーを体中に取り付けて脳・心臓・呼吸器系の活動、眼球や足の動きなどを記録する睡眠ポリグラフ検査(ポリソムノグラフィ、PSG)によって収集されました。

論文の共著者であり、スタンフォード大学の睡眠医学教授を務めるエマニュエル・ミニョー氏は、「睡眠を研究する際には、驚くほど多くの信号を記録します。これは一種の普遍的な生理学データであり、完全に拘束された被験者を8時間にわたって研究します。そのデータ量は非常に豊富です」と語っています。

研究チームは、SleepFMを開発するために基盤モデルを構築しました。OpenAIのGPTシリーズのような大規模言語モデルは膨大な量のテキストデータでトレーニングされていますが、SleepFMの場合はテキストデータではなく、PSGで収集された睡眠データでトレーニングが行われます。論文の共著者であり、スタンフォード大学の生物医学データサイエンスの准教授を務めるジェームズ・ゾウ氏は、「SleepFMは本質的に睡眠の言語を学んでいるのです」と述べました。

SleepFMは脳波・心電図・筋電図・脈拍・呼吸といった複数のデータストリームを統合し、それらが互いにどのように関連しているのかを把握できます。研究チームはこれを実現するため、1つのデータを非表示にした上でその他のデータから該当データを再構築する「leave-one-out対照学習」という新しいトレーニング手法を開発したとのこと。

ゾウ氏は、「この研究で私たちが成し遂げた技術的進歩のひとつは、これらすべての異なるデータ様式を調和させ、それらが一緒になって同じ言語を学習できるようにする方法を見つけ出したことです」とコメントしています。

研究チームは、最大25年間にわたって追跡された幅広い年齢層の長期的な健康状態に関する数万件のレポートを組み合わせ、SleepFMが病気リスクをどれほどの精度で予測できるのかを調べました。その結果、健康記録に含まれる1041種類を超える病気カテゴリーのうち、130種類についてはC統計量が「0.75以上」という精度で予測できることがわかりました。

C統計量とは、予測モデルがどれほど実際の結果を正しく予測できるかを示す指標です。C統計量が「1」であれば完全一致で、「0.5」であればランダムな予測と同程度という意味になります。

SleepFMは特にがん・妊娠合併症・循環器疾患・精神疾患において予測精度が高く、C統計量はいずれも「0.8」を超えました。具体的にはパーキンソン病が「0.89」、認知症が「0.85」、高血圧精神疾患が「0.84」、心臓発作が「0.81」、前立腺がんが「0.89」、乳がんが「0.87」、全死因の死亡率については「0.84」という結果でした。なお、さまざまながん治療への反応を予測するモデルなどのC統計量は「0.7」前後ですが、これらのモデルも臨床現場では有用と見なされているとのこと。

今回の結果は、睡眠習慣の悪さと健康状態の悪化にみられる関連性を裏付けるものであり、さまざまな疾患の初期兆候として睡眠の悪化が生じる可能性を示唆しています。ゾウ氏は、「非常に多様な条件に対して、このモデルが有益な予測を行えることにうれしい驚きを覚えました」と述べています。

今回の研究では、特定の疾患と強く関連している一部のデータのみで予測を行うよりも、すべてのデータタイプを組み合わせた予測が最も高い精度を発揮することも確認されました。ミニョー氏は、「疾患予測において得られた最も有益な情報は、異なるチャネルを比較対照することで得られました」と述べました。

研究チームは、ウェアラブルデバイスが収集したデータを追加してSleepFMの予測を改善する方法や、SleepFMが何を解釈しているのかを正確に理解することに取り組んでいるとのことです。
みんなの感想は？
外部サイト
関連情報（BiZ PAGE＋）

ランキング