睡眠は心身の健康と密接に関わっていることが知られており、健康状態が悪化すると
睡眠にも悪影響が及ぶことが多々あります。新たに
スタンフォード大学医学部の研究チームが、1晩の
睡眠から100以上の
病気のリスクを予測するAIモデル「SleepFM」を開発したと報告しました。
A multimodal sleep foundation model for disease prediction | Nature Medicine
https://www.nature.com/articles/s41591-025-04133-4

New AI model predicts disease risk while you sleep
https://med.stanford.edu/news/all-news/2026/01/ai-sleep-disease.html
A Single Night's Sleep Could Predict Your Risk For More Than 100 Diseases : ScienceAlert
https://www.sciencealert.com/a-single-nights-sleep-could-predict-your-risk-for-more-than-100-diseases
研究チームはSleepFMを開発するにあたり、6万5000人の被験者から5秒単位で収集された合計約58万5000時間の
睡眠データを利用しました。この
睡眠データは、さまざまなセンサーを体中に取り付けて脳・心臓・呼吸器系の活動、眼球や足の動きなどを記録する
睡眠ポリグラフ検査(ポリソムノグラフィ、PSG)によって収集されました。
論文の共著者であり、
スタンフォード大学の
睡眠医学教授を務めるエマニュエル・ミニョー氏は、「
睡眠を研究する際には、驚くほど多くの信号を記録します。これは一種の普遍的な生理学データであり、完全に拘束された被験者を8時間にわたって研究します。そのデータ量は非常に豊富です」と語っています。
研究チームは、SleepFMを開発するために基盤モデルを構築しました。OpenAIのGPTシリーズのような大規模言語モデルは膨大な量のテキストデータでトレーニングされていますが、SleepFMの場合はテキストデータではなく、PSGで収集された
睡眠データでトレーニングが行われます。論文の共著者であり、
スタンフォード大学の生物医学データサイエンスの准教授を務めるジェームズ・ゾウ氏は、「SleepFMは本質的に
睡眠の言語を学んでいるのです」と述べました。
SleepFMは脳波・心電図・筋電図・脈拍・呼吸といった複数のデータストリームを統合し、それらが互いにどのように関連しているのかを把握できます。研究チームはこれを実現するため、1つのデータを非表示にした上でその他のデータから該当データを再構築する「leave-one-out対照学習」という新しいトレーニング手法を開発したとのこと。
ゾウ氏は、「この研究で私たちが成し遂げた技術的進歩のひとつは、これらすべての異なるデータ様式を調和させ、それらが一緒になって同じ言語を学習できるようにする方法を見つけ出したことです」とコメントしています。

研究チームは、最大25年間にわたって追跡された幅広い年齢層の長期的な健康状態に関する数万件のレポートを組み合わせ、SleepFMが
病気リスクをどれほどの精度で予測できるのかを調べました。その結果、健康記録に含まれる1041種類を超える
病気カテゴリーのうち、130種類についてはC統計量が「0.75以上」という精度で予測できることがわかりました。
C統計量とは、予測モデルがどれほど実際の結果を正しく予測できるかを示す指標です。C統計量が「1」であれば完全一致で、「0.5」であればランダムな予測と同程度という意味になります。
SleepFMは特にがん・妊娠合併症・循環器疾患・精神疾患において予測精度が高く、C統計量はいずれも「0.8」を超えました。具体的にはパーキンソン病が「0.89」、認知症が「0.85」、高血圧精神疾患が「0.84」、心臓発作が「0.81」、前立腺がんが「0.89」、乳がんが「0.87」、全死因の死亡率については「0.84」という結果でした。なお、さまざまながん治療への反応を予測するモデルなどのC統計量は「0.7」前後ですが、これらのモデルも臨床現場では有用と見なされているとのこと。
今回の結果は、
睡眠習慣の悪さと健康状態の悪化にみられる関連性を裏付けるものであり、さまざまな疾患の初期兆候として
睡眠の悪化が生じる可能性を示唆しています。ゾウ氏は、「非常に多様な条件に対して、このモデルが有益な予測を行えることにうれしい驚きを覚えました」と述べています。

今回の研究では、特定の疾患と強く関連している一部のデータのみで予測を行うよりも、すべてのデータタイプを組み合わせた予測が最も高い精度を発揮することも確認されました。ミニョー氏は、「疾患予測において得られた最も有益な情報は、異なるチャネルを比較対照することで得られました」と述べました。
研究チームは、ウェアラブルデバイスが収集したデータを追加してSleepFMの予測を改善する方法や、SleepFMが何を解釈しているのかを正確に理解することに取り組んでいるとのことです。