https://drtaira.hatenablog.com/entry/2021/05/19/233034

はじめに

インターネットを見ていたら、「PCR 検査『感度 70% は誤判定が多い』…医師に求められる対応」という幻冬舎の記事 [1] が目に留まりました。昔の記事かと思って日付を見たら、5 月 19 日．．何と今日の配信ではありませんか！よく見たら、「本記事は、岩田健太郎氏の著書『僕が「PCR」原理主義に反対する理由』（集英社インターナショナル）より一部を抜粋・再編集したものです」とあります。

当該本は 2020 年 12 月に出版された神戸大学医学部教授岩田健太郎氏による著書です。「非専門家たちの意見や予測は、ことごとくと言っていいほど、間違っている、検査原理主義を続けていくのは、日本医療の崩壊」、「医学常識の嘘を鋭く解き明かす傑作、ここに誕生」というキャッチフレーズがつけられた本です。しかし、それとは裏腹に、その中身と言ったら誤謬やデマだらけということが SNS 上で指摘され、一躍有名になった本でもあります。

私も読んでみましたが、その内容になるほどと思う反面、SNS 上で批判されているとおりの記述があることは認めますし、残念ながら岩田氏も含めて一部だとは思いますが、日本の医療クラスターの心配なくらいの科学リテラシーの低さも再認識したものです。

何でこの時期こんな記事が Yahoo ニュースで出てくるのかという思いもありますし、ここで今さら説明するのもくどいのですが、新型コロナウイルス感染症の PCR 検査をめぐる世界および日本の「感度 70%」論を比較しながら、PCR 検査の精度に関して日本が犯した誤りを再指摘したいと思います。

1. NEJM 論文に記載された感度 70%

結論から言えば、後述するように、「感度70%」として PCR 検査の固有感度で話をするのは誤りです。然るにこの感度 70% というのは、いったいどこから来ているのでしょう。岩田氏の以下のコメントにその引用元が記されています。NEJM（New England Journal of Medicine）という有名な医学雑誌です。

世界最高レベルの医学専門誌『ニュー・イングランド・ジャーナル・オブ・メディシン』に掲載された論文において、執筆者たちは「PCR の感度は 70 パーセント」と見積もっています。僕の体験的実感でも、だいたいそんなところかなと思います。

（文献 [1] より）

では彼が引用した NEJM 誌の論文というものをみてみましょう。

これは"Perspective"として米国の研究チーム、Woloshin らが出版した論説 [2] です。ちなみに、本論文は 2020 年 8 月に掲載されて以来、今日までの時点で 251 回引用されています。一般的に、直近の 2〜3 年で 1 年間に 10 回引用されればよい方だと言われる学界の論文の傾向を考えればきわめて被引用度が高く、NEJM 誌が高インパクトファクター（IF = 74.699 [2020]）を有する雑誌だということも頷けます。

ただ（蛇足ですが）NEJM 誌も含めていま権威ある医学雑誌といわれているものは、引用されやすい総説や論説の掲載が多く、自ずからインパクトファクターが高くなる傾向にありますので、その点で原著論文を中心に掲載する学術誌との単純な比較はできません。

そしてこれも当たり前ですが、個々の論文内容の質は高インパクファクターの雑誌に掲載されたかどうかということとは直接関係がありません。Woloshin らの論文もオリジナルな新規データを含む原著というわけではなく、敢えて誤解を恐れず言えば、BMJ 誌に掲載された従来の論説 [3] の焼き直しの感が強いです（ただし、内容は本質的ですが）。そして、彼らが SARS-CoV-2 検査の標準法であるプローブ・リアルタイム PCR（TaqMan PCR）の分析上の特質を理解していないのではないかと思われるフシもあり、この点の前提のオカシさもあります。

前置きが長くなりましたが、この論文の主旨は、一言で表せば「PCR 検査には偽陰性の問題があり、検査陰性の解釈にはむずかしさがある、そのための対処が必要」ということになります。それを具体的に示すために、ベイズ定理（Bayes’ theorem）を用いて、事前（検査前）確率（pretest probability）と一定の PCR 検査の感度（70% および 90%）と特異度（95%）を想定した時のシミュレーションを行ない、「検査陰性」の解釈がどうあるべきかについて論じています。その結果が図1 です。

f:id:rplroseus:20210521141904j:plain
図1. 事前確率に応じた感度70%と感度90%の検査（特異度95%）の事後確率の解釈（文献 [2] より転載）.

図1は、「検査が陰性の時に確率が 5％以下なら病気がないとみなす」という仮定の基に（図中の破線のレベル）、感度が 70％の場合には事前確率が 15％（矢印A）、感度が 90％の場合には事前確率が 33％（矢印B）を超えると「検査陰性」の結果を妥当に解釈することができないということを示しています。

では、岩田氏に「執筆者が感度 70% と見積もった」と言わしめた本論説ですが、一体どのように書かれているのでしょうか。その記載は以下のようになります。

But sensitivity for many available tests appears to be substantially lower: the studies cited above suggest that 70% is probably a reasonable estimate. At this sensitivity level, with a pretest probability of 50%, the post-test probability with a negative test would be 23% — far too high to safely assume someone is uninfected.

（文献 [2] より）

つまり、この論説では「先行研究は『70% がおそらく合理的な値』ということを示唆している」と言っているにすぎません。既出論文を参考にした推定値以上のものではないことがわかります（極論すれば、著者らが勝手に決めた数字）。そして感度 70% という仮定値に基づいて「事前確率が 50％のとき、PCR 検査で陰性と出た時の検査後確率は 23％程度となり、検査が陰性であっても感染していないと断定するにはあまりにも高すぎる」と述べているわけです。

では感度 70% とするに至った先行研究とは何でしょう。この NEJM 論文には 5 つの論文が引用されているので、それらのどれかを見た上での総合判断なのだろうと思います。この中で、感度 70% に結びつきそうな引用論文は、Watson らの論文 [3]、Yang らの論文 [4]、および Arevalo-Rodriguez らの論文 [5] ということになるでしょう。

2. Watson らの論文

それではまず、Watson らの論文 [3] をみてみましょう。この BMJ 誌に掲載された論文は、「COVID-19検査の結果をどう解釈するか」という課題について、ベイズ定理を用いて事前確率と偽陰性、偽陽性の出現確率を考察したものであり、Woloshin らの論説の基となった総説です。

この論文は、100% 正確な検査というものは存在せず、その検査の精度を知る上で指標になるのが感度と特異度であるということを述べています。これらは、最も精度の高いゴールドスタンダードと言われる別の検査の結果と比較することで求めることができますが、COVID-19 検査では、まだ明確なゴールドスタンダードが存在しないと指摘しています。

言い換えると、COVID-19 の標準検査法としてプローブ RT-PCR 法が用いられているのですが、それ以上の精度の高いゴールドスタンダードが現時点では存在しないために、PCR 検査自体の精度を（したがって固有感度も）求めることがむずかしいのです*（注1）。ではいま PCR 検査の感度や特異度と言われているものが何かと言うと、時系列で異なる検体や種類の異なる検体の検査結果に基づいて算出しているにすぎません。つまり「検体群 A の PCR」と「検体群 B の PCR」の結果を比べて述べているに過ぎません。

------

*（注1）

PCR検査の「固有の感度や特異度」を算出するためには、「検体群 A の PCR」と同じ「検体群 A の別の技法（PCR よりも高精度）＝ゴールドスタンダード」を比べる必要があるが、現時点でそのような技法は存在しない。

------

Watson らは、一例として濃厚接触者の確定陽性者の PCR 検査の臨床診断上の偽陰性の発生率は 2–29%（感度 71–98%）であるとしています。したがって、感度も偽陰性も知るためには、少なくとも 2 回以上の PCR 検査が必要であり、この繰り返し検査が言わばゴールドスタンダードになっていると述べています。

ここでわかるように、いま世間で言われている PCR 検査の「感度」というものは、あくまでも臨床診断上の指標（分析上の指標ではない）であって、2 回以上検査を行なって「確定した結果」と 1 回目の結果を比べたものにすぎません。

Watson らは、先行研究結果に基づいて感度を 70% と特異度を 95% と低めにセットして（これ自体は合理性がない）、後発の Woloshin ら [2] と同様なシミュレーションを行ない、事前確率に応じた検査陰性の解釈について考察しています。その一例としてあげられているのが図2 です。

f:id:rplroseus:20210522161544j:plain

図2. 事前確率80%、検査感度70%、特異度95%としたときの100人の被験者の検査結果の現れ方 (文献[3]より転載）.

図2 では、感染リスクの高い 100 人の事前確率を 80% として感度約 70%、特異度 95% の PCR 検査を実施した場合、陽性と判定されるのが 57人（図中青）、陰性と判定されるのが 43 人（図中水色）であることが示されています。しかし、実際は陽性者の一人は偽陽性であり（図中赤）、陰性者のうち 24 人は偽陰性です（図中黄色）。偽陽性の 1 人は自主隔離を言い渡される一方、24 人の偽陰性者は隔離は必要がないと告げられ、外で感染を広げてしまう可能性があることが示されています。

どこかで聞いたような話ですね。そうです。日本の専門家会議や政府分科会が盛んに言ってきたことと同じです。尾見茂会長を含め、沢山の感染症コミュニティー専門家や医者が PCR 検査の精度の低さに言及し、偽陰性の人が外出して感染を拡大する危険性があるので、むやみに検査を広げるべきではないと主張したのがこれです。

ここまでだと、この BMJ 論文と日本の感染症コミュニティ・医クラのみなさんの主張は同じように見えますが、実はここからが大きく違います。図3（注1）に示すように、症状が疑われる患者の場合は、1 回の検査陰性で COVID-19 を排除すべきでないと言っています。そして、中国の COVID-19 防止のハンドブックを引き合いに出して、偽陰性者が外出して他者に感染させるリスクを下げるために、検体の採取と検査を繰り返すべきと強調しています。

つまり、検査の限界性と偽陰性のリスクに言及しながら、検査拡大を主張しているわけです。日本とは正反対です。

f:id:rplroseus:20210522161604j:plain

図3. COVID-19の検査について知っておくべきこと（文献 [3] より転載）.

いずれにしろ、感度 70%、特異度 95% はこの論文ではっきり記述されていますが（上述したように、それ自体は根拠がない）、その持ち出しの目的は、日本の"感染症ムラ"の専門家のそれとはまったく異なるということです。

3. Yang らおよび Arevalo-Rodriguez らの論文

次に Yang らの論文 [4] を見てみましょう。この論文は、中国広東省 CDC による確定 COVID-19 入院患者から鼻咽頭ぬぐい液、喀痰、中咽頭ぬぐい液を採取し、検体ごとの PCR 検査の陽性率をみたものです。結果としてそれぞれ、53.1–85.3%、73.4–84.5%、45.7–72.7% の陽性率になりました。敢えてこれらを平均すれば約 70% になります。

結論として、この論文は、検体の種類と採取時期および患者の症状によって検査の感度に違いが出るため、たとえ検査陰性でも感染の可能性を排除せず、CT などを併用して診断すべきだと言っています。そしてこの時の感度というのは、確定患者数を 100% としたときの検体の種類、採取時期、症状ごとの相対比（%）ということになります。

繰り返しますが、COVID-19 患者ということは通常 PCR 検査によって確定しますので、上記論文の感度は PCR による確定数を分母として、異なる検体の PCR 陽性数から導き出されたことになります。PCR と PCR を比べて感度を出しているわけですから、PCR検査自体の固有の感度を出せるはずもありませんし、事実論文中では PCR 検査自体の固有の感度も述べていません。

ただし、論文には患者確定を PCR 検査で行なったかどうかの記述がありません。当然のこととして省略しているのでしょうか。「科学」論文としては明らかに手落ちだと思います。

最後に Arevalo-Rodriguez らの論文 [5] を見てみましょう。この論文は Watson らの BMJ 論文でも引用されています。この論文は 34 の異なる研究例に含まれる 12,057 人の陽性確定患者のプール解析によって、１回目の検査時における陰性結果の現れ方についてまとめたものです。偽陰性の発生率は 2–58% の範囲であり、中央値は 11% と報告しています。

したがって、１回目の検査の感度は 42–98%（中央値89%）になります。このように１回目の検査感度は、大きく値が異なることがわかります。患者の症状、検体の種類、検体の採取時期などに大きな違いがありますので、感度が大きく異なることは当然です。

ちなみにこの論文では、おそらく日本で最初に PCR 感度 70% を述べた 1 人と思われる坂本史衣氏（聖路加国際病院 QIセンター感染管理室マネジャー）の引用元である、Fang らの論文データ（→PCR検査をめぐる混乱）も含まれています。

3. 何が問題か

臨床診断上の「感度」は陽性の人を正しく陽性と判定できる割合を意味します。そして、分母になる PCR 検査で確定診断した COVID-19 陽性者数です。繰り返しますが、現状でPCR以上の精度の高い検査も「ゴールドスタンダード」として存在しないので、PCR 検査自体の感度の固有値を出すことはむずかしいのです。

にもかかわらず、Woloshin らの論文 [2] では PCR 検査の感度を 70% と固定したところに第一の問題があります。この論文では特異度も 95% と決めて議論を展開していますが、これも科学的根拠はなく、かつ明らかに低い値です。ブローブRT-PCR はきわめて特異度が高い技法として知られており、特異度はほぼ 100% です（検査自体の偽陽性[交差反応、非特異反応]はまず発生しない）。そしてベイズ定理を用いたシミュレーション自体も以下で述べるように問題があります。

岩田氏も事前確率が低い環境での PCR 陽性は疑わしいとよく言っていますが、疑わしいとする理由は何もありません。1 万人の中に 1 人感染者がいる場合（事前確率0.01%）、その 1 万人を PCR 検査を検査したら確実に 0〜1 人が陽性になります。0〜1と範囲があるのはその感染者のウイルスの排出量が分析上の検出限界以下であれば、感度 0 になるからであり、それ以上であればほぼ 100% の確率で 1 人陽性となります。

ここで上記の事前確率で、PCR の感度を 90%、特異度を 99.9% と仮定して、ベイズの定理に基づいて事後確率を計算すると、たった 8% にしかなりません。なぜこうなるかと言えば、ベイズ定理では、事前確率に応じて検査の精度（事後確率）が大きく変わるようになっているからです。ここが根本的問題であり、PCR 検査ではありえません。言い換えれば PCR 検査にベイズ定理を当てはまること自体が科学的に無理があるのです。この点を感染症コミュニティ・医クラの皆さんは全く理解していません。

ただ、Woloshin らの論文は、PCR 検査の感度 70% や特異度 95% を問題にしているわけではありません。「分析上の感度、特異度」と「臨床診断上の感度、特異度」が異なることもイントロダクションで述べられています。いくら感度が高い検査法でも偽陰性は発生するという前提で、検査陰性の解釈を事前確率との関係で考えるために、便宜上感度 70% という低めの推定値を用いてベイズ定理でシミュレーションしているわけです。

つまり、プローブRT-PCR の特性を考慮せず、現時点では算出がむずかしい感度や特異度の固有値を用いて単純に古典的なベイズ定理で偽陰性、偽陽性の発生確率を論じていることは科学的にはおかしいのですが、そこから検査の限界を突破するにはどうしたらよいかという、危機管理の面から誤判定の想定範囲を広げてポジティヴに問題解決へ向けて展開していることが本質なのです。

以下のように、「高感度の検査であっても陰性の結果は感染を排除できない」、「典型的有症状患者の検査陰性は偽陰性を疑え」、「検査を繰り返すことで感度の限界を克服することは可能（ただしこの戦略は検証が必要）」と結論づけています。

Fourth, negative results even on a highly sensitive test cannot rule out infection if the pretest probability is high, so clinicians should not trust unexpected negative results (i.e., assume a negative result is a “false negative” in a person with typical symptoms and known exposure). It’s possible that performing several simultaneous or repeated tests could overcome an individual test’s limited sensitivity; however, such strategies need validation.

（文献 [2] より）

上述したように、このような「疑わしい場合は陰性を排除するな」、「検査を繰り返せ」という見解は、Watson らの論文 [3] でも同じです。ベイズ解析の結果に基づいて、検査陰性の解釈に注意を促すとしても、決してそこから「検査は無意味」とか「検査を広げるな」とはなっていないのです。むしろ解決法として頻回検査を推奨しています。

一方、岩田氏は、検査原理主義という言葉を使って、さらには医療崩壊に繋がるというフレーズも持ち出しながら、あたかも検査拡大を否定するようなニュアンスで語っています。その前提として PCR 検査の感度 70% 論を持ち出しているわけですが、「僕の体験的実感でも、だいたいそんなところかなと思います」というコメントも含めて、信頼性に欠けるのは私一人だけの印象ではないでしょう。分析上の感度や特異度とともに PCR 検査を知っている人なら、実際に担当している人なら決してそのような印象にはならないと思います。

岩田氏が引用した Woloshin らの論文 [2] は、Watson らの論文 [3] や Kucirka らの論文（→PCR検査の偽陰性率を推定したKucirka論文の見方）とともに、日本の感染症コミュニティーや医クラに盛んに取りあげられてきた論文であり、「PCR 検査の精度の低さ」と「検査抑制論」の拠り所として使われてきました。しかし、感度 70% というような表面的な記述だけを捉え、論文の主旨をまったく理解していないような言述は、論文をちゃんと読んでいないのか、理解力が足りないのか、あるいは確信犯的にそうしているのか、いずれにしても誤謬または詭弁といわれる類いのものです。

私は日頃から論文やウェブ上の情報、SNS を注視していますが、不思議なことに、PCR 検査抑制論を唱えてきた人達が、より感度が低い簡易抗原検査（迅速抗原検査）を広めようという動きに対しては異を唱えているところを一度も見たことがありません。空港検疫で用いられている定量抗原検査も批判の対象にしていません。一体どうしたのでしょうか。

おわりに

今回のパンデミックにおいては、新型コロナウイルスの感染者は無症状者が多く、無症状であってもスーパースプレッダーになり得るということが特徴です。これはパンデミック当初からわかっており、感染拡大抑制においては無症状感染者対策がキーポイントでした。

防疫の基本策として「検査・隔離」が重要であり、検査をしなければ決して感染者も見つけられないはずです。しかし、不幸にして日本では「無症状者の検査は無意味」、「検査拡大は医療崩壊につながる」などのフレーズとともに検査抑制論が幅を利かし、そのためにしばしば PCR 検査感度 70% 論（および特異度 95%）とともに検査の精度の悪さがやり玉に上げられてきました。

同じ感度 70% 論でも、世界では「感染症に対する検査の限界をどう克服するか」という危機管理の側面から便宜上使われてきたのに対し、日本では感染症に対する危機管理のなさがそれを生み、海外の論文の表面部分だけを自己都合に解釈し、そして検査抑制論につながったいうことが言えます。

その線上において、日本では 2020 年 2 月の時点から感染症コミュニティーの専門家が、中国の研究チームの論文を引用しながら感度 70% 論を唱え（→PCR検査をめぐる混乱）、メディアや出版社がそれに乗り、論点を飛躍させたり歪曲させたりする多くの医者もいて、無用の社会の混乱を生んでしまいました。これらが日本の感染対策を遅らせ、余計に被害を拡大させてしまったことは否めないでしょう。そして日本が犯したこれらの誤謬や詭弁が、いまだにメディアを支配していることが気になります。

引用文献・記事

[1] 幻冬舎GOLD ONLINE: PCR検査「感度70%は誤判定が多い」…医師に求められる対応. Yahoo Japanニュース 2021.05.19. https://news.yahoo.co.jp/articles/d7f0dab3423b5bb81baccb81b8ad3b8c0c09cdde?page=3

[2] Woloshin, S. et al.: False negative tests for SARS-CoV-2 infection — challenges and implications. N. Eng. J. Med. 383, e38 (2020). https://www.nejm.org/doi/full/10.1056/NEJMp2015897

[3] Watson, J. et al.: Interpreting a covid-19 test result. BMJ 369, m1808 (2020). https://doi.org/10.1136/bmj.m1808

[4] Yang, Y. et al.: Laboratory diagnosis and monitoring the viral shedding of SARS-CoV-2 infection. The Innovation 1, 100061 (2020). https://doi.org/10.1016/j.xinn.2020.100061

[5] Arevalo-Rodriguez, I. et al.: False-negative results of initial RT-PCR assays for COVID-19: A systematic review. PLOS One Published: December 10, 2020. https://doi.org/10.1371/journal.pone.0242958

引用した拙著ブログ記事

2020年8月19日 PCR検査の偽陰性率を推定したKucirka論文の見方

2020年3月24日 PCR検査をめぐる混乱

カテゴリー: 感染症とCOVID-19