記事カテゴリ

記事区分

タグ

なぜRandomized Controlled Trialはエビデンスレベルが高いとされているのでしょうか?
〜交絡因子とバイアスのコントロールについて〜

Evidence Based

  • 執筆者: 李光純
  • 2020/04/12
  • 記事区分:非会員/無料

記事の長さ:4467文字

研究にはいろいろなタイプがあり、それぞれの研究デザインには特徴があります。エビデンスレベルの三角形は研究タイプごとの信頼性を表した物で、三角形の上の方に行くほど信頼性が高いとされています。

Randomized Controlled Trial(ランダム化比較試験)はエビデンスレベルが高いと見なされている研究のタイプですが、何をもってエビデンスレベルが高いとされているのでしょうか?
論文を評価するときに重要な指標、外的妥当性、External validity(またはGeneralizability) と 内的妥当性(Internal Validity)という言葉に関して簡単に以前の記事で説明しました。信頼性の高い研究は外的妥当性が高く、内的妥当性も高い研究ということができます。サンプルから得られた結果が一般化できて、かつ、交絡因子やバイアスが適切にマネージメントされた研究です。そのことがエビデンスレベルの三角形にも現れていると言えます。本記事では、新型コロナウィルスの治療薬として注目されているアビガンの治療効果を検証する架空のRandomized Controlled Trial(ランダム化比較試験)を例に、なぜRCTがエビデンスレベル高いとされているのか?を、なるべくわかりやすく解説していきます。

エビデンスレベルの三角形

研究にはいろいろなタイプがあります。模型を使った研究、動物や細胞を使った実験、等の基礎研究、臨床研究では、コホート研究 に代表される観察研究、サンプル(患者さん)に投薬や治療を行い、コントロール群(治療や投薬を行わないグループ)との結果を比較する介入研究など、また、時間軸によって横断研究や、縦断研究という分類もあります。それぞれの研究デザインには特徴があり、長所や短所があります。エビデンスレベルの三角形は研究タイプによる信頼性をおおまかに表した物で、一般的に三角形の上の方に行くほど信頼性が高いとされています。

 

エビデンスレベルの三角形

 

上から3番目の矢印のランダム化比較試験(Randomized Controlled Trial) は臨床研究の中では信頼性が高いと考えられ、ゴールドスタンダードとも言われています。

医科の分野での臨床試験(新薬の効果や治療法の有効性を調べる等)で行われるタイプの研究です。今ですと新型コロナウィルスの治療薬としてインフルエンザ治療薬アビガンの有効性が臨床試験で盛んに検証されていると思います。

これは介入研究といって実際にサンプル(人)に投薬や治療行為などの介入をし、コントロール群のサンプルと結果を比較します。

ランダム化比較試験(RCT)がなぜ、臨床研究の中で最も信頼性が高いと考えられているのか?

その理由は RCTが前向きの研究であり介入研究であるため、交絡因子やバイアスを研究デザインを立てる段階である程度コントロールすることができるからです。

もう少し噛み砕いてご説明します。

まず前向きの研究とは、過去の実験データを使用して解析する後ろ向き研究と異なります。どういう目的で、何を知るために研究を行うか?研究プランを事前に立ててから、研究を開始します。

介入研究とは、実際に患者(サンプル)に投薬や治療等の介入を行い、コントロール(非介入群やプラセボ群)と比較して、その効果を検証します。

研究計画を立てる段階で、交絡因子やバイアスを最小限にできるようなサンプル集めや実験方法をデザインすることができるのです。交絡因子やバイアスがマネージメントされてない研究は、真の因果関係(本当にその新薬、または治療によってその効果が出ているのか?)を調べることができません。交絡因子やバイアスが適切にマネージメントされていることはその研究の内的妥当性を高め、信頼性が高くなります。

 

交絡因子とは?ランダム化比較試験(RCT)でどうマネージメントされているか?

交絡因子がRCTでどのようにマネージメントされているか?の一つの例として、新型コロナウィルスの治療薬を例え話としてご説明します。交絡因子とは、その結果に寄与している可能性がある第3の因子です。


例:アビガンの新型コロナウィルスへの効果を検証する実験


 

Aグループ:アビガンを30人の新型コロナウィルス感染者に投与、2週間後にウィルスが検出されなくなった率が80%とします。この80%は本当に薬の効果で治癒したものか?元々体に備わっている免疫力のせいではないか?免疫力は治癒に寄与する、薬以外の因子となり、交絡因子と言えます。この交絡因子を排除するためにはBグループ:アビガンを投与したように見せかけて、実は何も効果がない錠剤(コントロール群)を30人の新型コロナウィルス感染者投与し、2週間後の治癒率が60%だったとします。この治癒率は免疫力での治癒ということになります。また薬にはプラセボ効果といって、薬本来の効能でなく、薬を投与されたという事実によって、具合が良くなる、快調になる効果があると言われています(気の持ちようってやつですね)、ですので、Bグループの治癒率は自己免疫力とプラセボ効果での自然治癒率となります。AとBを比較して初めて、免疫力やプラセボ効果という交絡因子を排除したアビガンの効果が検証できます。コントロール群(Bグループ)との比較がないと、本当にアビガンの効果で治ったかどうかがわからないのです。

 

バイアスとは?ランダム化比較試験(RCT)でどうマネージメントされているか?

バイアスは研究のすべての段階で起こる可能性があり、色々なタイプのバイアスがあります。
今回の記事ではランダム化比較試験(RCT)に関連する、選択バイアスと情報バイアスを上のアビガンの治療効果を検証する実験を例に解説していきます。

選択バイアスとは、どうマネージメントされるべき?



交絡因子を排除するために、Aグループとコントロール群のBグループを比較しました。トータル60名がサンプルとしてこの実験に参加しています。
ではこの60名をAとBにグループされるときに、どのように分けるのか?

ここにランダム化比較試験の名前が示すとおり、ランダムに分けることでサンプルの偏りが起こらないようにします。
(性別、年齢、その他諸々の個体差)のサンプル、選択バイアス(Selection Bias)を排除します。
たとえばAグループは平均年齢40歳でBグループの平均年齢が60歳となると、そもそもグループ間のサンプルに年齢という大きな偏りがあり、治癒率に影響を与えます。実験では純粋に薬の効果を検証したいため、これでは困ります。また、Aグループに喫煙者が多かった、Bグループに喫煙者が少なかった、という偏りも結果に影響を与えると思います。ランダムに分けることでサンプルの偏りが起こらないようにします。

情報バイアスとは?どうマネージメントされるべき?



患者側が自分がどちらのグループに振り分けられたかわからないようにする盲検法(Blinded)を行うことで情報バイアス(Information Bias)をコントロールします。
アビガンを投与されたと知っている患者さんと、何の効果もない薬を投与されたと知っている患者さんでは、気分や行動に違いがあるかもしれません。前者の場合、希望から免疫力がアップする、積極的に良くなろうとして、栄養や睡眠を良く取るかもしれません。一方後者の場合は気分が落ち込んで、やけくそになり、自暴自棄な行動を行い、それが治癒に影響するかもしれません。こういった情報によってサンプルの行動が変わってしまう(バイアスがかかる)ことで結果がねじ曲げられてしまうのを防ぐのが盲検法なのです。患者さんだけを盲検化した実験を 一重盲検法(Single-blineded)と言います。

実験を行う術者の側がどちらのどの薬が投与されているかわからないようにすることも情報バイアスを防ぎます。アビガンに効果があると信じたい研究者が、効果を測定するときに自分が好む結果の方向に誘導してしまう、というバイアスを防ぐのです。
患者さんと、研究者(または術者)の両方が盲検化されている研究は二重盲検法(Double-blinded) と言い、研究の内的妥当性(信頼性)が高くなります。

このように、RCTが最も信頼性が高いと考えられているのは、交絡因子やバイアスを可能な限り排除できるように研究デザインを事前に組み立てることができるためです。


RCTであれば全て信頼性が高い研究と思って良いの?



そうではありません。緻密にデザインされたRCTもあればそうでないものもあり、それを見分けるのが読者であり、そういう視点で論文を評価することがCritical appraisal です。論文を読むときにはサンプルはどういった人たちなのか、どのように集められ、どのようにグループ分けされたのか?実験群とコントロール群は偏っていないのか? Blindedは行われているのか?等は見ていく必要があります。

Blindedを行なっていないRCTよりもSingle blindedの方が信頼性が高いですし、Single blindedよりもDouble Blindedの方がより信頼性が高くなります。

バイアスは他にもいろいろあり、見るべきポイントは他にもあります。今後実際の論文を引用しながら解説していきたいと思っています。


補足:内的妥当性と外的妥当性はトレードオフの関係



研究で、Biasや交絡因子を排除していけば行くほど内的妥当性が高くなります。が、そうすると外的妥当性(一般化できるかどうか)が損なわれることにもなると言われています。。色々なものをコントロールしていくと、一般化できなくなるのです。

例(あまりいい例でないかもしれませんが):
30歳の健康男性(肥満喫煙なし)だけのサンプルで治療効果を検証する研究を行なう場合、加齢や、喫煙習慣、肥満の影響などの交絡因子を排除できますが、その結果を一般化できるかというと、そうではありません。なぜなら実際治療や投薬が必要な人たちは高齢で、基礎疾患もあり、肥満や喫煙をする人も含まれているからです。

論文を読むときは、その研究のサンプルがリアルワールド(私たちの患者さん)に当てはめられるかどうか(外的妥当性も高いかどうか)、の視点は常に意識して読む必要があります。

 

終わりに

本記事では、研究のエビデンスレベルと、研究の信頼性を評価する批判的吟味とはどういうものかをランダム化比較試験を例に解説しました。

ここでエビデンスレベルの3角形について、注意することがあります。

信頼性が高いとされている研究デザインでも、研究の手法, 論文のmaterial & method のところを読むととても信頼性が高いと思えない研究も多くあります、なので批判的に論文を読む視点がとても重要になります。

何でもかんでもエビデンスレベルの3角形の上に位置している研究だから、信頼性が高いと思うのは危険です、かつての私はそう思い込んでいました、、、

 

上へ戻る