SSブログ

RCT大全ー2020年9月16日発行 [思考の型]

61JW2QT9c-L.jpgRCT大全??ランダム化比較試験は世界をどう変えたのか
RANDOMISTAS??How Radical Researchers Are Changing Our World
アンドリュー・リー (著), 上原 裕美子 (翻訳)
四六判 タテ188mm×ヨコ128mm/312頁
ISBN-13 : 978-4622089339
出版社 : みすず書房
2020年9月16日発行
内容(「BOOK」データベースより)
被験者を2つのグループにランダムに割り当て、介入の効果を測定するランダム化比較試験(RCT)。この決定的手法は、これらの疑問にどう答えてきたのか?壊血病の昔から、最先端のウェブビジネスまで、医療、教育、経済、産業といったあらゆる分野でエビデンス革命を起しつつあるRCTを網羅的に紹介。巻末には「実施の10の掟」を収載する。
[>] 10代の少女に赤ちゃん人形を与えて育児を体験させると、早すぎる妊娠を防げる?
[>] 素行の悪い青少年を、刑務所の極悪犯と対面させると矯正できる?
[>] 貧困地域からの引っ越しを補助すれば、家族の経済状況は改善する?
[>] 不況下で職探しのヒントが詰まった冊子を配布すると就業者は増える?
[>] X線検査で背中の痛みを調べられる?
[>] 『セサミ・ストリート』の1話で教えるのは何文字がいい?
[>] マイクロクレジットは貧困世帯の所得を上げる?
[>] デパートの営業時間を短縮すると利益は増える?
目次
1 壊血病、刑務所見学、そして、もしも電車に乗り遅れたら
2 瀉血からプラセボ手術へ
3 不利益の解消にはコインを投げて
4 ランダム化のパイオニアたち
5 教え方を学ぶ
6 犯罪を制御する
7 貧しい国での貴重な実験
8 農場と企業とフェイスブック
9 政治と慈善活動の仮説を検証する
10 あなたも実験台
11 質の良いフィードバックループを作る
12 次の変化を導く
RCT実施の10の掟
 成功するRCTを行なうには、いささか特殊な素質の組み合わせが必要だ。優れたランダミスタは技術的スキルのほかに、運用面での思慮深さ、政治的知識、そして勇気を備えている。
 次に示す10のステップを参考に、ぜひRCTに挑戦してほしい。
1何を調べるか決める
 新しい介入のインパクトを、何も介入を受けない対照群と比較するのが、RCTの最もシンプルなアプローチだ。その他では、2種類以上の介入を比較することもある。複数のパターンで入れ替えて調べる実験はクロスオーバー実験という。たとえば自営葉者を支援するにあたり、職業訓練を提供する場合、補助金を提供する場合、両方、もしくはどちらもない場合を比べる。インパクトが即座に生じるものであれば、ランダムな間隔で「介入する」「介入しない」を切り替えて詞べてもよい。就寝時の習慣で不眠症が軽減するかどうか、1ヵ月のうち半分の日数だけに介人を行ない、スマートフォンアプリを使って毎日の睡眠の質を調べるなど。
2無作為な差をどのように作り出すか考える。発想は独創的に
 対照群に「あなたはこのプログラムを受けません」と告げることか現実的ではない、もしくは倫理的ではない状況もある。その際は標準的なRCTに代わる選択肢を検討する。たとえば、ある政策が2ヵ年以上で実施されるなら、初年度からの実施対象と次年度からの実施対象を無作為に分ける。採用率の低い既存プログラムを評価したい場合は、宣伝やインセンティブを通じて、無作為に選ばれた一部の人にプログラムへのアク七スを奨励する。
3対照群の行動を予測する
 対照群に入った人の気持ちになって考えてみる。自分なら何をするだろうか。アメリカの就学前教育プログラム「ヘッドスター卜」の例を思い出してほしい。このプログラムの評価では、対照群の幼児が別の公立幼稚園に入園していたことを、当初のうちは認識していなかった。その点を考慮に入れるまで、費用便益比率は2分の1に過小評価されていた。
4 どのアウトカム(結果)を測定するか決める
 行政データならば安価もしくは無料で人手できるだろう。実験対象の全員分のデータを集めることもできる。その点、調査を独白に設計する場合は、仮に対象者の1割しかアンケートに答えないとすると、サンブル数を10倍にして始めなければならない。追跡調査を複数回繰り返すやり方や、回答者に報酬を出すやり方もある(あるチェーン店の実験では、封筒にIドル札を入れたところ、回答事が8%から16%へと倍に伸びた)介入を評価する際は無作為割当に沿って行なうこと。最初は対照群に入っでいた被験者が、自力で同じ介人を手に入れていた際にも、当初の振り分けにもとづいてデータを分析する。
5 どのレベルをランダム化するか決める
 教育に関する介入を調べる際は、ランダム化を生徒間、クラス間、あるいは学校間で行なうことが考えられる。どのレベルを適ぶのが正解となるかは、実賎面や倫理面、もしくは介入内容が介入群から対照群へどう波及するかという検討しだいで変わってくる。たとえばエイズ治療薬に関して行なわれた初期の実験では、介人群の患者と対照町の患者が、実際には薬を分け合って使っていた。当時、この病気に罹患することは実質的に死の宣告だったので、こうした行動に出るのも理解できることだった。全員が治療薬の半分を服用していたので、実験結果は意味のないものとなり、治療薬の承認が下りるまで長い時間がかかってしまった。この実験を患者間ではなく病院間でランダム化していれば、サンプル数は多く要するものの、成功する可能性は高かったと考えられる。
6 ある程度の実験規模を確保する
 介入が、介人群と対照群にかなり大きな差を生むと予測されるなら、サンプルサイズは小規模でも充分だろう。育児支援プログラム「トリプルP」はインパクトが大きく、先住民わずか51世帯という規模でも確かな結果が確認された。だが、変化がかなり小さい事柄を試したい場合は、より大規模なサンプルが必要だ。テレビ広告の効果予測に関する問題を思い出しでほしい。個々のコマーシャルが消費者の購入判断におよぼすインパクトは非常に小さないため、インパクトを確認するのはRCTでもほぼ不可能だ。どの程度の実験規模が必要かヒントが欲しいなら、インターネットで「検出力計算Pawer calculation」」と検索すれば、便利なオンライン計算ツールが見つかる。対象としたいサンプルの規模が充分でない場合は、他の都市や他の国の研究者と協力することを検討しよう。サンプル数を増やせることに加えて、結課が特定の場面だけでなく、場所を問わず当てはまると多くの人に考えてもらえるようになる。
7 実験を事前登録し、倫理委員会の承認を得る
 結果を発表したいなら、まずふさわしい医学専門サイトもしくは社会科学サイトに実験を登録する。可能な限り倫理委員会の承認も得る。介入が被験者に害をもたらすものである場合は、倫理委員会の要請でデータ検証および安全性検証委員会が設立され、実験進行に対する監視を受けることとなるだろう。倫理委員会の承認を得るには時間がかかるが、何か問題が起きた場合の保険になる。2014年に、ある政治学実験が、アメリカのモンタナ州の有権者10万人にチラシを配布した。チラシは、州最高裁に対する選挙立候補者の思想スタンスを示すというも。しかし州の公式な印章が押されていたため、この実験はモンタナの選挙法に違反していた。研究チームがあらかじめ大学内部のレビュー委員会から承認を受けていれば、罪には問われなかったかもしれないが、あいにく承認を受けていなかった。
8 ランダム化に対する関係者の理解と賛同を確保する
その実験を行なう理由について関係者全員の理解を得ること。実験実施者は、資金提供者や運用責任者などに対し、ランダム化の必然性を納得させなければならない。たとえば福祉プログラムのRCTを行なう場合、現場のケースワーカーが無作為の割り当てにもとづき、貧しい人々への支援を拒否しなければならないかもしれない。こうした担当者がランダム化に従うことを拒否したら、おそらく実験は台無しだ。オーストラリアのナッジ・ユニットBETAの責任者マイケル・ヒスコックスは、「実験に私が投じる労力の75%くらいは、協力関係を形成し、関係者全員の認識をそろえて始めることだ」と話していた。専門家が地位をかさに着て行動したり、専門用語を振り回したりして、現場を混乱させてはいけない。RCTで何が学べると予想しているか、それがサービス受益者や組織にとってどう役に立つと考えられるか、実験が倫理にかなっていると考える根拠は向か、充分に時間をとって現場担当者に説明すること。
9確実に無作為でサンプルを分ける
 介人群と対皿群に人々を割り当てる方法は、コインを投げて決める、帽子の中に名前を書いた紙を入れて引く、表計算シートの乱数作成機能を使うなど。一つのリストを半分に分ける場合は、そのリストが順不同で並んでいるようにする。被験者に関する背景情報がある場合は、観察可能な特徴にもとづいて介入群と対照群のバランスをとり、統計精度をやや高めることができる。1930年代に青少年指導プログラムの評価を実施したときは、問題を抱えた若者の年齢、家族構成、非行行動の内容をもとに、条件の近いペアを作った。それから研究チームが各ペアについてコインを投げて、ペアの片方を介入群に、他力を対照群に振り分けた。
10 可能なら、小規模でパイロット実験を行なう
 スポーツ選手が競技前にペースを確認するのと同じで、最初に控えめな規模で実験の完全性を確認するとよいだろう。このときは利用可能な結果を出すのが目的ではなく、ランダム化と実施・調査段階で生じる予想外の問題を拾っておくのが狙いだ。経済学者ディーツ・カーランとジェイコブが共著書で指摘している通り、すぐにでも本格的な実験に着手したいと思っても、「普及率を予測し、実験中に発生しうる実施者側のヘマを明らかにしておくために、小規模のパイロット版で事前テストをするのが最善の策」だ。バグをつぶし、正式なRCTの準備を整えるのである。


nice!(0)  コメント(0) 

nice! 0

コメント 0

Facebook コメント