今週のQiita技術書まとめ
2023年6月18日配信
【決定版】因果推論本の読書ガイド31冊〜『インベンス・ルービン 統計的因果推論』和訳記念!
Update版を書きました 因果推論の3流派 因果推論を初心者が読んでいくと、本によって全然違うことが書いてあって混乱します。実施難しい概念を扱っていることもあるのですが大きく3つの流派があり、この本は〇〇派だよ、と明記してないことが多くそれぞれ概念や用語が異なるのが原因かなと思います。以下時に記載ないものは流派をあまり意識しない入門か概論、それぞれの流儀にはR, P(Cは私が読んでないのでここで…
データ分析の力 因果関係に迫る思考法
ビッグデータが存在するだけでは、「因果関係」の見極めはできない。データの扱い、分析、解釈においては、人間の判断が重要な役割を担うー。本書では「広告が売り上げに影響したのか?」「ある政策を行ったことが本当に良い影響をもたらしたのか?」といった、因果関係分析に焦点を当てたデータ分析の入門を展開していきます。序章では、なぜ因果関係を見極めることがビジネスや政策の成功の鍵を握るのか、様々な実例を使いながら解説します。第2章以降では、ランダム化比較試験、RDデザイン、パネル・データ分析など、因果関係に迫る最先端のデータ分析手法について、数式を使わず、具体例とビジュアルな描写を用いて解説していきます。
政策評価のための因果関係の見つけ方
経済学におけるランダム化比較試験のパイオニアである エステル・デュフロ教授らによる、理論的解説と実践的ノウハウが凝縮。 監訳者の小林庸平氏による解説は、 本書の難解な部分を直感的でわかりやすい解説で補いながら、 近年注目されている「エビデンスに基づく政策形成(EBPM)」に ランダム化比較試験をどう活かしていくかを展望。 EBPMに関心のある人、経済学の実証研究に関心のある人、必見! 近年、注目を集める因果推論。その代表的手法であるランダム化比較試験(RCT)について理論的に解説するのみならず、現実社会のフィールドでRCTを行う場合に、どういったことに気を付ければよいのか、理想的な...
岩波データサイエンス 3
【特集】「因果推論ーー実世界のデータから因果を読む」 〈特集まえがき〉(立森久照・林岳彦・伊庭幸人・星野崇宏) ・ ・因果推論ことはじめ(立森久照) ・〈コラム〉時系列の因果と相関(伊庭幸人) ・相関と因果と丸と矢印のはなしーはじめてのバックドア規準(林岳彦・黒木学) ・準実験のデザインー観察データからいかに因果関係を導き出すか(津川友介) ・統計的因果効果の基礎ー特に傾向スコアと操作変数を用いて(星野崇宏) ・ ・因果効果推定の応用ーCM接触の因果効果と調整効果(加藤諒・星野崇宏) ・傾向スコアを用いたバント効果の推定ーーノーアウト1塁のバントは,得点確率を有意に高...
因果推論入門〜ミックステープ:基礎から現代的アプローチまで
因果推論とは、ある要因が何を(どれくらい)引き起こしたのかを判断するためのツールです。本書は、因果推論に関する最近までの進展をまとめ、学生や実務家を対象として、因果関係に関する意味のある回答を導き出すために必要な統計的手法を解説していきます。 本書の最大の特徴は、理論だけでなく、統計プログラミング言語(R、Stata)による実装を重視している点にあります。例題には、読者が利用できるデータとコードが添付されており、すぐに手を動かして実践することができます。本書は機械学習に関するトピックを含まない一方で、理論的な解説が詳細であるほか、DAGや合成コントロール法といった発展的なトピックを扱っ...
つくりながら学ぶ! Pythonによる因果分析
ビジネス現場ではデータ活用の重要性がますます高まっています。データに基づいた経営施策の実施とその効果検証のためには、一般的な統計指標(平均、標準偏差、相関)だけでなく「因果」にまで分析を広げる必要があります。 本書は因果分析の重要な2つの領域である「因果推論」および「因果探索」について、実際にプログラムを実装しながら学ぶ書籍です。因果推論や因果探索を学びたいビジネスパーソンや、初学者の方を対象としています。 ・因果推論とは「テレビCM放映で、商品購入量がどれくらい増えたのか?」「研修の実施で、社員スキルがどの程度向上したのか?」など、なんらかの施策を実施した際に、その施策の効果を推...
効果検証入門〜正しい比較のための因果推論/計量経済学の基礎
ビジネスで利用されるデータの多くは、その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には、DM送付などの広告施策であれば、担当者はユーザの反応率を上げるために、反応しやすいであろうユーザに対してのみDMを発送します。ここで発生したデータでDMの効果を計る場合、単純にDMを受け取っているか否かで結果を比較することは、DMの効果以外にも意図的にリストされたユーザの興味や関心を含んでしまうことになります。 データが生まれるプロセスに人の意思が関わる場合、単純な集計では判断ミスとなる可能性があります。わずかな計算の狂いでも後々のビジネスにおいて大きな影響を及...
統計的因果推論の理論と実装
本書は,統計的因果推論の理論(数理的メカニズム)と実装(Rによる数値解析)の両方を統一的にカバーしたものである。具体的には,ハーバード大学統計学科のDonald B. Rubinの提唱した潜在的結果変数の枠組みによる統計的因果推論を扱う。また,データの一部が観測されない場合の因果推論も扱っており,これは類書にはほとんどみられない本書の特徴である。 本書の数理的な理論解説は,できるだけ高校数学の範囲内で理解できるように工夫した。微積分や線形代数も,ほぼ登場しない。さらに,必要な数学的知識は,登場する箇所で解説を加えた。また,Rを使った数値計算により,数学が苦手な人にも統計的因果推論のメカ...
傾向スコア
近年の統計科学では、原因と結果の因果関係を正確に知ろうとするアプローチが盛んであり、これらのアプローチは一般に因果推論と呼ばれている。本書で扱う傾向スコアも、因果推論を主眼とする方法の一つである。一般的に、処置の有無をランダムに割り当てることのできない調査観察データでは、処置群と統制群の間に属性の違いが生じる。傾向スコアとは処置の有無に影響を与える複数の情報を集約した要約指標であり、この要約指標を用いて、あたかもランダム化実験が行われたかのように、処置群と統制群の元々の属性の違いを調整する。 本書では、第1章で傾向スコアの基礎となる方法や仮定をレビューし、第2章で傾向スコアのモデリングと...
実証分析のための計量経済学
知りたいことがわかるから実証分析は楽しい。最小二乗法、最尤法、プロビットモデル、順序ロジットモデル、多項ロジットモデル、トービットモデル、ヘーキットモデル、操作変数モデル、パネル分析、DD分析、サバイバル分析、同時決定・内生性バイアスとその対処方法などをわかりやすく実践的に解説。分析例を多数収録!
実証分析入門
政策効果の評価などで注目を集める「因果関係」の推測方法を、数式に頼ることなく解説。実証分析の「作法」が身につく。 第1章 実証分析における心構え: これからの「実証」の話をしよう 第2章 実証分析の落とし穴: こんなの絶対おかしいよ 第3章 確率統計の基礎: 高校時代に逢った、ような…… 第4章 OLS: わたしの、最高の友達 第5章 重回帰分析: 魔女の作り方 第6章 決定係数R2: ☆もりはつ☆の59%は勢いで出来ています 第7章 仮説検定(1): お前はもう死んでいる 第8章 仮説検定(2): 私が死んでも代わりはいるもの 第9章 さまざまなモデル...
因果推論の科学 「なぜ?」の問いにどう答えるか
「人工知能の巨人」が放つ「なぜ?の科学」の革命的な入門書! 「私自身、この本の解説を書くことが憚られるくらいの凄い内容」 --松尾豊氏(人工知能学者・東大大学院教授)絶賛! 米Amazonでは1256レビュー、4.5★。ポピュラーサイエンスの世界的ベストセラー! ・今までの統計学では答えられなかった「なぜ?の科学」とは? ・それは3段の「因果のはしご」を使って説明できる ・著者は人工知能界のノーベル賞にあたるチューリング賞受賞! ・現在のデータ主義には限界がある。それを乗り越える「因果推論」とは? ・その商品が売れた理由をどう分析し、新たな儲けにつなげるか? ・公衆衛生...
マンスキー データ分析と意思決定理論 不確実な世界で政策の未来を予測する
データ分析の結果を消費する、すべての人たちへ。最新のデータ分析手法をノーベル経済学賞候補が数式なしでわかりやすく解説。明確な分析結果の裏には、強すぎる仮定が置かれている。すべてのデータサイエンティスト・ジャーナリスト・行政職員必読! 日本語版序文 監訳者まえがき 第1部 データ分析編 第1章 強い結論欲しさに、分析の信頼性が犠牲にされている 第2章 政策の効果を予測する 第3章 これまでにない処置の効果を予測する 第2部 意思決定編 第4章 単純な状況下で部分的な知識に基づいた意思決定の理論 第5章 複雑な状況下で部分的な知識に基づいた意思決定の理論 第6章 デ...
RCT大全
耳寄りの話が満載。 神話を覆し、隠れた真実を明らかにすることに興味があるなら、 ぜったい欠かせない必読書だ。 ーースティーヴン・D・レヴィット(シカゴ大学教授 『ヤバい経済学』) 次世代の政策担当者が本書にしたがえば、世界は文字どおり変わるだろう。 ーーデイヴィッド・ハルパーン(イギリス政府「ナッジ・ユニット」長) 本書の主題はこのうえなく重要だーー私たちは自分が誤りうるということを認められるほど謙虚なのか? そして学ぶことに十分注意を払っているか?…万人が読むべき本だ。 ーーティム・ハーフォード(『フィナンシャル・タイムズ』紙シニア・コラムニスト) ▶ 10代の少女に赤...
ローゼンバウム 統計的因果推論入門
「傾向スコア」の提案者Paul R. Rosenbaumによる統計的因果推論の入門書。 数式による説明は最低限に,多くの例とやさしい文章で丁寧に解説! ローゼンバウムの本は,想像通り,本書のテーマについて注意深く正確に説明されており,そこには統計学の卓越した知識が反映され,それらはすべて熟練した教育者による技術のもとで記されている。 --スティーブン・スティグラー(統計学者,『統計学の7原則』著者) 観察研究と実験から因果関係を推論するための考察と戦略の宝庫。この本は読むのが楽しく,因果推論について学ぶあらゆるレベルの読者にとって興味深い内容が詰め込まれている。 --ディラン・S...
調査観察データの統計科学
情報化社会の進展とともに大量のデータが得られるようになり、また社会科学でも実証志向の高まりから調査研究が盛んに行われている。しかし、「因果推論」を行なう際のデータの偏りや「選択バイアス」を無視してしまうと、いくら大量のデータがあっても真実とは逆の結論が導かれることすらある。本書では豊富な具体例とともに、「共変量情報の積極的な利用」「欠測データモデル」「セミパラメトリック推定」という3つの武器を用いて、偏りのあるデータから正しい推論を行なう方法論を示す。関連して、インターネット調査の偏りの補正や「データ融合」についても詳しく説明する。
インベンス・ルービン 統計的因果推論(上)
統計的因果推論の基本文献 "Causal Inference for Satistics, Social, and Biomedical Sciences: An Introduction" 待望の全訳! ノーベル賞経済学者インベンスと,Rubin流アプローチを拓いたルービンの協同作業から生まれた入門書にして基本書. 具体的な小事例に沿って潜在的結果変数(potential outcomes)に基づく分析モデルのコンセプトを平易に解説."An Introduction"の名のとおり数理的な難渋さに陥ることなく,統計学,社会科学,医学生物学,データサイエンスなど幅広い読者に推奨できる内容....
インベンス・ルービン 統計的因果推論(下)
統計的因果推論の基本文献 "Causal Inference for Satistics, Social, and Biomedical Sciences: An Introduction" 待望の全訳! ノーベル賞経済学者インベンスと,Rubin流アプローチを拓いたルービンの協同作業から生まれた入門書にして基本書. 具体的な小事例に沿って潜在的結果変数(potential outcomes)に基づく分析モデルのコンセプトを平易に解説."An Introduction"の名のとおり数理的な難渋さに陥ることなく,統計学,社会科学,医学生物学,データサイエンスなど幅広い読者に推奨できる内容....
入門 統計的因果推論
大家Pearlによる入門書。図と言葉で丁寧に解説。相関関係は必ずしも因果関係を意味しないことを前提に,統計的に原因を推定する。〔内容〕統計モデルと因果モデル/グラフィカルモデルとその応用/介入効果/反事実とその応用 1. 序論:統計モデルと因果モデル なぜ因果を学ぶのか Simpsonのパラドックス 確率と統計 グラフ 構造的因果モデル 2. グラフィカルモデルとその応用 モデルとデータの関係 連鎖経路と分岐経路 合流点 d 分離性 モデル検定と因果探索 3. 介入効果 介入 調整 バックドア基準 フロントドア基準 条件付き介入と特定共変量効果 逆確率重み...
統計的因果推論
第2回 杉山明子賞[出版賞](日本行動計量学会“出版賞”)受賞! 日本行動計量学会総会(2012年9月15日(土)新潟県立大学)におきまして、黒木 学先生が、杉山明子賞(出版賞) を受賞しました。受賞理由は、本書の翻訳出版によるものです。 本書は、「人工知能分野の巨人のひとり」(Richard Korf)として数えられ、統計的因果推論の世界的権威である人工知能研究者Judea Pearlによって書かれた"Causality-Models、 Reasoning and Inference-"(Cambridge Univ. Press)の邦訳である。 本書は、既存の統計的因果推論の教...
統計的因果探索
膨大なデータから、いかにして原因と結果の関係を見いだすのか? 「LiNGAM」(線形非ガウス非巡回モデル)を開発した第一線の研究者が、基礎事項から発展的話題まで平易に説き起こす。因果推論・因果探索に必携。 ■おもな内容 第1章 統計的因果探索の出発点 第2章 統計的因果推論の基礎 第3章 統計的因果探索の基礎 第4章 LiNGAM 第5章 未観測共通原因がある場合のLiNGAM 第6章 関連の話題 ■機械学習プロフェッショナルシリーズ 本シリーズでは、発展著しい機械学習技術の数学的な基礎理論、実用的なアルゴリズム、それらの活用法を、全29巻にわたって刊行する。 ビッグデータ時代を牽...
A/Bテスト実践ガイド 真のデータドリブンへ至る信用できる実験とは
経営層やリーダー、データサイエンティスト、エンジニア、アナリスト、プロダクトマネージャーなど、企業の全関係者を対象として、その概念から実験を実施するためのプロセス、よくある落とし穴、オンライン実験をスケールさせるために必要なことまで、A/Bテスト、コントロール実験の詳細を解説する。 Google, Amazon, Microsoft, LinkedInなどで実際に実践された経験から得られた教訓や落とし穴などがふんだんに盛り込まれており、データ駆動型の文化の確立、科学的な意思決定に必要なスキルを獲得できる。 第I部 すべての人向けの導入的トピック 第1章 導入と動機付け 第2章 実験の実行...
政治学と因果推論
政治学の分野で重要性を増している「因果推論」。本書ではその基礎から書き起こし、さまざまな研究例を用いて無作為化実験、自然実験、不連続回帰デザイン、操作変数法、差の差法といった具体的手法を解説していく。さらに研究の基本的な流れや進めかたなども論じ、読者を研究の実践へといざなう。 第1章 政治学と因果推論 1 原因と結果の政治学 2 単純な比較はうまくいかない 3 反事実という考え方 4 なぜ因果推論なのか 5 本書の特徴 6 ロードマップ 第2章 因果効果の定義と自己選択バイアス 1 変数とは何か 2 因果効果の定義 3 因果効果の測定 4 自己選択バイアスの影響 ...
民主主義の経済学 社会変革のための思考法
●「『最悪の政治体制』の経済学的解明!」(伊神満イェール大学准教授) ●「学生時代にこんな本があったら良かったのに」(山本鉄平MIT准教授) いま民主主義の真価が問われている。ロシア、中国、イラン、北朝鮮といった民主主義とは異質な権威主義国家の脅威だけでなく、トランプ前大統領時代からのアメリカ国内の混乱など、民主主義国家の存在を揺るがす事態が続いている。 本書は近年目覚ましく発展している「新しい政治経済学」による民主主義の分析である。選挙を中心に政治経済学の代表的なモデルと、それに関連する実証研究を紹介する。 実証研究では、著者が「因果推論の四天王」と呼ぶ以下の手法を駆使して、政...
EBPM エビデンスに基づく政策形成の導入と実践
EBPMの基本的な概念や手法について解説したうえで、米国・英国といった海外の事例や国内における実践例について具体的に解説する。そもそもエビデンスとは何か、EBPMはどのような手順で進めればよいのか、モデルとなるような事例にはどのようなものがあるのか、有益でわかりやすい手がかりを提供する。 巻頭言 はじめに 第1部 EBPMの基礎:概念整理と日本における現状分析 第1章 EBPMとは何か 第2章 「真価志向」の政策形成 第3章 医療におけるEBMからEBPMが学べること 第4章 EBPMに死を! 第2部 海外におけるEBPM 第5章 米国におけるEBPM 第6章 英国におけるEBP...
多数派の専横を防ぐ 意思決定理論とEBPM
大竹文雄氏(大阪大学特任教授)、川村孝氏(京都大学名誉教授)推薦! エビデンスに基けば、望ましい治療法が選択でき、良い政策選択ができる、とEBPMを誤解している人が多い。医療では、医師、患者、家族の価値観が異なっている。公共政策ならもっと複雑だ。EBPMと集団的意思決定の両方を理解しないと、質がよくて納得できる意思決定はできない。本書は医療と公共政策の意思決定の共通点を浮かび上がらせてくれる。 (大竹文雄・大阪大学特任教授) 個人や社会が意思決定をする際の「エビデンスの活用と解釈」「意思集約の科学的方法」が具体例とともに紹介され読み応えがあり、その際の基盤となる考え方に...
世界一わかりやすい 「医療政策」の教科書
高齢化社会を迎えた現在、セオリー(学問的な理論)とエビデンスの両方を兼ね備えた“綿密にデザインされた医療政策”がわが国には必要不可欠となっている。本書はハーバード大学の博士課程で学んだ著者が、医療政策・医療経済学に関するセオリーとエビデンスのうち、普遍性があり、日本の医療にも適用できるものを中心に紹介するもの。通読が容易な読みやすい記述で、医療政策学および医療経済学が一通りよく分かる。
医学のための因果推論(1)
因果推論の主要な手法のうち,一般化線型モデルの理論と統計手法を学び,豊富な事例を通して医学研究への応用までを解説する。〔内容〕一般化線型モデル/共変量の選択/大標本のための統計的推測の手法/小標本のための統計的推測の手法。
医学のための因果推論(2)
1巻目の一般化線型モデルに続き,Rubin因果モデルの理論と統計手法を学び,豊富な事例で医学研究への応用までを解説。〔内容〕推定目標/ランダム化/プロペンシティスコア/操作変数法/周辺構造モデルとIPW推定量/媒介分析。
ロスマンの疫学第2版
疫学の教科書。初めに交絡を提示して、いろいろな問題について、それらを統合的に見通す一連の考え方があることを示した。第2版では、疫学と公衆衛生の歴史、感染症疫学の2章が新しく加えられている。
アドバンスト分析疫学
ジョンズホプキンス大学公衆衛生大学院の疫学(中級コース)の講義内容をもとに書籍化。観察的疫学から正確な結論を導くための、論理と数理を踏まえた分析と解釈のあり方を提示。600の文献を踏まえて作成され、369もの精選された図表を用い、40の基本的数式に基づく「具体的な計算例」を通して細やかに解説。誤差による研究の「無意味化」を防ぐべく、疫学研究の各プロセスの意義やそこで生じうる問題を、前提となる「仮定」を強調しながら明らかにする。
付加価値ってなんだろう?
はじめに 「付加価値」というのは仕事において大事というのは言わずもがなですが、そもそも付加価値って??というのをきちんと説明できる人って少ないんじゃないでしょうか? たとえ説明できても、付加価値をどのように創出し、売り上げや利益としていくのかまでは多くの人が疑問なところではないでしょうか。 今回はそんな付加価値についての知識がまとめられた、以下の本を参考に付加価値について記事にします。 付加価値の…
付加価値のつくりかた
キーエンス出身の著者が仕事の悩みをすべて解決する 「付加価値のノウハウ」を体系化。 いかに仕事の生産性を高め、売上や利益を効率よく増やしていくのか。 いかにムダな仕事を減らし、本当に意味のある仕事に集中していくのか。 そのキーとなるのが、本書のテーマである「付加価値」なのです。 「付加価値」という言葉は、ビジネスシーンでよく聞く言葉でしょう。 ですが、「そもそも付加価値とはどういうものか、わからない」「『付加価値をつくれ』と言われるけど、何をどう考えればいいのかわからない」という人が意外と多いのではないかと思います。 仕事において重要なものであることは誰でも知っているが、その定義や...
スクラムでの見積もり
はじめに スクラムでの見積もりは意外とさらっと書かれている事が多く、作業見積もりと規模見積もりがごちゃごちゃの状態でスクラムを進めていた結果、チームの中で見積もりに対する不信感が強くなり「このままではいけない」と感じたため、まとめました。 また、似たような記事があまりネット上で見かけなかったため、ここにざっくりと分かるように集約しました。ぜひ、自分のようにごちゃごちゃになってしまっている方に届けば…