因果推断中文书单整理及简介
因果推断中文书单整理及简介@[TOC](
- 书单1: 为什么:关于因果关系的新科学[2019]
- 书单2: 别拿相关当因果!因果关系简易入门[2016]
- 书单3: 倾向值分析:统计方法与应用[2012]
- 书单4: 基本无害的计量经济学:实证研究者指南[2012])
对应pdf涉及版权问题,不便上传,如有学术研究需要,可私信联系。
书单1: 为什么:关于因果关系的新科学[2019]
THE BOOK OF WHY : THE NEW SCIENCE OF CAUSE AND EFFECT , Judea pearl
1.1 简介
Pearl的《为什么》是笔者所知道的目前已出版的唯一一部因果关系科学方面的科普著作,作者在其中深入浅出地把因果关系科学的理论框架及其发展脉络展现给了读者。值得一提的是,那些曾经令人备感困惑的悖论作为经典统计学中的未解之谜,最终也经由因果关系分析而拨云见日,笼罩在其上的迷雾也随之烟消云散了。水落石出后,因果推断显得如此自然,就仿佛一切本该如此。对于每一位想了解因果关系科学的读者来说,以《为什么》为起点就意味着你踏上了一条捷径,在理解此书的基础上阅读因果关系科学方面的专业著作,你的收获将会更大。
1.2 目录
这本书共305页,十章。
书单2: 别拿相关当因果!因果关系简易入门[2016]
2.1 简介
研究因果关系的方法有很多种(有些是互补的,有些是对立的),而且涉及众多领域(包括哲学、计算机科学、心理学、经济学、医学等)。我无意在这些争辩中选择立场,只想为读者呈现各种观点,厘清各种观点之间的共识与分歧。除此之外,我们还将探讨关于因果关系的心理学(人们是如何了解原因的)、如何进行因果关系的实验(以及这些实验的局限性是什么),以及如何根据因果关系来制定相应的策略(我们是否应该减少食物的含盐量,以此来预防高血压)。
我们首先要弄清楚什么是原因,以及为什么我们常常会弄错事情发生的原因(第1~3章)。然后,要认识到在原因的理解和运用方面,“什么时候”与“为什么”同等重要(第4章)。接着,要学习如何只通过观察就找到事情发生的原因(第5章)。大型数据集可以让我们找到事情发生的原因,而不是简单用来检验我们的假设。但是我们必须认识到,并不是所有的数据都能用来推理事件发生的原因。在第6章,我们将考察数据特征对推理的影响。第7章将探索在可以做实验的情况下,如何去克服这些数据特征给我们带来的挑战。这里所说的实验可能是复杂的临床试验,也可能只是某人对自己不同锻炼计划所做的对比实验。通常情况与个别情况之间的差异,正是我们需要使用专业性策略对各种事件做出解释的原因(第8章讨论的内容)。但是,要想利用因果关系来制定有效的干预措施,如在菜单上提供食品热量信息来降低肥胖症发生的概率,就需要有更多的信息,而且很多干预措施还可能带来意想不到的后果(第9章将详述这一点)。本书将会告诉你为什么因果关系如此难找(比报纸文章告诉你的要更细致、更复杂),以及为什么尽管如此,它仍是一个相当重要且广泛适用的话题。
2.2 目录
这本书共244页,10章。
书单3: 倾向值分析:统计方法与应用[2012]
3.1 简介
这是一本介绍当代因果分析方法的书。他系统介绍了美国关于因果分析的四种前沿统计方法。,本书集中关注紧密联系但在技术上又相互区别的用于评估计干预效应的四种模型:①Heckman 的样本选择模型(Heckman 's sample selection model))(Heckman ,1976,1978,1979)及其改进形式;②倾向值匹配(propensity score matching )(Rosenbaum &Rubin ,1983)及有关的模型;③匹配估计量(matching estimators )(Abadie &Imbens ,20022006);④以非参数回归进行的倾向值分析(Heckman ,Ichimura,&Todd,1997,1998)
在介绍这些新方法的过程中,本书的写作和准备以两个基本目标为指引。第一个目标是围绕着这四种倾向值分析模型向读者介绍它们的源起、主要特征和争论。我们希望这一介绍能有助于实现我们的第二个目标,即阐明一些新的思路、概念和方法,社会行为研究者们可将它们应用到自己的研究领域来解决可能遇到的问题。此外,本书还有两个最高目标。我们的主要目标是以一种更不技术性且更实用的方式对分析方法在过去30年中的理论和技术进步加以介绍,使其易于理解且便于应用。第二个目标是推动社会行为研究者们就使用非实验方法估计因果效应的挑战、策略和最佳方法进行讨论。
3.2 目录
这本书共268页,七章。
书单4:基本无害的计量经济学:实证研究者指南[2012]
4.1 简介
本书为实证研究者把握计量经济学的精义提供了一个向导,这些计量经济学的精义也就是我们所指的基本无害的计量经济学(Mostly Harmless Econometrics)在应用计量经济学家的工具箱中,最重要的几件工具可以列举如下:
(1)为了将可能掩盖因果关系的变量控制起来,而设计的回归模型(Regression Model )
(2)用于分析真实实验以及自然实验的工具变量方法(Instrumental Variables Method )
(3)在重复观察中用以处理不可观察的缺失变量的双重差分方法((Difference-in-Difference Strategies )。
对上面这些基本技巧的创造性使用要求读者对统计推断的作用机理有坚实的概念基础和良好的理解。应用计量经济学在这两方面的特点将会在本书中得到体现。
许多计量经济学方面的教科书都对研究方法提供一些指导,因此本书和其他广泛使用的教科书存在一些内容上的重叠。但这本书在多个方面有别于传统的计量经济学教科书。首先,我们认为使用数据回答特定因果关系的经验研究最有价值,这类似于在医学研究中经常出现的随机临床实验。我们研究所有问题的方法都体现这个观点。在缺乏真实实验时,我们寻找经过良好控制的对照组,或者说自然的“准实验(quasl-experiment )”。我们要指出的第二个不同是本书在一定程度上忽略严格性。大多数计量经济学教科书都对计量模型进行严格处理。特别的,这些书对诸如线性性和同方差性等大家认为经典模型中普遍会被违背的假设进行大量讨论。虽然在行文中也会提及这些问题,但我们采取一种更加宽容和不那么迁腐的态度。
4.2 目录
这本书共266页,8章。我们从两个作为引言的章节开始。第1章描述了对之后章节可能很有用的研究设计步骤。第2章讨论了在医学研究中用到的随机实验,这个实验为我们最感兴趣的问题提供了一个理想的基准。在引言章节之后,本书第二部分3-5章,分别讨论了回归、工具变量和双重差分法的核心内容。这三章内容既强调估计值的一般性质(比如回归总是可以近似条件期望函数等),也强调了对估计值赋予因果解释所需的假设(比如条件独立假设、工具变量“就像”随机分配、相似世界等)。在本书第三部分我们转入扩展,6-8章。其中第6章考察对非连续实验的回归分析,我们既可将该部分内容看作回归一控制这种研究策略的变体,也可将其看作是一类工具变量估计法。在第7章我们讨论了用分位数回归来估计我们关心的变量对被解释变量分布的影响。最后一章则针对的是统计推断问题,我们在之前章节中对渐进性质进行考察时省略了这一部分内容。本书的一些章节里包含了更具技巧性或者专门性的小节,可以在不影响掌握本书主旨的前提下省略这部分小节都用星号()标出。