本书中的每一个模型都假设了理性行为主体——最大化期望效用的消费者、最小化成本的企业、具有一致时间偏好和正确信念的交易者。这些假设很有力:它们产生了精确的预测、干净的福利定理和优雅的数学。但它们是正确的吗?
本章直面证据。行为经济学记录了与标准理性模型的可预测、系统性偏差。这些不是在总量中被冲掉的随机误差——它们是在重复、激励甚至专业知识条件下仍然存在的模式化偏差。
我们从期望效用理论的裂缝开始——阿莱悖论和埃尔斯伯格悖论——并逐步构建前景理论,这是领先的描述性替代方案。然后我们考察现时偏好下的跨期选择、违反纯粹自利的社会偏好、有限理性和启发法、实验方法论、助推理论和行为金融学。全程的方法是正式的:我们写下效用函数、推导预测并对照数据检验。
前置知识:期望效用理论(第6章)、博弈论(第7章)、消费者理论(第6/10章)、计量经济学基础(第9章)、机制设计基础(第11章)。
相关文献:Kahneman & Tversky(1979);Tversky & Kahneman(1992);Thaler(1980, 2015);Laibson(1997);Fehr & Schmidt(1999);Gabaix(2014);Shleifer & Vishny(1997);DeLong, Shleifer, Summers & Waldmann(1990)。
回忆第6章,在完备性、传递性、连续性和独立性公理下,对彩票的偏好可以用期望效用表示:
独立性公理优雅且在规范意义上有吸引力。它说你对两个赌博的偏好不应受到无关共同成分的影响。但正如莫里斯·阿莱在1953年所展示的,大多数人类一致地违反它。
考虑两对彩票:
第1对:赌博1A:确定得到\$100万。赌博1B:10%概率得\$500万,89%概率得\$100万,1%概率得\$0。
第2对:赌博2A:11%概率得\$100万,89%概率得\$0。赌博2B:10%概率得\$500万,90%概率得\$0。
众数模式:大多数人在第1对中选择1A,在第2对中选择2B。联合选择$\{1A, 2B\}$违反了独立性公理。
根据独立性公理,替换共同结果(第1对中的\$100万,第2对中的\$0)不应改变排序。如果\$1A \succ 1B$,则\$1A \succ 2B$。偏好逆转揭示了确定性效应。
考虑一个罐子,有30个红球和60个黑色或黄色球(比例未知)。赌博A:如果抽到红球赢\$100(概率1/3,已知)。赌博B:如果抽到黑球赢\$100(概率未知)。大多数人选A。
但接下来:赌博C:如果抽到红球或黄球赢\$100。赌博D:如果抽到黑球或黄球赢\$100。大多数人选D。在EU下,$A \succ B$要求$C \succ D$。联合选择$\{A, D\}$违反了确定性原则。
这些悖论揭示独立性公理在描述上是失败的。我们需要一个能容纳这些违反的理论。
图19.3.阿莱悖论检测器。在每对中选择你偏好的赌博,然后检查你的选择是否违反独立性公理。
Pair 1
Pair 2
题目。两组彩票对。假设CRRA效用函数u(x) = x^{0.5}(x以百万为单位)。(a) 计算每个赌局的期望效用。(b) 期望效用推荐哪个?(c) 证明{1A, 2B}的选择违反独立性公理。
解答。
(a) EU(1A) = 1.0 × 1^{0.5} = 1.000。EU(1B) = 0.89(1) + 0.10(2.236) + 0.01(0) = 1.1136。EU(2A) = 0.11(1) = 0.11。EU(2B) = 0.10(2.236) = 0.2236。
(b) 期望效用推荐1B(1.114 > 1.000)和2B(0.224 > 0.110)。与期望效用一致的组合:{1A, 2A}或{1B, 2B}。
(c) 1A ≻ 1B要求1.11 u(1) > 0.10 u(5) + 0.01 u(0)。1B ≻ 2A要求1.10 u(5) + 0.01 u(0) > 0.11 u(1)。这两个条件直接矛盾。没有u(·)能同时满足两者。
卡尼曼和特沃斯基(1979)提出了前景理论作为描述性替代方案,后来精炼为累积前景理论(1992)。它在四个方面修改了EU:参考依赖、损失厌恶、敏感度递减和概率加权。
价值函数用定义在相对于参考点的得失上的$v(x)$取代了定义在最终财富上的$u(x)$:
特沃斯基和卡尼曼(1992)估计的参数为$\alpha = \beta = 0.88$,$\lambda = 2.25$。
三个性质:(1)参考依赖——结果被编码为相对于$r$的得利或损失。(2)敏感度递减——$\alpha, \beta < 1$使得利区凹、损失区凸。(3)损失厌恶——$\lambda > 1$使价值函数在损失区更陡峭。
图19.1.前景理论价值函数。S形曲线在得利区是凹的,在损失区是凸的,损失区斜率更陡(损失厌恶)。当$\alpha = \beta = \lambda = 1$时退化为线性(EU)。拖动滑块探索。
特沃斯基-卡尼曼(1992)参数$\delta \approx 0.65$。当$\delta = 1$时,$w(p) = p$(EU)。当$\delta < 1$时,函数高估小概率,低估大概率。交叉点在$p \approx 0.37$。
图19.2.特沃斯基-卡尼曼(1992)概率加权函数。反S形曲线高估小概率,低估大概率。当$\delta = 1$时退化为45度线(EU)。拖动滑块。
注意:这是原始前景理论表述(Kahneman & Tversky,1979),将决策权重应用于单个概率。累积前景理论(Tversky & Kahneman,1992)将决策权重应用于排序结果的累积概率,解决了某些异常现象,如随机占优的违反。
四重模式:小$p$ + 得利 = 风险寻求(彩票);小$p$ + 损失 = 风险厌恶(保险);大$p$ + 得利 = 风险厌恶(确定性效应);大$p$ + 损失 = 风险寻求(孤注一掷)。
题目。一个赌局以0.5的概率获得+\$1,000,以0.5的概率损失\$800。参考点r = 0。(a) 在CRRA效用函数u(x) = x^{0.5}、初始财富W = \$10,000下的EU确定性等价。(b) 标准参数下的前景理论估值。(c) 为什么损失厌恶逆转了评估结果?
解答。
(a) EU = 0.5(11,000)^{0.5} + 0.5(9,200)^{0.5} = 0.5(104.88) + 0.5(95.92) = 100.40。CE:\$100.40^2 = 10,080$。CE变化 = +80.2。接受赌局。
(b) v(+1000) = 1000^{0.88} = 436.5。v(−800) = −2.25 × 800^{0.88} = −2.25 × 358.7 = −807.1。概率权重w(0.5) ≈ 0.439:V = 0.439(436.5) + 0.439(−807.1) = −162.6。拒绝赌局。
(c) 损失厌恶(λ = 2.25)使\$800的损失权重远大于\$1,000的收益,从而逆转了评估结果。
标准理论假设指数贴现,贴现因子$\delta \in (0,1)$。关键性质是时间一致性:在$t=0$制定的计划在每个未来日期都保持最优。
实验证据压倒性地拒绝了恒定贴现。人们表现出递减的不耐心:今天与明天之间的贴现率远高于第100天与第101天之间。
准双曲线贴现因子为$\{1, \beta\delta, \beta\delta^2, \ldots\}$。即时时期获得权重1,但所有未来时期被额外乘以$\beta$。当$\beta < 1$时,"现在"和"未来"之间存在离散跳跃。
在$t=0$时,关于$c_1$的一阶条件为$\beta\delta u'(c_1) = u'(c_0)$。在$t=1$时,重新优化给出$u'(c_1) = \beta\delta u'(c_2)$。$\beta$的位置已经转移——计划是时间不一致的。
天真型行为主体无限期地拖延。成熟型行为主体使用逆向归纳法,可能采用承诺机制。
图19.4.Beta-delta贴现探索器。天真型行为主体永远拖延;成熟型行为主体使用逆向归纳。当$\beta = 1$时所有线条重合(无现时偏好)。拖动滑块。
题目。一个学生必须完成一个项目。今天的成本 = 6效用单位,2期后的收益 = 10效用单位。β = 0.7,δ = 0.95,共5期。(a) 天真型代理人何时行动?(b) 成熟型代理人呢?
解答。
(a) 天真型:在每个t期,现在行动的净效用 = −6 + 0.7 × 0.95² × 10 = −6 + 6.32 = +0.32。等待的感知净效用 = 0.7 × 0.95 × (−6) + 0.7 × 0.95³ × 10 = −3.99 + 6.00 = +2.01。由于2.01 > 0.32,总是推迟。一直拖延到截止日。
(b) 成熟型:逆向归纳。在t = 2(最后可行时期),净效用 = +0.32 > 0,所以t=2的自我会行动。在t = 1:现在行动的净效用 = +0.32,等待t=2行动的净效用 = +2.01 > 0.32,所以等待。在t = 0:同理,等待。成熟型代理人在t = 2行动——比天真型的截止日更早。
题目。β = 0.7,δ = 0.95,对数效用,3期收入Y = 100的代理人。(a) 无承诺时的储蓄。(b) 有承诺时的储蓄。(c) 福利增益。
解答。
(a) 无承诺:t=0分配c₀ = 100/(1+0.665+0.632) = 43.54,余56.46。在t=1重新优化:c₁ = 56.46/1.665 = 33.91,c₂ = 22.55。
(b) 有承诺:c₁ = 0.665 × 100/2.297 = 28.95,c₂ = 0.632 × 100/2.297 = 27.51。
(c) 无承诺:U = 3.774 + 2.344 + 1.967 = 8.085。有承诺:U = 3.774 + 2.237 + 2.095 = 8.106。增益 = 0.020效用单位。有承诺的代理人实现了更平滑的消费路径。
几十年的实验证据表明,人们系统性地偏离纯粹自利:拒绝不公平的出价、向陌生人给予、在一次性博弈中合作、惩罚搭便车者。
约束$\alpha_i \geq \beta_i$和$\beta_i < 1$是有实证动机的:嫉妒比内疚更伤人,没有人为了平等而销毁金钱。
在最后通牒博弈中,最低可接受出价$s^*$满足$s - \alpha_R(100-2s) \geq 0$,得到$s^* = 100\alpha_R / (1+2\alpha_R)$。当$\alpha_R = 2$时:$s^* = 40$。
图19.6.费尔-施密特不平等厌恶。更高的$\alpha$(嫉妒)提高了最低可接受出价。当$\alpha = \beta = 0$时为标准理论:任何正出价都被接受。拖动滑块。
图19.5.最后通牒博弈模拟器。作为提议者对抗不同的回应者策略。追踪你在各轮中的收益。
在独裁者博弈中,平均分配为20-30%。在公共品博弈中,加入惩罚机制可维持合作。
题目。\$100的最后通牒博弈。提议者:α_P = 0.5,β_P = 0.3。回应者:α_R = 2.0,β_R = 0.6。(a) 最低可接受报价。(b) 最优报价。(c) 与标准纳什均衡比较。
解答。
(a) U_R = s − 2.0(100−2s) = 5s − 200 ≥ 0 ⇒ s* = 40。
(b) U_P = (100−s) − 0.3(100−2s) = 70 − 0.4s,关于s递减。在s ≥ 40的约束下最小化s:最优报价s* = 40。U_P = 54,U_R = 0。
(c) 标准偏好(α = β = 0):报价\$1,被接受。费尔-施密特模型:报价\$40。更接近实验中40-50%的众数报价。
赫伯特·西蒙(1955)认为行为主体满意化而非优化:搜索直到找到可接受的选项,然后停止。
特沃斯基和卡尼曼(1974)识别了三种核心启发法:代表性(通过相似性判断概率)、可得性(通过回忆的容易程度估计频率)和锚定(从初始值开始调整不充分)。
加贝(2014)将有限理性形式化为一个优化问题:行为主体最大化效用减去每个维度的注意力成本$\theta$。行为主体感知$\hat{p}_k = \bar{p}_k + m_k(p_k - \bar{p}_k)$。
实验室实验具有真实货币激励、随机化和控制。优势:内部有效性。劣势:外部有效性。
实地实验将操控嵌入真实世界情境:自然行为、无意识、大规模。权衡:以较少的控制换取更大的现实性。
需求效应:被试可能因为知道自己被观察或推测实验者意图而改变行为。欺骗争论:经济学有严格的反对欺骗的规范,不同于心理学。
复制危机:只有36%的心理学研究被复制(开放科学合作,2015);经济学更高(约60%)但仍令人担忧。预注册解决p-hacking和发表偏差问题。
如果选择取决于框架和默认设置,那么选择架构——选择呈现的方式——就很重要。
最强大的助推是默认设置。器官捐献:主动加入国家为15-20%,自动加入国家为85-99%。退休储蓄参与率从约50%(主动加入)跳升到超过90%(自动加入)。
主动加入($d=0$)下:$P = \Phi((v-k)/\sigma)$。自动加入($d=1$)下:$P = \Phi(v/\sigma)$。当$v$为正但适中且$k/\sigma$不可忽略时,差距最大。
图19.7.默认效应模拟器。更高的转换成本扩大了主动加入和自动加入之间的参与率差距。当$k = 0$时默认设置无关紧要。拖动滑块。
EAST框架:简便(减少摩擦)、吸引(使之突出)、社交(利用规范)、适时(在接受度高的时刻提示)。
阻力是阻碍期望行为的摩擦。减少阻力通常与引入新的助推一样有效。
Bernheim和Rangel(2009):基于不受行为扭曲影响的选择评估福利——当行为主体信息充分、注意力集中且不受扭曲时。
When Thaler and Sunstein published Nudge in 2008, it seemed like a policy cheat code: redesign defaults and people save more, eat better, donate organs — all without restricting choice. Governments loved it. The UK created a "Nudge Unit," and Obama hired Sunstein as regulatory czar. But the backlash was fierce. Gilles Saint-Paul called it "the tyranny of utility" — technocrats deciding what's good for you while pretending to respect your freedom. Op-eds called nudging "manipulation by the state." Is libertarian paternalism a brilliant synthesis, or a contradiction in terms?
高级有效市场假说认为价格完全反映了所有信息。行为金融学对此提出挑战:许多交易者不是理性的,而理性套利者面临限制。
过度自信产生过度交易。巴伯和奥丁(2000):最活跃的交易者每年比最不活跃的少赚6.5个百分点。
参考点是购买价格。得利处于凹区域(风险厌恶,提早卖出);损失处于凸区域(风险寻求,持有)。
股票在3-12个月内表现优异(动量,Jegadeesh-Titman 1993),在3-5年内表现不佳(反转,DeBondt-Thaler 1985)。
即使理性交易者也可能无法纠正定价偏差:噪声交易者风险、执行成本和委托代理问题制约了他们。
德龙、施莱弗、萨默斯和瓦尔德曼(1990):更高的$\mu$使价格偏离基本面;更高的$\rho$放大偏差;更高的$\gamma$(套利者风险厌恶度)意味着对定价偏差的交易更不激进,因此偏差增大。
悖论:噪声交易者可以通过承担他们自己制造的风险而获得更高的预期收益。
图19.8.DSSW噪声交易者模型。噪声交易者情绪推动价格偏离基本面。风险厌恶的套利者无法完全纠正定价偏差。拖动滑块。
题目。f = 100,ρ = 0.30,μ = 20(看涨),r = 0.05,γ = 2。(a) 计算均衡价格。(b) 价格偏差。(c) 若γ = 0会怎样?
解答。
(a) p = 100 + (2 × 0.30 × 20)/1.05 = 100 + 12/1.05 = 100 + 11.43 = 111.43。
(b) 偏差:p − f = 11.43。资产被高估,因为噪声交易者将价格推高至基本面之上,而风险厌恶的套利者无法完全抵消。
(c) 若γ = 0:p = 100 + 0 = 100。风险中性的套利者交易力度足以完全消除错误定价。DSSW模型的关键洞见:正是套利者的风险厌恶(γ > 0)使得噪声交易者驱动的偏差得以持续。
You now have prospect theory, present bias, social preferences, bounded rationality, and the DSSW noise trader model. This is the final stop — the question gets its resolution.
The behavioral case is now fully assembled. Prospect theory (Kahneman & Tversky 1979) provides a formal, testable alternative to expected utility: people evaluate outcomes relative to a reference point, are loss averse ($\lambda \approx 2.25$), and overweight small probabilities. Present bias ($\beta\delta$ discounting, Laibson 1997) explains procrastination, undersaving, and time inconsistency — people discount the immediate future far more heavily than the distant future. Social preferences (Fehr-Schmidt inequality aversion) explain cooperation and punishment in settings where pure self-interest predicts defection. Bounded rationality (Gabaix sparse maximization) formalizes the idea that attention is scarce and people optimize over a simplified model of the world. These are not isolated anecdotes — they are systematic, replicable, and survive high stakes. The violations of the rationality axioms documented at Stop 2 (Chapter 11) now have formal alternative models that fit the data better than expected utility theory does.
Two powerful counterarguments survive the behavioral onslaught. First, ecological rationality (Gigerenzer): heuristics aren't biases — they're efficient adaptations to real-world environments with limited time and information. "Fast and frugal" heuristics often outperform full optimization in realistic settings with noisy data. The lab results that document "biases" may be artifacts of artificial environments that strip away the ecological context in which human cognition evolved to perform well. If the environment is uncertain enough, ignoring information can be optimal, not irrational. Second, market discipline: even if individuals are biased, competitive markets may aggregate away individual errors. Firms run by irrational managers get outcompeted. Consumers who systematically overpay get educated by experience. The "as if" defense — markets behave as if agents are rational, regardless of what happens inside their heads — remains a serious position, particularly for competitive product markets where entry is easy and feedback is fast.
Behavioral finance provided the critical test — and the "as if" defense failed in the one market where it should have been strongest. The DSSW noise trader model (1990) showed that irrational traders can survive and move prices because arbitrage is risky and limited. Shleifer and Vishny (1997) established the "limits to arbitrage": even sophisticated arbitrageurs face short-selling costs, margin calls, and career risk — they can't fully correct mispricings caused by noise traders. The equity premium puzzle, excess volatility, and momentum anomalies all persist despite decades of sophisticated arbitrage. If biases survive in financial markets — where information travels fastest, stakes are highest, and the smartest capital competes — the "as if" defense cannot be a general principle. The mainstream absorbed behavioral economics not by rejecting rational choice but by enriching it: prospect theory is now standard in finance, $\beta\delta$ preferences are standard in macro, and mechanism design increasingly incorporates behavioral agents.
People are not fully rational in the way the axioms require — the evidence is overwhelming and no longer seriously contested. The more important question is whether it matters for aggregate outcomes, and the answer is domain-specific. In financial markets: yes, biases survive and move prices, because limits to arbitrage are real and persistent. In consumer markets: sometimes — defaults and framing have large, durable effects on retirement saving, organ donation, and energy use. In competitive product markets: less clear — competition, entry, and experience may discipline many biases over time. The honest resolution is that "are people rational?" was the wrong question all along. Rationality is not binary. The right question is: when does irrationality matter for aggregate outcomes, and when does the market machinery wash it out? The answer depends on the specific market, the specific bias, and the specific institutional context. Behavioral economics didn't overthrow rational choice — it drew the map of where rational choice works, where it breaks, and what to use instead.
This is the final stop on BQ #4. The arc ran from the rationality assumption as a modeling tool (Ch 1), through its formalization and testable axioms (Ch 11), to the full behavioral challenge and its market test (here). The hardest unresolved question is about policy: if people are biased, should the government correct their choices? Nudge theory says yes, gently — libertarian paternalism. But the premise (systematic irrationality) may undermine the conclusion (people can be trusted to opt out). The "who nudges the nudgers?" problem has no clean answer — government regulators are themselves subject to the same biases they seek to correct. And the frontier keeps moving: neuroeconomics, computational models of bounded rationality, and machine learning approaches to preference estimation are reshaping what "rationality" even means in the 21st century.
Nudges work. But who decides what "better" means, and where does intervention stop? The internal logic of behavioral economics points toward hard paternalism, not the gentle kind.
高级Dan Riffle popularized the slogan in 2019. The welfare theorems say competitive equilibria are efficient — but many billionaire fortunes arise from market power, not competition. Behavioral economics adds another layer: fairness norms shape what people tolerate.
高级玛雅在夏季促销中为每杯柠檬水附赠一块免费饼干。销量适度增加——上升了8%。当玛雅取消免费饼干(恢复原价)时,顾客的反弹不成比例:投诉、差评、流失常客。销量下降15%——低于促销前的基准水平。
前景理论分析。促销期间,顾客的参考点从"柠檬水"转移到了"柠檬水+饼干"。添加饼干的收益为$v(+\text{cookie}) = (\text{cookie\_value})^{0.88}$。但移除饼干的损失为$v(-\text{cookie}) = -2.25 \times (\text{cookie\_value})^{0.88}$。感知到的损失是原始收益的2.25倍。促销是一个单向棘轮:给容易,收回痛苦。
玛雅设计助推实验。对于她的会员计划,玛雅将两种注册设计作为实地实验进行测试:处理A(主动加入):顾客可以在柜台报名。处理B(自动加入):每位顾客自动获得一张卡;可以选择退出。使用Eq. 19.9,$v = 3$,$\sigma = 2$,$k = 2$:主动加入$P = \Phi(0.5) = 0.69$;自动加入$P = \Phi(1.5) = 0.93$。玛雅的实地实验证实了预测。她将全面推广改为自动加入。
卡尼曼和特沃斯基(1979)。"前景理论:风险决策分析"是经济学中被引用最多的论文之一。发表于Econometrica,它将实验发现形式化为一个连贯的数学框架。卡尼曼在2002年获得诺贝尔奖;特沃斯基于1996年去世。
莫里斯·阿莱(1953)。这位法国经济学家直接向Leonard Savage展示了他的悖论。传说Savage本人也落入了阿莱模式。阿莱在1988年获得诺贝尔奖。
理查德·塞勒(2017年诺贝尔奖)。塞勒的"异常现象"专栏系统地编目了行为偏差。他2008年与Sunstein合著的Nudge将行为洞见带入政策领域,引发了全球的"助推小组"。
大卫·莱布森(1997)。"金蛋与双曲线贴现"将beta-delta模型形式化,解释了为什么人们同时持有18%利率的信用卡债务和5%利率的非流动性储蓄。
施莱弗和维什尼(1997)。"套利的限制"展示了为什么当理性交易者管理他人资金并面临资本约束时无法消除定价偏差。
| 标签 | 公式 | 描述 |
|---|---|---|
| Eq. 19.1 | $EU(L) = \sum p_i u(x_i)$ | 期望效用 |
| Eq. 19.2 | $v(x) = x^\alpha$ (gains), $-\lambda(-x)^\beta$ (losses) | 前景理论价值函数 |
| Eq. 19.3 | $w(p) = p^\delta / (p^\delta + (1-p)^\delta)^{1/\delta}$ | 特沃斯基-卡尼曼概率加权 |
| Eq. 19.4 | $V(L) = \sum w(p_i) v(x_i - r)$ | 前景理论估值 |
| Eq. 19.5 | $U_0 = u(c_0) + \beta \sum \delta^t u(c_t)$ | 准双曲线贴现 |
| Eq. 19.6 | $\beta\delta u'(c_1) = u'(c_0) \neq \delta u'(c_1)$ | 时间不一致性 |
| Eq. 19.7 | $U_i = x_i - \alpha_i \max(x_j-x_i,0) - \beta_i \max(x_i-x_j,0)$ | 费尔-施密特不平等厌恶 |
| Eq. 19.8 | $\max u(c) - \theta\|m\|_1$ s.t. $p \cdot c \leq w$ | 加贝稀疏最大化 |
| Eq. 19.9 | $P_{\text{enroll}} = \Phi((v - k(1-d))/\sigma)$ | 默认敏感型注册 |
| Eq. 19.10 | $p_t = f_t + \gamma \rho_t \mu_t / (1+r)$ | DSSW噪声交易者定价 |