Chapitre 19Économie comportementale et expérimentale

Introduction

Chaque modèle de ce livre a supposé des agents rationnels — des consommateurs qui maximisent l'utilité espérée, des entreprises qui minimisent les coûts, des traders avec des préférences temporelles cohérentes et des croyances correctes. Ces hypothèses sont puissantes : elles produisent des prédictions nettes, des théorèmes du bien-être élégants et des mathématiques raffinées. Mais sont-elles vraies ?

Ce chapitre confronte les preuves. L'économie comportementale documente des écarts prévisibles et systématiques par rapport au modèle rationnel standard. Ce ne sont pas des erreurs aléatoires qui se compensent dans l'agrégation — ce sont des biais structurés qui persistent avec la répétition, les incitations et même l'expertise.

Nous commençons par les fissures dans la théorie de l'utilité espérée — les paradoxes d'Allais et d'Ellsberg — et progressons vers la théorie des perspectives, la principale alternative descriptive. Nous examinons ensuite le choix intertemporel sous biais du présent, les préférences sociales qui violent le pur intérêt personnel, la rationalité limitée et les heuristiques, la méthodologie expérimentale, la théorie du nudge et la finance comportementale. Tout au long, l'approche est formelle : nous écrivons des fonctions d'utilité, dérivons des prédictions et les testons contre les données.

À la fin de ce chapitre, vous serez capable de :
  1. Identifier les paradoxes d'Allais et d'Ellsberg comme des violations formelles des axiomes de l'utilité espérée
  2. Énoncer la fonction de valeur et la fonction de pondération des probabilités de la théorie des perspectives avec leurs formes paramétriques
  3. Modéliser le biais du présent à l'aide du cadre quasi-hyperbolique (bêta-delta) et dériver l'incohérence temporelle
  4. Calculer les résultats d'équilibre sous les préférences d'aversion aux inégalités de Fehr-Schmidt
  5. Distinguer la satisficing de l'optimisation et caractériser la maximisation parcimonieuse
  6. Évaluer les choix de conception expérimentale — laboratoire vs terrain, effets de demande, préoccupations de réplication
  7. Appliquer la théorie du nudge et l'architecture du choix à la conception des politiques
  8. Expliquer pourquoi l'arbitrage rationnel ne parvient pas à éliminer les erreurs de prix comportementales sur les marchés financiers

Prérequis : Théorie de l'utilité espérée (Ch. 6), théorie des jeux (Ch. 7), théorie du consommateur (Ch. 6/10), bases d'économétrie (Ch. 9), familiarité avec la conception de mécanismes (Ch. 11).

Littérature citée : Kahneman & Tversky (1979) ; Tversky & Kahneman (1992) ; Thaler (1980, 2015) ; Laibson (1997) ; Fehr & Schmidt (1999) ; Gabaix (2014) ; Shleifer & Vishny (1997) ; DeLong, Shleifer, Summers & Waldmann (1990).

19.1 Violations de l'utilité espérée

Le repère de l'utilité espérée

Rappelons du chapitre 6 que sous les axiomes de complétude, de transitivité, de continuité et de l'axiome d'indépendance, les préférences sur les loteries peuvent être représentées par l'utilité espérée :

Utilité espérée. Une théorie de la décision sous risque où un agent choisit la loterie $L$ qui maximise $EU(L) = \sum_{i=1}^{n} p_i \, u(x_i)$, où $p_i$ sont les probabilités objectives, $x_i$ les résultats, et $u(\cdot)$ une fonction d'utilité de Bernoulli définie sur la richesse finale. L'utilité espérée est le repère par rapport auquel tous les écarts comportementaux sont mesurés.
$$EU(L) = \sum_{i=1}^{n} p_i \, u(x_i)$$ (Eq. 19.1)
Axiome d'indépendance. Si la loterie $A$ est préférée à $B$, alors un mélange $pA + (1-p)C$ doit être préféré à $pB + (1-p)C$ pour toute loterie $C$ et toute probabilité $p \in (0,1)$. L'ajout d'une composante commune $C$ ne devrait pas inverser votre classement de $A$ par rapport à $B$. Le paradoxe d'Allais démontre des violations systématiques de cet axiome.

L'indépendance est élégante et normativement séduisante. Elle dit que votre préférence entre deux loteries ne devrait pas être influencée par une composante commune non pertinente. Mais comme Maurice Allais l'a démontré en 1953, la plupart des êtres humains la violent de manière cohérente.

Le paradoxe d'Allais (1953)

Paradoxe d'Allais. Le résultat empirique (Allais, 1953) selon lequel la plupart des gens préfèrent un gain certain de \$1 million à un pari risqué d'espérance plus élevée (l'effet de certitude), tout en préférant simultanément un pari plus risqué lorsque les deux options impliquent de l'incertitude. Ces préférences conjointes violent l'axiome d'indépendance de la théorie de l'utilité espérée.

Considérez deux paires de loteries :

Paire 1 : Loterie 1A : \$1M avec certitude. Loterie 1B : \$5M avec prob 0,10, \$1M avec prob 0,89, \$0 avec prob 0,01.

Paire 2 : Loterie 2A : \$1M avec prob 0,11, \$0 avec prob 0,89. Loterie 2B : \$5M avec prob 0,10, \$0 avec prob 0,90.

Le schéma modal : la plupart des gens choisissent 1A plutôt que 1B et 2B plutôt que 2A. Ce choix conjoint $\{1A, 2B\}$ viole l'axiome d'indépendance.

Effet de conséquence commune. Un cas particulier de violation de l'axiome d'indépendance dans lequel les préférences s'inversent lorsqu'une conséquence commune partagée par les deux options d'une paire est modifiée. Dans le paradoxe d'Allais, la composante de probabilité 0,89 commune aux deux loteries de chaque paire est la conséquence commune.

Par indépendance, remplacer la conséquence commune (\$1M dans la Paire 1, \$0 dans la Paire 2) ne devrait pas changer le classement. Si \$1A \succ 1B$, alors \$1A \succ 2B$. L'inversion révèle un effet de certitude.

Le paradoxe d'Ellsberg (1961)

Paradoxe d'Ellsberg. Le résultat empirique (Ellsberg, 1961) selon lequel les gens préfèrent les loteries avec des probabilités connues aux loteries avec des probabilités inconnues (ambiguës), même lorsque la théorie de l'utilité espérée prédit l'indifférence. Cela révèle l'aversion à l'ambiguïté.

Considérez une urne avec 30 boules rouges et 60 boules noires ou jaunes en proportions inconnues. Loterie A : gagner \$100 si rouge (prob 1/3, connue). Loterie B : gagner \$100 si noire (prob inconnue). La plupart choisissent A.

Mais ensuite : Loterie C : gagner \$100 si rouge ou jaune. Loterie D : gagner \$100 si noire ou jaune. La plupart choisissent D. Sous l'utilité espérée, $A \succ B$ exige $C \succ D$. Le choix conjoint $\{A, D\}$ viole le Principe de la chose sûre.

Aversion à l'ambiguïté. La préférence pour les probabilités connues par rapport aux inconnues. Un agent averse à l'ambiguïté préfère un pari 50/50 provenant d'une urne connue à un pari équivalent provenant d'une urne de composition inconnue. Cela viole les axiomes de Savage sous-jacents à l'utilité espérée subjective.

Ces paradoxes révèlent que l'axiome d'indépendance échoue de manière descriptive. Nous avons besoin d'une théorie qui intègre ces violations.

Figure 19.3. Détecteur du paradoxe d'Allais. Sélectionnez votre loterie préférée dans chaque paire, puis vérifiez si vos choix violent l'axiome d'indépendance.

Pair 1

1A : \$1M à coup sûr
1B : 10 % \$5M, 89 % \$1M, 1 % \$0

Pair 2

2A : 11 % \$1M, 89 % \$0
2B : 10 % \$5M, 90 % \$0
Exemple 19.1 — Calcul du paradoxe d'Allais

Problème. Deux paires de loteries. Supposons une utilité CRRA u(x) = x^{0,5} (x en millions). (a) Calculer l'EU de chaque loterie. (b) Laquelle l'EU recommande-t-elle ? (c) Montrer que {1A, 2B} viole l'indépendance.

Solution.

(a) EU(1A) = 1,0 × 1^{0,5} = 1,000. EU(1B) = 0,89(1) + 0,10(2,236) + 0,01(0) = 1,1136. EU(2A) = 0,11(1) = 0,11. EU(2B) = 0,10(2,236) = 0,2236.

(b) L'EU recommande 1B (1,114 > 1,000) et 2B (0,224 > 0,110). Paires cohérentes avec l'EU : {1A, 2A} ou {1B, 2B}.

(c) 1A ≻ 1B exige 1,11 u(1) > 0,10 u(5) + 0,01 u(0). 1B ≻ 2A exige 1,10 u(5) + 0,01 u(0) > 0,11 u(1). Ces conditions sont directement contradictoires. Aucune u(·) ne peut satisfaire les deux.


19.2 Théorie des perspectives

De l'utilité espérée à la théorie des perspectives

Kahneman et Tversky (1979) ont proposé la théorie des perspectives comme alternative descriptive, affinée par la suite en théorie des perspectives cumulative (1992). Elle modifie l'utilité espérée de quatre façons : dépendance à la référence, aversion aux pertes, sensibilité décroissante et pondération des probabilités.

Théorie des perspectives. Une théorie descriptive de la décision sous risque (Kahneman et Tversky, 1979) qui remplace l'utilité espérée par quatre modifications clés : la dépendance à la référence, l'aversion aux pertes, la sensibilité décroissante (concave pour les gains, convexe pour les pertes) et la pondération des probabilités.

La fonction de valeur

La fonction de valeur remplace $u(x)$ définie sur la richesse finale par $v(x)$ définie sur les gains et les pertes par rapport à un point de référence :

Fonction de valeur (en S, coudée). L'analogue en théorie des perspectives de la fonction d'utilité, définie sur les écarts par rapport à un point de référence plutôt que sur les niveaux de richesse finale. Elle est concave pour les gains, convexe pour les pertes, et présente un coude au point de référence où la pente pour les pertes dépasse la pente pour les gains du coefficient d'aversion aux pertes $\lambda$.
$$v(x) = \begin{cases} x^{\alpha} & \text{if } x \geq 0 \\ -\lambda(-x)^{\beta} & \text{if } x < 0 \end{cases}$$ (Eq. 19.2)

Les paramètres estimés par Tversky et Kahneman (1992) sont $\alpha = \beta = 0{,}88$ et $\lambda = 2{,}25$.

Trois propriétés : (1) Dépendance à la référence — les résultats sont codés comme gains ou pertes par rapport à $r$. (2) Sensibilité décroissante — $\alpha, \beta < 1$ donne la concavité pour les gains et la convexité pour les pertes. (3) Aversion aux pertes — $\lambda > 1$ rend la fonction de valeur plus pentue pour les pertes.

Aversion aux pertes. Le résultat empirique selon lequel les pertes pèsent plus que les gains équivalents : $|v(-x)| > v(x)$ pour $x > 0$. Le coefficient d'aversion aux pertes $\lambda \approx 2{,}25$ signifie que perdre \$100 est ressenti comme environ 2,25 fois pire que gagner \$100.
Dépendance à la référence. Le principe selon lequel les résultats sont évalués comme des gains ou des pertes par rapport à un point de référence, et non comme des états de richesse finale. Le point de référence est généralement le statu quo, mais peut être les anticipations, les aspirations ou les comparaisons sociales.

Figure 19.1. Fonction de valeur de la théorie des perspectives. La courbe en S est concave pour les gains et convexe pour les pertes, avec une pente plus raide pour les pertes (aversion aux pertes). À $\alpha = \beta = \lambda = 1$, elle se réduit à une droite (utilité espérée). Déplacez les curseurs pour explorer.

La fonction de pondération des probabilités

Fonction de pondération des probabilités. La fonction $w(p)$ qui transforme les probabilités objectives en poids de décision subjectifs. Elle surpondère les petites probabilités ($w(p) > p$ pour $p$ petit), sous-pondère les probabilités modérées à grandes, et satisfait $w(0)=0$, $w(1)=1$.
$$w(p) = \dfrac{p^{\delta}}{(p^{\delta} + (1-p)^{\delta})^{1/\delta}}$$ (Eq. 19.3)

Le paramètre de Tversky-Kahneman (1992) $\delta \approx 0{,}65$. Lorsque $\delta = 1$, $w(p) = p$ (utilité espérée). Lorsque $\delta < 1$, la fonction surpondère les petites probabilités et sous-pondère les grandes. Croisement à $p \approx 0{,}37$.

Figure 19.2. Fonction de pondération des probabilités de Tversky-Kahneman (1992). La courbe en S inversé surpondère les petites probabilités et sous-pondère les grandes. À $\delta = 1$, elle se réduit à la droite à 45 degrés (utilité espérée). Déplacez le curseur.

L'évaluation en théorie des perspectives

$$V(L) = \sum_{i} w(p_i) \, v(x_i - r)$$ (Eq. 19.4)

Note : Ceci est la formulation originale de la théorie des perspectives (Kahneman & Tversky, 1979), qui applique les poids de décision aux probabilités individuelles. La théorie des perspectives cumulative (Tversky & Kahneman, 1992) applique les poids de décision aux probabilités cumulées des résultats classés, résolvant certaines anomalies telles que les violations de la dominance stochastique.

L'effet de dotation

Effet de dotation. La tendance à valoriser davantage un objet une fois qu'on le possède que ce qu'on serait prêt à payer pour l'acquérir. Découle de l'aversion aux pertes : céder un objet possédé est codé comme une perte.

Le schéma quadruple des attitudes face au risque

Schéma quadruple des attitudes face au risque. La combinaison de la fonction de valeur en S et de la pondération des probabilités génère quatre attitudes distinctes face au risque : recherche du risque pour les gains à faible probabilité, aversion au risque pour les pertes à faible probabilité, aversion au risque pour les gains à forte probabilité, et recherche du risque pour les pertes à forte probabilité.

Le schéma quadruple : petite $p$ + gains = recherche du risque (loteries) ; petite $p$ + pertes = aversion au risque (assurance) ; grande $p$ + gains = aversion au risque (effet de certitude) ; grande $p$ + pertes = recherche du risque (jeu désespéré).

Effets de cadrage et comptabilité mentale

Effet de cadrage. Le phénomène par lequel la manière dont un choix est présenté (cadré) affecte les décisions, même lorsque les résultats objectifs sont identiques.
Comptabilité mentale. Le processus cognitif consistant à organiser les décisions financières en « comptes » séparés plutôt que de traiter la richesse comme fongible.
Exemple 19.2 — Évaluation par la théorie des perspectives vs utilité espérée

Problème. Un jeu offre +\$1 000 avec prob. 0,5 et −\$800 avec prob. 0,5. Point de référence r = 0. (a) Équivalent certain sous EU avec CRRA u(x) = x^{0,5}, W = \$10 000. (b) Évaluation sous PT avec paramètres standard. (c) Pourquoi l'aversion aux pertes inverse-t-elle l'évaluation ?

Solution.

(a) EU = 0,5(11 000)^{0,5} + 0,5(9 200)^{0,5} = 0,5(104,88) + 0,5(95,92) = 100,40. EC : \$100,40^2 = 10 080$. Variation de l'EC = +80,2. L'agent accepte.

(b) v(+1000) = 1000^{0,88} = 436,5. v(−800) = −2,25 × 800^{0,88} = −2,25 × 358,7 = −807,1. Avec w(0,5) ≈ 0,439 : V = 0,439(436,5) + 0,439(−807,1) = −162,6. L'agent rejette.

(c) L'aversion aux pertes (λ = 2,25) fait peser la perte de \$800 bien plus lourd que le gain de \$1 000, inversant l'évaluation.


19.3 Choix intertemporel et biais du présent

Le repère exponentiel

La théorie standard suppose une actualisation exponentielle avec facteur d'escompte $\delta \in (0,1)$. La propriété clé est la cohérence temporelle : un plan élaboré à $t=0$ reste optimal à chaque date future.

Actualisation hyperbolique et quasi-hyperbolique

Les preuves expérimentales rejettent massivement l'actualisation constante. Les individus font preuve d'une impatience décroissante : le taux d'escompte entre aujourd'hui et demain est bien supérieur à celui entre le jour 100 et le jour 101.

Actualisation hyperbolique. Un modèle de préférence temporelle dans lequel la fonction d'escompte prend la forme $D(t) = (1+kt)^{-1}$ plutôt que l'exponentielle $\delta^t$. Génère des taux d'escompte décroissants et des préférences temporellement incohérentes.
Actualisation quasi-hyperbolique (bêta-delta). Un modèle tractable du biais du présent (Laibson, 1997) où la fonction d'escompte est $\{1, \beta\delta, \beta\delta^2, \ldots\}$ avec $\beta \leq 1$. Lorsque $\beta = 1$, il se réduit à l'actualisation exponentielle.
$$U_0 = u(c_0) + \beta \sum_{t=1}^{T} \delta^t \, u(c_t)$$ (Eq. 19.5)

Les facteurs d'escompte quasi-hyperboliques sont $\{1, \beta\delta, \beta\delta^2, \ldots\}$. La période immédiate reçoit le poids 1, mais toutes les périodes futures sont en outre escomptées par $\beta$. Lorsque $\beta < 1$, il y a une chute discrète entre « maintenant » et « le futur ».

Biais du présent. La tendance à accorder un poids disproportionné aux gains immédiats par rapport aux gains futurs, au-delà de ce que l'actualisation exponentielle impliquerait. Capturé par $\beta < 1$ dans le modèle bêta-delta.

Incohérence temporelle

$$\beta\delta u'(c_1) = u'(c_0) \neq \delta u'(c_1)$$ (Eq. 19.6)

À $t=0$, la CPO pour $c_1$ est $\beta\delta u'(c_1) = u'(c_0)$. À $t=1$, la réoptimisation donne $u'(c_1) = \beta\delta u'(c_2)$. Le $\beta$ s'est déplacé — le plan est temporellement incohérent.

Agents naïfs vs sophistiqués

Agent naïf. Un agent biaisé vers le présent qui croit à tort que ses futurs moi se comporteront comme des actualisateurs exponentiels ($\beta=1$ dans le futur). Reporte perpétuellement les actions coûteuses.
Agent sophistiqué. Un agent biaisé vers le présent qui anticipe correctement son biais futur. Utilise l'induction à rebours et peut rechercher des dispositifs d'engagement.
Dispositif d'engagement. Tout mécanisme qu'un agent adopte volontairement pour restreindre son propre ensemble de choix futurs. Exemples : comptes retraite illiquides, engagements sur des échéances, retenues automatiques sur salaire.

Un agent naïf procrastine indéfiniment. Un agent sophistiqué utilise l'induction à rebours et peut recourir à des dispositifs d'engagement.

Figure 19.4. Explorateur de l'actualisation bêta-delta. L'agent naïf reporte perpétuellement ; l'agent sophistiqué utilise l'induction à rebours. À $\beta = 1$, toutes les lignes se confondent (pas de biais du présent). Déplacez les curseurs.

Exemple 19.3 — Procrastination bêta-delta

Problème. Un étudiant doit réaliser un projet. Coût aujourd'hui = 6 utils, bénéfice dans 2 périodes = 10 utils. β = 0,7, δ = 0,95, 5 périodes. (a) Quand un agent naïf agit-il ? (b) Un agent sophistiqué ?

Solution.

(a) Naïf : À chaque t, utilité nette d'agir maintenant = −6 + 0,7 × 0,95² × 10 = −6 + 6,32 = +0,32. Utilité nette perçue d'attendre = 0,7 × 0,95 × (−6) + 0,7 × 0,95³ × 10 = −3,99 + 6,00 = +2,01. Comme 2,01 > 0,32, il reporte toujours. Il procrastine jusqu'à la date limite.

(b) Sophistiqué : Induction rétrograde. À t = 2 (dernière période faisable), utilité nette = +0,32 > 0, donc le moi de t=2 agit. À t = 1 : utilité nette maintenant = +0,32, utilité nette d'attendre que t=2 agisse = +2,01 > 0,32, donc attend. À t = 0 : idem, attend. L'agent sophistiqué agit à t = 2 — plus tôt que la date limite du naïf.

Exemple 19.4 — Valeur du dispositif d'engagement

Problème. Agent avec β = 0,7, δ = 0,95, utilité logarithmique, revenu Y = 100 sur 3 périodes. (a) Épargne sans engagement. (b) Avec engagement. (c) Gain de bien-être.

Solution.

(a) Sans engagement : t=0 alloue c₀ = 100/(1+0,665+0,632) = 43,54, reste 56,46. À t=1 réoptimisation : c₁ = 56,46/1,665 = 33,91, c₂ = 22,55.

(b) Avec engagement : c₁ = 0,665 × 100/2,297 = 28,95, c₂ = 0,632 × 100/2,297 = 27,51.

(c) Sans : U = 3,774 + 2,344 + 1,967 = 8,085. Avec : U = 3,774 + 2,237 + 2,095 = 8,106. Gain = 0,020 utils. L'agent avec engagement obtient un profil de consommation plus lisse.


19.4 Préférences sociales

Au-delà de l'intérêt personnel

Des décennies de preuves expérimentales montrent que les individus s'écartent systématiquement du pur intérêt personnel : ils rejettent des offres injustes, donnent à des inconnus, coopèrent dans des jeux à un tour et punissent les passagers clandestins.

Aversion aux inégalités. Un modèle de préférences dans lequel les agents n'aiment pas les résultats inégaux — aussi bien lorsqu'ils sont désavantagés (envie) que lorsqu'ils sont avantagés (culpabilité). Fehr et Schmidt (1999) ont formalisé cela avec les paramètres $\alpha$ pour l'envie et $\beta$ pour la culpabilité.

La fonction d'utilité de Fehr-Schmidt

Utilité de Fehr-Schmidt. Une fonction d'utilité qui modifie les gains égoïstes en soustrayant la désutilité de l'inégalité : $U_i = x_i - \alpha_i \max(x_j - x_i, 0) - \beta_i \max(x_i - x_j, 0)$.
$$U_i(x) = x_i - \alpha_i \max(x_j - x_i, 0) - \beta_i \max(x_i - x_j, 0)$$ (Eq. 19.7)

Les contraintes $\alpha_i \geq \beta_i$ et $\beta_i < 1$ sont motivées empiriquement : l'envie fait plus mal que la culpabilité, et personne ne détruit de l'argent uniquement pour égaliser.

Le jeu de l'ultimatum

Dans le jeu de l'ultimatum, l'offre minimale acceptable $s^*$ vérifie $s - \alpha_R(100-2s) \geq 0$, soit $s^* = 100\alpha_R / (1+2\alpha_R)$. Pour $\alpha_R = 2$ : $s^* = 40$.

Figure 19.6. Aversion aux inégalités de Fehr-Schmidt. Un $\alpha$ (envie) plus élevé relève l'offre minimale acceptable. À $\alpha = \beta = 0$, théorie standard : toute offre positive est acceptée. Déplacez les curseurs.

Figure 19.5. Simulateur du jeu de l'ultimatum. Jouez le rôle du proposeur face à différentes stratégies du répondeur. Suivez vos gains au fil des tours.

0
Tour
\$0
Vos gains
\$0
Gains du répondeur
0
Rejets
\$0
Offre acceptée moyenne

Jeux du dictateur et biens publics

Dans les jeux du dictateur, l'allocation moyenne est de 20-30 %. Dans les jeux de biens publics, l'ajout de sanctions maintient la coopération.

Exemple 19.5 — Jeu de l'ultimatum de Fehr-Schmidt

Problème. Jeu de l'ultimatum avec \$100. Proposant : α_P = 0,5, β_P = 0,3. Répondeur : α_R = 2,0, β_R = 0,6. (a) Offre minimale acceptable. (b) Offre optimale. (c) Comparer au Nash standard.

Solution.

(a) U_R = s − 2,0(100−2s) = 5s − 200 ≥ 0 ⇒ s* = 40.

(b) U_P = (100−s) − 0,3(100−2s) = 70 − 0,4s, décroissant en s. Minimiser s sous s ≥ 40 : offre optimale s* = 40. U_P = 54, U_R = 0.

(c) Préférences standard (α = β = 0) : offre \$1, acceptée. Fehr-Schmidt : offre \$40. Bien plus proche des offres modales expérimentales de 40-50 %.


19.5 Rationalité limitée et heuristiques

La satisficing de Simon

Herbert Simon (1955) a soutenu que les agents pratiquent la satisficing plutôt que l'optimisation : ils cherchent jusqu'à trouver une option acceptable, puis s'arrêtent.

Satisficing. Une procédure de décision (Simon, 1955) dans laquelle l'agent fixe un niveau d'aspiration et choisit la première option qui l'atteint, plutôt que de comparer toutes les alternatives.
Rationalité limitée. La reconnaissance (Simon, 1955) que la prise de décision humaine est contrainte par des limitations cognitives — mémoire finie, attention limitée et coûts de calcul.

Heuristiques et biais

Tversky et Kahneman (1974) ont identifié trois heuristiques fondamentales : la représentativité (juger la probabilité par la ressemblance), la disponibilité (estimer la fréquence par la facilité de rappel), et l'ancrage (ajuster insuffisamment à partir d'une valeur initiale).

La maximisation parcimonieuse de Gabaix

Maximisation parcimonieuse. Un modèle de rationalité limitée (Gabaix, 2014) dans lequel l'agent maximise l'utilité moins le coût de l'attention. L'agent alloue l'attention de manière optimale, en accordant plus d'attention aux dimensions qui comptent.
$$\max_{\mathbf{c}} \, u(\mathbf{c}) - \theta \|\mathbf{m}\|_1 \quad \text{s.t. } \mathbf{p} \cdot \mathbf{c} \leq w$$ (Eq. 19.8)

Gabaix (2014) a formalisé la rationalité limitée comme un problème d'optimisation : les agents maximisent l'utilité sous contrainte d'un coût d'attention $\theta$ par dimension. L'agent perçoit $\hat{p}_k = \bar{p}_k + m_k(p_k - \bar{p}_k)$.


19.6 Conception expérimentale et méthodologie

Expériences en laboratoire

Les expériences en laboratoire comportent des incitations monétaires réelles, la randomisation et le contrôle. Force : validité interne. Faiblesse : validité externe.

Expériences de terrain

Les expériences de terrain intègrent des manipulations dans des contextes réels : comportement naturel, absence de conscience d'être observé, grande échelle. Compromis : moins de contrôle pour plus de réalisme.

Défis méthodologiques

Effets de demande : les sujets peuvent modifier leur comportement parce qu'ils savent être observés ou déduisent l'intention de l'expérimentateur. Le débat sur la tromperie : l'économie a une forte norme contre la tromperie, contrairement à la psychologie.

La crise de la réplication : seules 36 % des études de psychologie ont été répliquées (Open Science Collaboration, 2015) ; l'économie fait mieux (~60 %) mais reste préoccupante. Le pré-enregistrement répond au p-hacking et au biais de publication.


19.7 Théorie du nudge et paternalisme libertarien

Architecture du choix

Si les choix dépendent du cadrage et des défauts, alors l'architecture du choix — la manière dont les choix sont présentés — compte.

Architecture du choix. La conception de l'environnement dans lequel les gens prennent des décisions, incluant l'ordre des options, les paramètres par défaut, l'affichage de l'information et la disposition physique.
Nudge. Tout aspect de l'architecture du choix qui modifie le comportement de manière prévisible sans interdire d'options ni modifier significativement les incitations économiques (Thaler et Sunstein, 2008).
Paternalisme libertarien. Une philosophie préservant la liberté de choix tout en orientant les choix vers des résultats améliorant le bien-être par des nudges plutôt que par des obligations.

Effets de défaut

Effet de défaut. La tendance disproportionnée à conserver l'option présélectionnée, même lorsque le changement est facile et gratuit.

Le nudge le plus puissant est le défaut. Don d'organes : 15-20 % dans les pays à adhésion, 85-99 % dans les pays à désinscription. L'inscription à la retraite passe d'environ 50 % à plus de 90 % avec la désinscription.

$$P_{\text{enroll}} = \Phi\!\left(\frac{v - k \cdot (1-d)}{\sigma}\right)$$ (Eq. 19.9)

Sous adhésion ($d=0$) : $P = \Phi((v-k)/\sigma)$. Sous désinscription ($d=1$) : $P = \Phi(v/\sigma)$. L'écart est maximal lorsque $v$ est positif mais modéré et $k/\sigma$ est non négligeable.

Figure 19.7. Simulateur de l'effet de défaut. Des coûts de changement plus élevés élargissent l'écart entre l'inscription par adhésion et par désinscription. À $k = 0$, le défaut n'a pas d'importance. Déplacez le curseur.

Le cadre EAST

Cadre EAST. Un guide pratique pour la conception de nudges : rendre les comportements souhaités Faciles (Easy), Attractifs (Attractive), Sociaux (Social), et Opportuns (Timely).

Le cadre EAST : Facile (Easy, réduire les frictions), Attractif (Attractive, rendre saillant), Social (Social, exploiter les normes), Opportun (Timely, inciter au bon moment).

Sludge

Sludge. Friction délibérément ou involontairement ajoutée à un processus qui décourage un comportement souhaitable. L'opposé d'un nudge.

Le sludge est une friction qui décourage un comportement souhaitable. Réduire le sludge est souvent aussi efficace qu'introduire de nouveaux nudges.

Économie du bien-être comportementale

Bernheim et Rangel (2009) : évaluer le bien-être sur la base des choix libres de distorsions comportementales — lorsque les agents sont bien informés, attentifs et non biaisés.


Prise de position

'Libertarian paternalism is just paternalism with better PR' — Gilles Saint-Paul, The Tyranny of Utility

When Thaler and Sunstein published Nudge in 2008, it seemed like a policy cheat code: redesign defaults and people save more, eat better, donate organs — all without restricting choice. Governments loved it. The UK created a "Nudge Unit," and Obama hired Sunstein as regulatory czar. But the backlash was fierce. Gilles Saint-Paul called it "the tyranny of utility" — technocrats deciding what's good for you while pretending to respect your freedom. Op-eds called nudging "manipulation by the state." Is libertarian paternalism a brilliant synthesis, or a contradiction in terms?

Avancé

19.8 Finance comportementale

Efficience des marchés et ses challengers

L'hypothèse d'efficience des marchés soutient que les prix reflètent pleinement toute l'information. La finance comportementale conteste cela : de nombreux traders ne sont pas rationnels, et les arbitragistes rationnels font face à des limites.

Excès de confiance et transactions excessives

L'excès de confiance génère des transactions excessives. Barber et Odean (2000) : les traders les plus actifs ont gagné 6,5 points de pourcentage de moins par an que les moins actifs.

L'effet de disposition

Effet de disposition. La tendance à vendre les actifs gagnants trop tôt et à conserver les actifs perdants trop longtemps. Découle de la théorie des perspectives : les gains sont dans la zone concave (aversion au risque), les pertes dans la zone convexe (recherche du risque).

Le point de référence est le prix d'achat. Les gains dans la zone concave (aversion au risque, vente précoce) ; les pertes dans la zone convexe (recherche du risque, conservation).

Anomalies de momentum et de retournement

Les actions surperforment sur 3-12 mois (momentum, Jegadeesh-Titman 1993) et sous-performent sur 3-5 ans (retournement, DeBondt-Thaler 1985).

Limites de l'arbitrage

Limites de l'arbitrage. Les conditions sous lesquelles les arbitragistes rationnels ne peuvent pas complètement éliminer les erreurs de prix : risque fondamental, risque des noise traders, coûts de mise en œuvre et problèmes d'agence.
Noise trader. Un investisseur qui négocie sur la base du sentiment plutôt que de l'analyse fondamentale. Introduit des distorsions de prix imprévisibles. Dans le modèle DSSW, les noise traders peuvent survivre et même prospérer.

Même les traders rationnels peuvent ne pas corriger les erreurs de prix : risque des noise traders, coûts de mise en œuvre et problèmes d'agence les contraignent.

Le modèle de noise traders de DSSW

$$p_t = f_t + \frac{\gamma \, \rho_t \, \mu_t}{1+r}$$ (Eq. 19.10)

DeLong, Shleifer, Summers et Waldmann (1990) : un $\mu$ plus élevé éloigne le prix des fondamentaux ; un $\rho$ plus élevé amplifie la déviation ; un $\gamma$ plus élevé (aversion au risque des arbitragistes) signifie des positions moins agressives contre l'erreur de prix, augmentant ainsi la déviation.

Le paradoxe : les noise traders peuvent obtenir des rendements espérés supérieurs en supportant le risque qu'ils ont eux-mêmes créé.

Figure 19.8. Modèle de noise traders de DSSW. Le sentiment des noise traders éloigne les prix des fondamentaux. Les arbitragistes averses au risque ne peuvent pas corriger entièrement l'erreur de prix. Déplacez les curseurs.

Exemple 19.6 — Tarification par les noise traders

Problème. f = 100, ρ = 0,30, μ = 20 (haussier), r = 0,05, γ = 2. (a) Calculer le prix d'équilibre. (b) Déviation du prix. (c) Que se passe-t-il si γ = 0 ?

Solution.

(a) p = 100 + (2 × 0,30 × 20)/1,05 = 100 + 12/1,05 = 100 + 11,43 = 111,43.

(b) Déviation : p − f = 11,43. L'actif est surévalué car les traders bruit poussent les prix au-dessus des fondamentaux et les arbitragistes averses au risque ne les contrecarrent pas pleinement.

(c) Avec γ = 0 : p = 100 + 0 = 100. Les arbitragistes neutres au risque négocient assez agressivement pour éliminer entièrement l'erreur de prix. L'idée clé du DSSW : c'est l'aversion au risque des arbitragistes (γ > 0) qui permet aux déviations causées par les traders bruit de persister.


Grande Question n°4

Les gens sont-ils rationnels ?

You now have prospect theory, present bias, social preferences, bounded rationality, and the DSSW noise trader model. This is the final stop — the question gets its resolution.

Ce que dit le modèle

The behavioral case is now fully assembled. Prospect theory (Kahneman & Tversky 1979) provides a formal, testable alternative to expected utility: people evaluate outcomes relative to a reference point, are loss averse ($\lambda \approx 2.25$), and overweight small probabilities. Present bias ($\beta\delta$ discounting, Laibson 1997) explains procrastination, undersaving, and time inconsistency — people discount the immediate future far more heavily than the distant future. Social preferences (Fehr-Schmidt inequality aversion) explain cooperation and punishment in settings where pure self-interest predicts defection. Bounded rationality (Gabaix sparse maximization) formalizes the idea that attention is scarce and people optimize over a simplified model of the world. These are not isolated anecdotes — they are systematic, replicable, and survive high stakes. The violations of the rationality axioms documented at Stop 2 (Chapter 11) now have formal alternative models that fit the data better than expected utility theory does.

La contre-argumentation la plus forte

Two powerful counterarguments survive the behavioral onslaught. First, ecological rationality (Gigerenzer): heuristics aren't biases — they're efficient adaptations to real-world environments with limited time and information. "Fast and frugal" heuristics often outperform full optimization in realistic settings with noisy data. The lab results that document "biases" may be artifacts of artificial environments that strip away the ecological context in which human cognition evolved to perform well. If the environment is uncertain enough, ignoring information can be optimal, not irrational. Second, market discipline: even if individuals are biased, competitive markets may aggregate away individual errors. Firms run by irrational managers get outcompeted. Consumers who systematically overpay get educated by experience. The "as if" defense — markets behave as if agents are rational, regardless of what happens inside their heads — remains a serious position, particularly for competitive product markets where entry is easy and feedback is fast.

Comment le courant dominant a répondu

Behavioral finance provided the critical test — and the "as if" defense failed in the one market where it should have been strongest. The DSSW noise trader model (1990) showed that irrational traders can survive and move prices because arbitrage is risky and limited. Shleifer and Vishny (1997) established the "limits to arbitrage": even sophisticated arbitrageurs face short-selling costs, margin calls, and career risk — they can't fully correct mispricings caused by noise traders. The equity premium puzzle, excess volatility, and momentum anomalies all persist despite decades of sophisticated arbitrage. If biases survive in financial markets — where information travels fastest, stakes are highest, and the smartest capital competes — the "as if" defense cannot be a general principle. The mainstream absorbed behavioral economics not by rejecting rational choice but by enriching it: prospect theory is now standard in finance, $\beta\delta$ preferences are standard in macro, and mechanism design increasingly incorporates behavioral agents.

Le jugement (à ce niveau)

People are not fully rational in the way the axioms require — the evidence is overwhelming and no longer seriously contested. The more important question is whether it matters for aggregate outcomes, and the answer is domain-specific. In financial markets: yes, biases survive and move prices, because limits to arbitrage are real and persistent. In consumer markets: sometimes — defaults and framing have large, durable effects on retirement saving, organ donation, and energy use. In competitive product markets: less clear — competition, entry, and experience may discipline many biases over time. The honest resolution is that "are people rational?" was the wrong question all along. Rationality is not binary. The right question is: when does irrationality matter for aggregate outcomes, and when does the market machinery wash it out? The answer depends on the specific market, the specific bias, and the specific institutional context. Behavioral economics didn't overthrow rational choice — it drew the map of where rational choice works, where it breaks, and what to use instead.

Ce que vous ne pouvez pas encore résoudre

This is the final stop on BQ #4. The arc ran from the rationality assumption as a modeling tool (Ch 1), through its formalization and testable axioms (Ch 11), to the full behavioral challenge and its market test (here). The hardest unresolved question is about policy: if people are biased, should the government correct their choices? Nudge theory says yes, gently — libertarian paternalism. But the premise (systematic irrationality) may undermine the conclusion (people can be trusted to opt out). The "who nudges the nudgers?" problem has no clean answer — government regulators are themselves subject to the same biases they seek to correct. And the frontier keeps moving: neuroeconomics, computational models of bounded rationality, and machine learning approaches to preference estimation are reshaping what "rationality" even means in the 21st century.

Prises de position liées

Prise de position

'Libertarian paternalism is just paternalism with better PR' — Gilles Saint-Paul, The Tyranny of Utility

Nudges work. But who decides what "better" means, and where does intervention stop? The internal logic of behavioral economics points toward hard paternalism, not the gentle kind.

Avancé
Prise de position

"Every billionaire is a policy failure" — viral slogan, popularized by Dan Riffle / AOC's office

Dan Riffle popularized the slogan in 2019. The welfare theorems say competitive equilibria are efficient — but many billionaire fortunes arise from market power, not competition. Behavioral economics adds another layer: fairness norms shape what people tolerate.

Avancé
← Previous: Ch 11 — Rationality axiomatized Stop 3 of 3 — Final This question is now fully explored.
Grande Question n°4

Les gens sont-ils rationnels ?

BQ #4 reaches its verdict — biases are real, but do they survive markets? Prospect theory, present bias, and noise traders give the answer: rationality is a spectrum, and the question was wrong all along. It's not "are they rational" but "when does irrationality matter for aggregate outcomes?"

Explore this question →

Fil conducteur : L'entreprise de Maya

Maya a offert un cookie gratuit avec chaque achat de limonade comme promotion estivale. Les ventes ont augmenté modestement — de 8 %. Lorsque Maya retire le cookie gratuit (revenant au prix d'origine), la réaction des clients est disproportionnée : plaintes, avis négatifs, perte de clients fidèles. Les ventes chutent de 15 % — en dessous du niveau d'avant la promotion.

Analyse par la théorie des perspectives. Pendant la promotion, le point de référence des clients est passé de « limonade » à « limonade + cookie ». Le gain de l'ajout du cookie était $v(+\text{cookie}) = (\text{valeur\_cookie})^{0,88}$. Mais la perte de son retrait est $v(-\text{cookie}) = -2{,}25 \times (\text{valeur\_cookie})^{0,88}$. La perte perçue est 2,25 fois le gain initial. La promotion était un cliquet unidirectionnel : facile à donner, douloureux à retirer.

Maya conçoit une expérience de nudge. Pour son programme de fidélité, Maya teste deux designs d'inscription comme expérience de terrain : Traitement A (adhésion) : les clients peuvent s'inscrire au comptoir. Traitement B (désinscription) : chaque client reçoit automatiquement une carte ; il peut se désinscrire. En utilisant l'Eq. 19.9 avec $v = 3$, $\sigma = 2$, $k = 2$ : adhésion $P = \Phi(0{,}5) = 0{,}69$ ; désinscription $P = \Phi(1{,}5) = 0{,}93$. L'expérience de terrain de Maya confirme la prédiction. Elle passe à la désinscription pour le déploiement complet.

Éclairage historique

Kahneman et Tversky (1979). « Prospect Theory: An Analysis of Decision under Risk » est l'un des articles les plus cités en économie. Publié dans Econometrica, il a formalisé les résultats expérimentaux en un cadre mathématique cohérent. Kahneman a reçu le prix Nobel en 2002 ; Tversky était décédé en 1996.

Maurice Allais (1953). L'économiste français a présenté son paradoxe directement à Leonard Savage. La légende veut que Savage lui-même soit tombé dans le schéma d'Allais. Allais a reçu le prix Nobel en 1988.

Richard Thaler (Nobel 2017). La chronique « Anomalies » de Thaler a systématiquement catalogué les écarts comportementaux. Son livre de 2008 Nudge (avec Sunstein) a amené les insights comportementaux dans la politique publique, conduisant à la création d'« unités nudge » dans le monde entier.

David Laibson (1997). « Golden Eggs and Hyperbolic Discounting » a formalisé le modèle bêta-delta et expliqué pourquoi les gens détiennent simultanément une dette de carte de crédit à 18 % d'intérêt et une épargne illiquide à 5 %.

Shleifer et Vishny (1997). « The Limits of Arbitrage » a montré pourquoi les traders rationnels ne peuvent pas éliminer les erreurs de prix lorsqu'ils gèrent l'argent d'autrui et font face à des contraintes de capital.

Résumé

  1. Violations de l'utilité espérée. Le paradoxe d'Allais (effet de certitude) et le paradoxe d'Ellsberg (aversion à l'ambiguïté) démontrent que les axiomes de l'utilité espérée échouent de manière descriptive.
  2. Théorie des perspectives. L'alternative de Kahneman et Tversky comporte la dépendance à la référence, l'aversion aux pertes ($\lambda \approx 2{,}25$), la sensibilité décroissante et la pondération des probabilités. Le schéma quadruple explique l'achat simultané de billets de loterie et d'assurance.
  3. Biais du présent. Le modèle quasi-hyperbolique ($\beta < 1$) capture le poids disproportionné accordé aux gains immédiats, générant l'incohérence temporelle, la procrastination et la demande de dispositifs d'engagement.
  4. Préférences sociales. L'aversion aux inégalités de Fehr-Schmidt explique le rejet des offres injustes, les dons positifs dans les jeux du dictateur et la coopération conditionnelle.
  5. Rationalité limitée. Les heuristiques (représentativité, disponibilité, ancrage) produisent des biais systématiques. La maximisation parcimonieuse de Gabaix formalise la rationalité limitée comme une allocation optimale de l'attention.
  6. Méthodologie expérimentale. Les expériences en laboratoire offrent la validité interne ; les expériences de terrain offrent la validité externe. La crise de la réplication a entraîné le pré-enregistrement et des normes plus rigoureuses.
  7. Théorie du nudge. L'architecture du choix est inévitable ; le paternalisme libertarien utilise les défauts, le cadrage et la simplification pour améliorer le bien-être sans restreindre le choix. Le cadre EAST opérationnalise cette approche.
  8. Finance comportementale. L'excès de confiance génère des transactions excessives. L'effet de disposition découle de la théorie des perspectives. Les limites de l'arbitrage (Shleifer-Vishny) et le risque des noise traders (DSSW) expliquent pourquoi les erreurs de prix persistent.

Équations clés

LibelléÉquationDescription
Eq. 19.1$EU(L) = \sum p_i u(x_i)$Utilité espérée
Eq. 19.2$v(x) = x^\alpha$ (gains), $-\lambda(-x)^\beta$ (pertes)Fonction de valeur de la théorie des perspectives
Eq. 19.3$w(p) = p^\delta / (p^\delta + (1-p)^\delta)^{1/\delta}$Pondération des probabilités de Tversky-Kahneman
Eq. 19.4$V(L) = \sum w(p_i) v(x_i - r)$Évaluation par la théorie des perspectives
Eq. 19.5$U_0 = u(c_0) + \beta \sum \delta^t u(c_t)$Actualisation quasi-hyperbolique
Eq. 19.6$\beta\delta u'(c_1) = u'(c_0) \neq \delta u'(c_1)$Incohérence temporelle
Eq. 19.7$U_i = x_i - \alpha_i \max(x_j-x_i,0) - \beta_i \max(x_i-x_j,0)$Aversion aux inégalités de Fehr-Schmidt
Eq. 19.8$\max u(c) - \theta\|m\|_1$ s.t. $p \cdot c \leq w$Maximisation parcimonieuse de Gabaix
Eq. 19.9$P_{\text{enroll}} = \Phi((v - k(1-d))/\sigma)$Inscription sensible au défaut
Eq. 19.10$p_t = f_t + \gamma \rho_t \mu_t / (1+r)$Tarification par les noise traders (DSSW)

Pratique

  1. Une loterie rapporte $+\$500$ avec probabilité 0,6 et $-\$300$ avec probabilité 0,4. Calculer l'évaluation sous (a) l'utilité espérée avec $u(x) = \ln(W+x)$, $W = 10\,000$, et (b) la théorie des perspectives avec $\alpha = \beta = 0{,}88$, $\lambda = 2{,}25$, $\delta = 0{,}65$. L'agent accepte-t-il ou rejette-t-il sous chaque modèle ?
  2. Prouver algébriquement que le schéma de choix $\{1A, 2B\}$ dans le paradoxe d'Allais viole l'axiome d'indépendance. Écrire l'utilité espérée de chaque loterie en termes d'une fonction $u(\cdot)$ générale et montrer qu'aucune $u$ ne peut rationaliser les deux préférences.
  3. Un agent a $\beta = 0{,}8$, $\delta = 0{,}90$. Comparer la valeur actualisée de la réception de \$100 à $t = 3$ sous (a) bêta-delta et (b) actualisation exponentielle. De quel pourcentage le biais du présent réduit-il la valeur perçue ?
  4. Dans un jeu de l'ultimatum à \$200, le répondeur a $\alpha_R = 1{,}5$, $\beta_R = 0{,}4$. Calculer l'offre minimale acceptable $s^*$. Quelle fraction du total cela représente-t-il ?

Application

  1. En utilisant la théorie des perspectives, expliquer pourquoi une même personne achète des billets de loterie et une assurance (le schéma quadruple). Calculer les évaluations subjectives de : (a) un billet de loterie à \$5 avec 1 chance sur 10 000 de gagner \$50 000, et (b) une assurance à \$200/an contre 1 chance sur 10 000 de perdre \$500 000. Utiliser les paramètres standards.
  2. Un étudiant biaisé vers le présent ($\beta = 0{,}6$, $\delta = 0{,}95$) a trois devoirs à rendre les jours 1, 2, 3. Chacun coûte 4 utils et rapporte 8 utils. Par induction à rebours pour l'agent sophistiqué, déterminer le calendrier de travail. Comparer avec l'agent naïf.
  3. Calculer les taux d'inscription par adhésion vs désinscription en utilisant l'Eq. 19.9 avec $v=2$, $\sigma=3$, $k=4$. Quel est l'écart d'inscription ? S'il y a 5 000 employés, combien d'inscriptions supplémentaires le passage à la désinscription génère-t-il ?
  4. Dans le modèle DSSW avec $f = 50$, $\rho = 0{,}20$, $\mu = 10$, $r = 0{,}04$ : calculer le prix d'équilibre pour $\gamma = 1$, $\gamma = 3$, $\gamma = 10$. Qu'advient-il de la déviation lorsque l'aversion au risque augmente ?

Défi

  1. Dériver l'effet de disposition à l'aide de la théorie des perspectives. Un investisseur a acheté à $P_0 = 50$. L'action est à $P_1 = 70$ (gain) ou $P_1 = 30$ (perte). Chacune peut monter ou baisser de \$10 avec probabilité égale. Calculer l'utilité de vendre vs conserver pour chaque cas. Montrer que l'investisseur vend le gagnant et conserve le perdant.
  2. Un planificateur envisage un engagement obligatoire (épargne illiquide bloquant 20 % du revenu). Population : 60 % ont $\beta = 1$, 40 % ont $\beta = 0{,}6$. Tous ont $\delta = 0{,}95$, utilité logarithmique. (a) Variation du bien-être pour chaque type. (b) Quand le mandat réduit-il le bien-être agrégé ? (c) Pourquoi l'adhésion pourrait-elle être supérieure ?
  3. Appliquer la maximisation parcimonieuse de Gabaix à $n=3$ biens avec $p_1 = 10$, $p_2 = 10{,}50$, $p_3 = 50$, défaut $\bar{p} = 10$, $\theta = 0{,}5$, utilité Cobb-Douglas, richesse $w = 100$. (a) Quelles dimensions reçoivent de l'attention ? (b) Demande sous attention complète vs parcimonieuse. (c) Pourquoi le consommateur surdépense-t-il pour le bien 3 ?
  4. Montrer que les noise traders de DSSW peuvent obtenir des rendements espérés supérieurs aux arbitragistes. Avec une mauvaise perception moyenne $\mu > 0$ et une variance $\sigma_\mu^2$ : (a) dériver le rendement excédentaire espéré ; (b) montrer la condition pour que les noise traders surperforment ; (c) expliquer le paradoxe.