Login
Mediation analysis for binary random variables : parametric decomposition of the total effect
Résumé Cette thèse est centrée sur l'évaluation des effets directs et indirects dans l'analyse de médiation. Habituellement, un chercheur souhaite évaluer dans quelle mesure une variable explicative affecte une variable réponse. Cependant, l'identification du seul effet total ne répond pas aux questions concernant comment et pourquoi un tel effet se produit. L'analyse de médiation simple décompose l'effet total de la variable explicative sur la variable réponse en des effets indirects et directs. Le premier concerne l’effet de la variable explicative sur la variable réponse à travers une troisième variable intermédiaire, le médiateur. Le médiateur est influencé par la variable explicative et à son tour influence la variable réponse. Au contraire, l'effet direct est l’effet qui reste après avoir maintenu le médiateur constant à une certaine valeur. Plus précisément, nous dérivons de nouvelles décompositions paramétriques exactes de l'effet total en effets directs et indirects pour des variables aléatoires binaires, à la fois dans le cadre contrefactuel et dans la ‘’path analysis’’. En présence d’un seul médiateur, nous dérivons des expressions paramétriques des quantités d’intérêt dans les cadres contrefactuel et de la ‘’path analysis’’. Nous appliquons ces résultats méthodologiques à un ensemble de données provenant d’un programme de microcrédit alloué au hasard en Bosnie-Herzégovine pour évaluer l’effet sur la bancabilité des individus. Nous réanalysons les données, afin de construire un schéma de médiation qui permet une meilleure compréhension de l'effet principal de l'étude, en utilisant la variable indiquant la création/propriété d’une entreprise comme un possible médiateur. Une étude de simulation est également effectuée, en comparant les estimateurs proposés à un nombre d'estimateurs concurrents. Nous avons trouvé des définitions alternatives pour la décomposition de l’effet total lorsque plusieurs médiateurs sont impliqués. Ces définitions sont plus appropriées pour les variables modélisées comme un système récursif de régressions logistiques univariées. Ainsi, en utilisant des modèles graphiques, nous avons défini l’effet total comme la somme des effets directs, indirects et d'un terme résiduel qui est nul sous certaines hypothèses. En général, ces expressions mettent en évidence le lien entre les effets et les coefficients de régression logistique des modèles définis dans le système.

Abstract :

This thesis is centered on the evaluation of direct and indirect effects via mediation analysis. A researcher is usually interested in assessing to what extent an exposure variable affects an outcome. However, identifying the overall effect does not answer questions concerning how and why such an effect arises. Single mediation analysis decomposes the overall effect of the exposure on the outcome into an indirect and a direct effect. The former refers to the to the effect of the exposure on the outcome due to a third variable, the mediator, which is supposed to fall in the pathway. The latter effect is the effect of the exposure on the outcome after keeping the mediator to whatever value might be of interest. Specifically, we derived novel exact parametric decompositions of the total effect into direct and indirect effect for binary random variables, both in the counterfactual and path-analysis frameworks. In the single mediation context, we derive parametric expressions of the counterfactual entities and their relationships with the associational definitions coming from the path analysis context. We apply these methodological results on a dataset coming from a randomly allocated microcredit program in Bosnia-Herzegovina to evaluate the effect on client’s bankability. We re-analyse the data, in order to build a mediation scheme that allows a better understanding of the main effect of the study, by assuming business ownership as a possible mediator. We also implement a simulation study to compare the proposed estimator to several competing ones. When multiple mediators are involved, we found alternative definitions for the decomposition of the total effect. These new definitions are more appropriate for variables modelled as a recursive system of univariate logistic regressions. Thus, by making use of graphical models, the overall effect was defined as the sum of the direct, indirect effects and a residual term that is null under certain hypotheses. In general, these expressions are written such that one can maintain the link between effects and their corresponding coefficients in logistic regression models assumed in the system.
   
Mots-clés Analyse de médiation, Effet direct, Effet indirect, Contrefactuel, Décomposition paramétrique, Régression logistique, Médiateurs multiples binaires, Modèles graphiques

Keywords :

Mediation analysis, Direct effect, Indirect effect, Counterfactual framework, Path analysis, Parametric decomposition, Logistic regression, Multiple binary mediators, Graphical models
   
Citation Raggi, M. (2020). Mediation analysis for binary random variables : parametric decomposition of the total effect, PhD thesis in applied statistics, Université de Neuchâtel, Neuchâtel.
   
Type Thèse (Anglais)
Année 2020
Departement academique Institut du management de l'information
Université Université de Neuchâtel (Neuchâtel)
Degré PhD thesis in applied statistics