Options
Graf, Monique
Résultat de la recherche
The simplicial generalized beta distribution. R-package and applications
2019-6-8, Graf, Monique
A generalization of the Dirichlet and the scaled Dirichlet distributions is given by the simplicial generalized Beta, SGB (Graf, 2017). In the Dirichlet and the scaled Dirichlet distributions, the shape parameters are modeled with auxiliary variables (Maier, 2015, R-package DirichletReg) and Monti et al. (2011), respectively. On the other hand, in the ordinary logistic normal regression, it is the scale composition that is made dependent on auxiliary variables. The modeling of scales seems easier to interpret than the modeling of shapes. Thus in the SGB regression: - The scale compositions are modeled in the same way as for the logistic normal regression, i.e. each auxiliary variable generates D parameters, where D is the number of parts. - The D Dirichlet shape parameters, one for each part in the compositions, are estimated as well. - An additional overall shape parameter is introduced in the SGB that proves to have important properties in relation with non essential zeros. - Use of survey weights is an option. - Imputation of missing parts is possible. An application to the United Kingdom Time Use Survey (Gershuny and Sullivan, 2017) shows the power of the method. The R-package SGB (Graf, 2019) makes the method accessible to users. See the package vignette for more information and examples.
Calage serré des poids d’enquête
2014-11-19, Graf, Monique
Le calage des poids de sondage se réfère à la recherche de corrections multiplicatives des poids, de telle sorte que les totaux extrapolés des variables de calage coïncident avec les totaux de population correspondants, supposés connus. Il est souvent souhaitable d'imposer des limites sur la variabilité des corrections de poids, mais il peut arriver que le calage devienne alors impossible. En effet, en général spécialement si l'on prévoit de faire des estimations, non seulement pour la population entière ou les catégories utilisées pour le calage, mais aussi pour des domaines coupant ces catégories. Les propriétés d'optimalité des poids calés ne fournissant aucune garantie dans ce cas, il est intéressant de limiter au maximum la variabilité des corrections de poids. Dans la pratique, le problème du calage est résolu en minimisant d'une fonction de perte convexe dépendant de limites définies a priori sur la correction des poids. On décrit ici une méthode pour trouver les limites les plus serrées possible pour le calage des poids de sondage, telles que le problème soit toujours réalisable. Malgré la taille du problème, la mise en œuvre dans R à l'aide de matrices creuses s'est avérée facile à gérer pour les enquêtes en taille réelle, d'au moins plusieurs milliers d'unités. On donne un exemple réel et un exemple de simulation qui prouvent la faisabilité de la méthode.