Options
Graf, Eric
Nom
Graf, Eric
Affiliation principale
Identifiants
Résultat de la recherche
Voici les éléments 1 - 10 sur 24
- PublicationMétadonnées seulement
- PublicationAccès libreImputation of income variables in a survey context and estimation of variance for indicators of poverty and social exclusion(2014-11-25)We present a method of imputation for income variables allowing direct analysis of the distribution of such data, particularly the estimation of complex statistics such as indicators for poverty and social exclusion as well as the estimation of their precision.
- PublicationMétadonnées seulementVariance Estimation for Regression Imputed Quantiles, A first Step towards Variance Estimation for Inequality Indicators(2014-8-20)In a sample survey only a sub-part of the selected sample has answered (total non-response, treated by re-weighting). Moreover, some respondents did not answer all questions (partial non-response, treated through imputation). One is interested in income type variables. One further supposes here that the imputation is carried out by a regression. The idea presented by Deville and Särndal in 1994 is resumed, which consists in constructing an unbiased estimator of the variance of a total based solely on the known information (on the selected sample and the subset of respondents). While these authors dealt with a conventional total of an interest variable y, a similar development is reproduced in the case where the considered total is one of the linearized variable of quantiles or of inequality indicators, and that, furthermore, it is computed from the imputed variable y. By means of simulations on real survey data, one shows that regression imputation can have an important impact on the bias and variance estimations of inequality indicators. This leads to a method capable of taking into account the variance due to imputation in addition to the one due to the sampling design in the cases of quantiles.
- PublicationMétadonnées seulementFormule pour la péréquation des ressources avec facteur de progressivitéL'une des deux composantes de la péréquation financière, la péréquation des ressources, a pour objectif de réduire les disparités de ressources fiscales entres les communes. Les communes financièrement fortes alimentent de leur contribution le fonds de péréquation, alors que les communes faibles bénéficient de transferts du fonds. Le montant total versé au fonds par les communes fortes est identique au montant total des transferts alloués aux communes faibles. Deux modes de redistribution sont possibles: redistribution proportionnelle ou progressive. Dans le premier cas, les communes riches versent au fonds un pourcentage fixe (33% dans le projet) de l'écart total des ressources fiscales. Quant aux communes faibles, elles reçoivent un transfert équivalent à un pourcentage fixe (33%) de l'écart total des ressources fiscales. La présente étude propose une formule qui permet de redistribuer les ressources fiscales d'une manière progressive tout en garantissant l'équilibre des versements et des prélèvements au fonds. La part des ressources fiscales que les communes fortes abandonnent au fonds représente une part croissante de l'écart total des ressources. Cette part est inférieure à 33% pour les communes dont l'indice ne dépasse que modérément la moyenne, supérieure à 33% pour les communes les plus riches. A l'opposé, pour les communes faibles, la réduction relative de l'écart de ressources est plus élevée pour les communes très faibles que pour celles dont l'indice de ressources est proche de la moyenne. Ainsi, le transfert de fonds destiné aux communes les plus faibles excède 33% de l'écart total des ressources, celui destiné aux communes proches de la moyenne est inférieur à 33% de ce même écart. Les versements et les prélèvements au fonds s'équilibrent.
- PublicationMétadonnées seulementFormula for revenue equalization with progressive redistribution rates(2015-3-1)
; ; Revenue equalization consists of reducing disparity in taxing power between cantons or municipalities (hereafter administrative divisions) within cantons, transferring fiscal revenue from strong taxing power administrative divisions to weak taxing power administrative divisions. A method for revenue equalization leads a constant redistribution if the transferred amounts are computed independently from the taxing power of administrative divisions. By contrast, a method for revenue equalization leads a progressive redistribution if it takes the taxing power into account in the transferred amounts computation. Hence, the amounts transferred are negligible for administrative divisions with a taxing power close to the mean taxing power and these amounts increase as the taxing power of administrative divisions moves away from the mean taxing power. A formula for revenue equalization is proposed. This formula induces a progressive redistribution and makes it possible for the user to control the strength of the progressiveness. A method based on the Gini index is proposed in order to optimally tune the redistribution rates under some constraints. - PublicationMétadonnées seulementVariance Estimation Using Linearization for Poverty and Social Exclusion Indicators(2014-6-27)
; We have used the generalized linearization technique based on the concept of influence function, as Osier has done (Osier 2009), to estimate the variance of complex statistics such as Laeken indicators. Simulations conducted using the R language show that the use of Gaussian kernel estimation to estimate an income density function results in a strongly biased variance estimate. We are proposing two other density estimation methods that significantly reduce the observed bias. One of the methods has already been outlined by Deville (2000). The results published in this article will help to significantly improve the quality of information on the precision of certain Laeken indicators that are disseminated and compared internationally. - PublicationAccès libreImputation of income variables in a survey context and estimation of variance for indicators of poverty and social exclusionCette thèse développe une méthode d'imputation pour des données de revenus permettant des analyses directes sur la distribution de ces variables et également l'estimation de statistiques complexes telles que des indices de pauvreté et d'exclusions sociale ainsi que l'estimation de leur précision.
Dans un chapitre introductif, nous présentons l'enquête sur les revenus et conditions de vie (SILC) dont les données sont utilisées à plusieurs reprises pour illustrer nos recherches.
Dans un premier article accepté pour publication, co-écrit avec Dr. Lionel Qualité, nous présentons un aperçu des méthodes actuellement utilisées à l'Office Fédéral de la Statistique (OFS). Les échantillons sont sélectionnés de manière coordonnée afin de répartir au mieux la charge d'enquête sur les ménages et les personnes. Le calcul des pondérations, dont on présente les principales étapes, est adapté aux différents besoins et aux différentes situations rencontrées. L'Office se base sur les recommandations internationales, dont il participe à l'élaboration, pour le traitement des données d'enquête et les imputations. La précision des estimateurs est systématiquement évaluée en tenant compte des traitements réalisés.
Dans un deuxième article publié, coécrit avec le Pr. Yves Tillé, nous avons mis en œuvre la technique de linéarisation généralisée reposant sur le concept de fonction d'influence, tout comme l'a fait Osier (2009), pour estimer la variance de statistiques complexes telles que les indices de Laeken. Des simulations montrent que, pour les cas où l'on a recours à une estimation par noyau gaussien de la fonction de densité des revenus considérés, on obtient un fort biais pour la valeur estimée de la variance. On propose deux autres méthodes pour estimer la densité qui diminuent fortement le biais constaté.
Dans un rapport de recherche, nous résumons l'idée proposée par Deville et Särndal (1994) consistant à construire un estimateur non biaisé de la variance d'un total basé uniquement sur l'information à disposition (c'est-à-dire l'échantillon sélectionné et le sous-ensemble des répondants) dans le cas d'une imputation par régression. Alors que ces auteurs ont traité le total conventionnel d'une variable d'intérêt, nous reproduisons un développement similaire dans le cas où le total considéré est celui de la variable linéarisée d'un quantile. Nous montrons à l'aide de simulations sur des données d'enquête réelles que l'imputation par régression peut avoir un impact important sur le biais de la variance estimée pour des indicateurs d'inégalité sociale. Cela nous mène à une méthode capable de prendre en compte la variance due à l'imputation, en plus de celle du plan dans le cas de quantiles.
Dans un article soumis, nous présentons notre nouvelle méthode d'imputation pour des variables de revenus. Des études empiriques ont montré que la loi bêta généralisée de seconde espèce (GB2) s'ajuste très bien à des données monétaires. Nous présentons une méthode d'imputation paramétrique reposant sur l'utilisation de poids issus d'un calage généralisé. Une loi GB2 est ajustée sur la distribution des revenus pour valider ces poids capables de compenser même pour de la non-réponse non-ignorable. Le succès de l'opération dépend grandement du choix, qui est discuté, des variables auxiliaires et instrumentales utilisées pour le calage. Nous validons notre système d'imputation sur les données SILC et comparons les résultats avec ceux obtenus par des imputations réalisées avec le logiciel IVEware. Nous avons investi de gros efforts pour estimer les variances par linéarisation, en prenant toutes les étapes de la procédure en compte.
La dernière partie de la thèse discute du matériel additionnel qui n'a pas pu être inclus dans les autres chapitres. Nous donnons notamment quelques détails supplémentaires sur la distribution GB2, étudions la possibilité d'utiliser des tests de Durbin-Wu-Hausman dans le cadre du calage généralisé et présentons une façon de former des classes d'imputation pour une variable de revenu., This Phd thesis proposes to develop a method of imputation for income variables allowing direct analysis of the distribution of such data, particularly the estimation of complex statistics such as indicators for poverty and social exclusion as well as the estimation of their precision.
In an introduction chapter we present the Swiss Survey on Income and Living Conditions (SILC) which we extensively used to illustrate our research.
In a first article accepted for publication, co-written with Dr. Lionel Qualité, we present an overview of the production methods at the Swiss Federal Office of Statistics (SFSO). Samples are selected with coordination so as to spread the survey burden over the population. We present the computation of extrapolation weights adapted to different cases and needs with its main steps. The SFSO relies on international recommendations for data editing and imputation, and contributes to their elaboration. The precision of estimators is consistently evaluated, according to the different treatments and methods involved in their construction.
In a second published article, co-written with Pr. Yves Tillé, we have used the generalized linearization technique based on the concept of influence function, as Osier (2009) has done, to estimate the variance of complex statistics such as Laeken indicators. Through simulations, we show that the use of Gaussian kernel estimation to estimate an income density function results in a strongly biased variance estimate. We propose two other density estimation methods that significantly reduce the observed bias.
In a working paper, we resume the idea presented by Deville and Särndal (1994) which consists in constructing an unbiased estimator of the variance of a total based solely on the information at our disposal (i.e. on the selected sample and the subset of respondents) in the case of regression imputation. While these authors dealt with a conventional total of a variable of interest, we reproduce a similar development in the case where the considered total is one of the linearized variable of quantiles. We show by means of simulations on real survey data that regression imputation can have an important impact on the bias and variance estimations of social inequality indicators. This leads us to a method capable of taking into account the variance due to imputation in addition to the one due to the sampling design in the cases of quantiles.
In a submitted article, we present our new imputation method for income variables. Empirical studies have shown that the generalized beta distribution of the second kind (GB2) fits income data very well. We present a parametric method of imputation relying on weights stemming from generalized calibration. A GB2 distribution is fitted on the income distribution in order to determine whether these weights can compensate even for nonignorable nonresponse that affects the variable of interest. The success of the operation greatly depends on the choice of auxiliary and instrumental variables used for calibration, which we discuss. We validate our imputation system on SILC data and compare it to imputations performed through the use of IVEware software. We have made great efforts to estimate variances through linearization, taking all the steps of our procedure into account.
The last part of this Phd thesis discusses additional material which we could not include in the other chapters. Namely we give some more insights into the GB2 distribution, study the possibility of using Durbin-Wu-Hausman tests in the framework of generalized calibration and present a way of forming imputation classes for an income variable. - PublicationMétadonnées seulement
- PublicationMétadonnées seulementEstimation de variance par linéarisation pour des indices de pauvreté et d’exclusion sociale(2014-6-19)
; Nous avons implémenté la technique de linéarisation généralisée reposant sur le concept de fonction d’influence tout comme l’a fait Osier pour estimer la variance de statistiques complexes telles que les indices de Laeken. Des simulations réalisées avec le langage R montrent que, pour les cas où l’on a recours à une estimation par noyau gaussien de la fonction de densité des revenus considérés, on obtient un fort biais pour la valeur estimée de la variance. On propose deux autres méthodes pour estimer la densité qui diminuent fortement le biais constaté. L’une de ces méthodes a déjà été esquissée par Deville. Les résultats publiés ici permettront une amélioration substantielle de la qualité des informations sur la précision de certains indices de Laeken diffusées et comparées internationalement. - PublicationMétadonnées seulementImputation of income data with generalized calibration procedure and GB2 law: illustration with SILC data(2013-8-31)
; In sample surveys of households and persons, questions about income are often sensitive and thus subject to a higher non-response rate. Nevertheless, the household or personal incomes are among the important variables in surveys of this type. The distribution of such collected incomes is not normal, neither log-normal. Hypotheses of classical regression models to explain the income (or their log) are not fulfilled. Imputations using such models modify the original and true distribution of the data. This is not suitable and may conduct the user to wrong interpretations of results computed from data imputed in this way. The generalized beta distribution of the second kind (GB2) is a four parameters distribution. Empirical studies have shown that it adapts very well to income data. The advantage of a parametric income distribution is that there exist explicit formulae for the inequality measures like the Laeken indicators as functions of the parameters. We present a parametric method of imputation, based on the fit of a GB2 law on the income distribution by the use of suitably adjusted weights obtained by generalized calibration. These weights can compensate for non ignorable non-response that affects the variable of interest. We validate our imputation system on data from the Swiss Survey on Income and Living Conditions (SILC).
- «
- 1 (current)
- 2
- 3
- »