Biblioteca Digital da UEM: Sistema Nou-Rau
Pgina Principal  Portugus   English  Español   Aumentar Texto  Texto Normal  Diminuir Texto
  Principal | Apresentao | Objetivos | Instrues Autores | Estatsticas | Outras Bibliotecas Digitais
  Sistema Integrado de Bibliotecas - SIB / UEM
Entrar | acessos | verso 1.1  
ndice
Pgina principal
Documentos
Novidades
Usurios

Aes
Consultar
Procurar
Exibir estatsticas

Procurar por:
Procura avanada

Dvidas e sugestes


Consultar: Programa de Ps-Graduao em Bioestatstica

Incio > Dissertaes e Teses > Multidisciplinar > Interdisciplinar (rea bsica: Sade e Biolgicas) > Programa de Ps-Graduao em Bioestatstica

Ttulo [PT]: Imputao mltipla via algortmo MICE e mtodo IMLD
Autor(es): Marina Gandolfi
Palavras-chave [PT]:

Base de dados incompleta, Dados faltantes, Matriz, Decomposio por valor singular, Softwares estatsticos, Imputao mltipla livre de distribuio(IMLD), Bioestatstica, Interdiscliplinariedade, Softwares estatsticos, Mtodos de imputao, Multivariate imputation by chained equatois (MICE), Distribuio de dados - Brasil
Palavras-chave [EN]:
Decomposition by singular value, Distribution free multiple imputation, Interdisciplinarity,
Imputation methods, Missing data - Brazil
Titulao: Mestre em Bioestatstica
Banca:
Eraldo Schunk Silva [Orientador] - UEM
Mariana Ragassi Urbano - UEL
Isolde Previdelli - UEM
Resumo:
Resumo: Um problema comum em anlises estatsticas a ocorrncia de bases de dados incompletas. Geralmente, nessas situaes, restringe-se a anlise aos sujeitos com dados completos nas variveis. Esse procedimento reduz o tamanho da amostra e pode resultar em estimativas tendenciosas. O preenchimento dos dados faltantes pode ser feito por meio da imputao mltipla (IM), em que cada valor ausente e substitudo por um conjunto de valores plausveis, incorporando a incerteza sobre o valor a ser imputado. Atualmente a imputao mltipla est disponvel nos principais softwares estatsticos, porm a maioria dos mtodos implementados so paramtricos, e nestes casos h fortes suposies sobre a distribuio dos dados, o que na prtica difcil de se verificar. Com vistas a promover a interdisciplinaridade em Bioestatstica, tratamos aqui de dois procedimentos para realizar imputao mltipla os quais oferecem maior flexibilidade quanto distribuio dos dados: o algoritmo MICE - Multivariate Imputation by Chained Equatoins - e o mtodo IMLD Imputao Mltipla Livre de Distribuio. O algoritmo MICE, aplicado a dados de um estudo transversal de recm-nascidos vivos residentes no estado de Paran no ano de 2012. Uma amostra aleatria, com registros completos, de 3380 casos foi obtida, um modelo de regresso logstica foi ajustado para o desfecho baixo peso ao nascer. Por simulao, foram gerados trs conjuntos de dados incompletos, com dados faltantes para o desfecho peso ao nascer, categorizado em baixo peso e peso normal. Os modelos foram ajustados nas trs situaes distintas para comparao com o modelo padro. Percebe-se, por meio das estimativas, um melhor ajuste dos modelos com imputao, quando comparado ao caso em que analisamos os dados com registros faltantes. As estimativas dos erros padro do modelo imputado se aproximam muito bem dos resultados obtidos com o modelo ajustado ao conjunto de dados completo (modelo padro ouro). Uma aplicao usando o mtodo IMLD feita com uma matriz Y de dados referente a altura mdia de plantas (m) de 20 cultivares precoces e geneticamente modificadas de milho, avaliadas em 7 localidades no estado do Paran (SHIOGA et al., 2015). Remoes aleatrias ( 5%, 15%, 30%) foram feitas na matriz original e posteriormente empregado o mtodo IMLD para preenchimento destes valores faltantes. A implementao do mtodo foi feita no software R, a qual disponibilizada em anexo. Por meio de medidas de variabilidade e acurcia, o mtodo mostrou-se eficaz. Com isso, temos indcios de que a imputao mltipla deve ser uma opo a ser utilizada quando se tem dados faltantes

Abstract: A common problem in statistical analyzes is the occurrence of incomplete databases. Generally, in these situations, it restricts the analysis to subjects with complete data on the variables. This reduces the size of the sample, and can result in unbiased estimates. The "filling" of the missing data can be done by multiple imputation (IM), wherein each missing value is replaced by a set of plausible values, incorporating the uncertainty about the amount to be imputed. Currently, multiple imputation is available in the main statistical software, but most of the implemented methods are parametric, and in these cases there are strong assumptions about the distribution of data, which in practice is dificult to verify. In order to promote interdisciplinarity in Biostatistics, we treat here two procedures to perform multiple imputation which offer greater flexibility in the distribution of the data: the MICE algorithm Multivariate imputation by Chained Equations - and IMLD method - Multiple Imputation Distribution Free. The MICE algorithm is applied to data from a cross-sectional study of newborns live residents in the Parana state, in the year 2012. A random sample with complete records of 3380 cases was obtained, a logistic regression model was fitted to the outcome of low birth weight. By simulation, it was generated three sets of incomplete data, with missing data for weight outcome. The models were adjusted in three diferent situations for comparison with the standard model. It can be seen through the estimates, a better adjustment of the models with imputation when compared to the case where we analyze the data with missing records. The estimates of imputed model standard errors of approaches very well the results obtained with the gold standard model. An application to the IMLD method is made with a array of data regarding the average plant height (m) of 20 early and genetically modified corn cultivars, evaluated in seven locations in the Parana state (SHIOGA et al., 2015). Random removals ( 5%, 15%, 30%) were made in the original array and then used the method IMLD to fill these missing values. The implementation of the method was taken in the R software, which is provided in annex. Through variability and accuracy measurements, the method proved to be effective. With this, we have evidence that multiple imputation should be an option to be used when there is missing data
Data da defesa: 18/03/2016
Cdigo: vtls000222709
Informaes adicionais:
Idioma: Portugus
Data de Publicao: 2016
Local de Publicao: Maring, PR
Orientador: Prof. Dr. Eraldo Schunk Silva
Coorientador: Prof. Dr. Carlos Tadeu dos Santos Dias
Instituio: Universidade Estadual de Maring . Centro de Cincias Exatas . Programa de Ps-Graduao em Bioestatstica
Nvel: Dissertao (mestrado em Bioestatstica)
UEM: Departamento de Estatstica

Responsavel: luiz
Categoria: Aplicao
Formato: Documento PDF
Arquivo: IMPUTAO MLTIPLA VIA ALGORITMO MICE E MTODO IMLD - Marina Gandolfi.pdf
Tamanho: 2946 Kb (3016803 bytes)
Criado: 17-08-2016 09:48
Atualizado: 24-08-2016 11:17
Visitas: 326
Downloads: 3

[Visualizar]  [Download]

Todo material disponvel neste sistema de propriedade e responsabilidade de seus autores.