Limiti di soluzioni comuni ai dati mancanti

Un articolo precedente ha discusso alcune delle cause di dati mancanti e alcune delle conseguenze di analizzare casi solo completi. Questa newsletter discuterà altri modi comuni di trattare con dati mancanti, con una discussione dei loro vantaggi e svantaggi.

Disponibile analisi del caso (soppressione pairwise) calcola ogni passo l'analisi utilizzando separatamente i casi che hanno dati disponibili per questo passo. Pertanto, un caso con dati mancanti su una variabile sarà usato solo in fasi che non implicano quella variabile. Il vantaggio è che la dimensione del campione per ogni singola analisi è generalmente superiore con un'analisi completa caso, ma i risultati sono imparziale solo se i dati sono MCAR. Si può anche portare a problemi matematici nel calcolo delle stime di alcuni parametri, e non è raccomandato.

La maggior parte altri metodi coinvolgono l'imputazione-sostituendo i valori mancanti con una stima, quindi analizzando i set di dati completo, come se i valori assegnati erano valori osservati effettivi. Ci sono molti modi per scegliere una stima. Di seguito sono riportati i metodi comuni:

* Media: la media dei valori osservati per tale
variabile * Sostituzione: il valore da un nuovo individuo che non è stato selezionato per essere il campione
* Hot ponte: un valore scelto a caso da un individuo che ha valori simili su altre variabili
* ponte freddo: un valore sistematicamente scelto da un individuo che ha valori simili su altre variabili
* regressione: il valore previsto ottenuto regredendo il manca variabile sulle altre variabili
* regressione stocastica: il valore previsto da una regressione più un valore residuo casuale
* interpolazione e estrapolazione:.. un valore stimato da altre osservazioni dello stesso individuo

Imputazione è popolare perché è concettualmente semplice e perché il campione risultante ha lo stesso numero di osservazioni come set di dati completo. Può essere molto allettante quando l'analisi completa e minuscole elimina gran parte del set di dati. Ma ha limitazioni. Alcuni metodi di imputazione provocano le stime dei parametri di parte, come i mezzi e le correlazioni, a meno che i dati siano MCAR. La polarizzazione è spesso peggiore di quella con l'analisi completa dei casi, in particolare per l'imputazione media. L'entità della distorsione dipende da molti fattori, tra cui il meccanismo di dati mancanti, la proporzione dei dati che manca, e le informazioni disponibili nel set di dati.

Inoltre, tutti questi metodi di imputazione sottovalutare errori standard . Dal momento che le osservazioni imputati sono essi stessi le stime, i loro valori sono corrispondenti errore casuale. Nonostante questo, i valori figurativi vengono trattati come le osservazioni reali in analisi. La fonte supplementare di errore viene ignorato, con conseguente troppo piccoli errori standard e troppo piccoli valori di p. Inoltre, anche se l'imputazione è concettualmente semplice, di solito è difficile fare bene in pratica. Pertanto, questi metodi di imputazione non sono soddisfacenti nella maggior parte dei casi

Due metodi alternativi mantengono la piena del campione e può portare a stime imparziali di parametri e degli errori standard per ignorabile dati mancanti:. Imputazione multipla e la stima di massima verosimiglianza. Queste tecniche sono ora disponibili nel software statistico comune. Bollettini successivi descriveranno questi metodi e discutere la loro disponibilità in pacchetti software Hotel  .;

consulenza aziendale

  1. Quanto vitale è Sviluppo Web a un business
  2. Il Flagello plusvalenze
  3. Nube PBX - La soluzione ideale per i dipendenti virtuali
  4. 6 modi per tagliare i costi nella vostra azienda
  5. Alcuni modi per migliorare le vendite attraverso i vostri siti
  6. L'anatomia di Networking Eventi
  7. Spiegando Colorado Vs. Jumbo Conforme Mutui
  8. Attenzione i clienti che vogliono pensare fuori dagli schemi "
  9. Louis Vuitton bagagli tutta la potenza fisico stabilità fisica
  10. Il valore di un programma web-based on-boarding
  11. Perché il Cloud Computing è importante
  12. Oftalmologia migliorare le tecniche naturali, efficaci e clinicamente testati sono disponibili onlin…
  13. Ingegneri Forensic - utile per la rivelazione della verità
  14. Conservare e Grow Conti correnti attraverso sistemi Suggerimenti dei Clienti per l'Enterprise
  15. Suggerimenti su come ottenere il giusto Inizia largo all'interno del business operativo
  16. 5 Must-have per i client di un Rockin 'Attrarre Freebie
  17. 7 errori comuni di affittuari e come evitarli in futuro
  18. Auto COPERTURE libero Consiglio utile per la copertura Auto
  19. Analizzare le vostre esigenze prima di assumere società di sviluppo software
  20. Evitare di "Bill scosse" con Gestione Android dati