Valutare la misura della Regression Models
A ben aderente risultati dei modelli di regressione a valori attesi vicine ai valori dei dati osservati. Il modello medio, che utilizza la media per ogni valore previsto, generalmente sarebbe usato se non ci fossero variabili predittive informativi. L'adattamento di un modello di regressione proposta deve pertanto essere migliore di l'adattamento del modello di media
Tre statistiche sono utilizzati in minimi quadrati ordinari (OLS) di regressione per valutare il modello in forma:. R-squared F- generale prova e l'errore quadratico medio (RMSE). Tutti e tre si basano su due somme di quadrati: somma dei quadrati totale (SST) e somma dei quadrati degli errori (SSE). SST misura fino a che punto i dati sono dalla media e misure SSE fino a che punto i dati sono da valori attesi del modello. Combinazioni diverse di questi due valori forniscono informazioni diverse su come il modello di regressione paragona al modello media.
R-squared Adjusted R al quadrato e
La differenza tra SST e SSE è il miglioramento in previsione dal modello di regressione, rispetto al modello medio. Dividendo tale differenza da SST dà R-squared. È il miglioramento proporzionale previsione dal modello di regressione, rispetto al modello medio. Esso indica la bontà di adattamento del modello
R-quadro ha la proprietà utile che la sua scala è intuitivo:. Si va da zero a uno, con lo zero che indica che il modello proposto non migliora la previsione sopra la media modello e una che indica perfetta previsione. Miglioramento nel modello di regressione provoca un aumento proporzionale in R al quadrato.
Una trappola di R al quadrato è che può solo aumentare come predittori vengono aggiunti al modello di regressione. Questo aumento è artificiale quando predittori non vengono effettivamente migliorando in forma del modello. Per ovviare a questo, una statistica correlata, Adjusted R al quadrato, incorpora gradi del modello di libertà. Adjusted R-squared diminuirà man mano che vengono aggiunti predittori se l'aumento del modello di misura non compensa la perdita di gradi di libertà. Analogamente, aumenterà man mano che vengono aggiunti predittori se l'aumento modello adatto è utile. Adjusted R-squared deve essere sempre utilizzato con i modelli con più di una variabile predittiva. Viene interpretato come la percentuale di varianza totale che si spiega con il modello.
Ci sono situazioni in cui non è necessario o rilevante un alto R-squared. Quando l'interesse è la relazione tra le variabili, non nella previsione, il R-quadrato è meno importante. Un esempio è uno studio su come la religiosità influenza i risultati di salute. Un buon risultato è un rapporto di fiducia tra la religiosità e la salute. Nessuno si aspetterebbe che la religione spiega un'alta percentuale di variazione in salute, la salute è influenzata da molti altri fattori. Anche se il modello rende conto di altre variabili noti per influenzare la salute, come il reddito e l'età, un R-squared nella gamma di ,10-0,15 è ragionevole.
The Sims F-test
F-test valuta l'ipotesi nulla che tutti i coefficienti di regressione sono uguali a zero contro l'alternativa che almeno uno non lo fa. Una ipotesi nulla equivalente è che R-squared è uguale a zero. Una significativa F-test indica che l'osservata R al quadrato è affidabile, e non è un risultato spurio di stranezze nel set di dati. Così, il F-test determina se il rapporto proposto tra la variabile di risposta e l'insieme di predittori è statisticamente affidabile, e può essere utile quando l'obiettivo della ricerca è o previsione o spiegazione.
RMSE
Il RMSE è la radice quadrata della varianza dei residui. Indica la misura assoluta del modello per i dati - la vicinanza dei punti dati osservati sono per i valori attesi del modello. Mentre R-squared è una misura relativa di adattamento, RMSE è una misura assoluta di adattamento. Come la radice quadrata di una varianza, RMSE può essere interpretata come la deviazione standard della varianza non spiegata, e ha la proprietà di essere utile nelle stesse unità della variabile di risposta. Valori più bassi di RMSE indicano migliore vestibilità. RMSE è una buona misura di quanto accuratamente il modello prevede la risposta, ed è il criterio più importante per la misura, se lo scopo principale del modello è previsione
.
La migliore misura di modello di misura dipende obiettivi del ricercatore, e più di uno sono spesso utili. Le statistiche di cui sopra si applicano ai modelli di regressione che utilizzano la stima OLS. Molti tipi di modelli di regressione, tuttavia, come i modelli misti, modelli lineari generalizzati e modelli della cronologia degli eventi, utilizzare stima di massima verosimiglianza. Queste statistiche non sono disponibili per tali modelli. Un futuro newsletter descriverà come valutare modelli stimati con la massima verosimiglianza
Copyright © 2008 Karen Grace-Martin
.
consulenza aziendale
- Kotak Securities Riconoscimenti
- 6% di andalusi dice vendono i loro regali di Natale indesiderati questo, secondo uno studio
- Aumenta la tua efficienza business con servizi di consulenza IT credibile
- Un nuovo modo di ottenere un prodotto innovativo di Mercato
- Scopri trucchi e suggerimenti che possono aiutare a massimizzare la vostra vincite Slot
- Ough.Ring. Protetta Pianificazione strategica /Una telefonata a causa di modernizzazione
- Voice over sistemi telefonici IP
- Creazione di spazio per i programmi aziendali di formazione in Virginia
- Office Space Vacanze: aprendo la strada per affari espansione
- La Top 20: i migliori lavori Negli Stati Uniti
- Magento i migliori CMS per ecommerce sviluppo di siti web
- Consolidamento del debito per gli affittuari o proprietari di abitazione con Povero di credito o No …
- Che cosa possono le leggi fare senza morale
- MLM Marketing Millionaire online Segreti
- Coupe of the Year 2010
- Qual è il miglior tipo di Spaccalegna per il tuo lavoro?
- Fare un buon piano di convalida maestro
- Pianificazione Fiscale e proiezioni
- Mai Ottiene Tappeti puliti più Senza questi consigli
- Costoso Equipment for Less sul mercato secondario