Las premisas de un modelo de regresión lineal son aspectos que este debe cumplir, principalmente están asociados a los errores que se encuentran en el modelo, son 5 aspectos principales:
-La relación entre la variable dependiente e independiente es lineal: son muchos los métodos tanto matemáticos como estadísticos para demostrar que la relación entre variables sigue una tendencia lineal, estos métodos se dejan a elección del investigador, usualmente se utiliza el coeficiente de determinación o el de correlación al probar esta premisa.
-Los errores se distribuyen normalmente: esto se puede probar construyendo los residuales estandarizados, estos siguen la siguiente ecuación característica:
Estos residuales estandarizados se grafican en un diagrama residuales estandarizados vs valores teóricos, y se espera que el comportamiento siga una linea recta, cualquier desviación de esta línea atentaría a esta segunda premisa como se muestra a continuación.
-Los errores tienen media cero: La media del calculo de los errores debe ser igual a cero para cumplir con esta premisa.
-Los errores tienen varianza constante o son homocedasticos: se espera que los errores tengan una variación constante, sin patrones o tendencias, esta premisa se puede comprobar mediante un diagrama de dispersión de residuales vs valores ajustados de y.
Este gráfico mostrara tendencias para decidir si los errores son homocedasticos o por el contrario son heterocedasticos.
-Los errores no están correlacionados: esta premisa se comprueba mediante un gráfico de residuales vs tiempo, por lo tanto, se debe tener la historia de los errores y el orden en que las observaciones fueron tomadas. El comportamiento esperado para verificar que los errores no estén correlacionados es el siguiente:
The premises of a linear regression model are aspects that must be met, mainly associated with the errors found in the model, are 5 main aspects:
1. The relationship between the dependent and independent variable is linear: there are many mathematical and statistical methods to demonstrate that the relationship between variables follows a linear trend, these methods are left to the researcher's choice, usually the coefficient of determination or of correlation when proving this premise.
2. The errors are normally distributed: this can be proven by constructing the standardized residuals, these follow the following characteristic equation:
These standardized residuals are plotted in a diagram of standardized residuals vs. theoretical values, and it is expected that the behavior follows a straight line, any deviation from this line would attend to this second premise as shown below.
3. The errors have zero mean: The average calculation of errors must be equal to zero to comply with this premise.
4. The errors have constant variance or are homocedastic: errors are expected to have a constant variation, without patterns or trends, this premise can be verified by a scatter plot of residuals vs adjusted values of y.
This graph will show tendencies to decide if the errors are homocedastic or on the contrary they are heterocedastic.
5. The errors are not correlated: this premise is checked by a graph of residuals vs. time, therefore, the history of the errors and the order in which the observations were taken should be taken. The expected behavior to verify that the errors are not correlated is as follows:
Las gráficas fueron muy útiles para visualizar el supuesto, buen trabajo, me sirvió.
ResponderEliminar