Buscar este blog

viernes, 31 de marzo de 2017

DDE: Análisis de residuales y comprobación del modelo

Residuales para un diseño de un factor completamente aleatorio

Para comprobar el diseño del modelo experimental se deben cumplir tres supuestos principales:

  • Existe una distribución normal para la variables respuesta
  • Las observaciones están independientemente distribuidas
  • Para cada nivel del factor existe la misma varianza
Estos supuestos garantizan que el modelo es correcto y por lo tanto las observaciones son aleatorias y no fueron manipuladas de ninguna manera.

Los residuales se calculan de la siguiente manera:

Gráficamente, se puede evidenciar el comportamiento de los supuestos, para ello hay que chequear que los residuales no tengan los patrones presentados a continuación:

Por otro lado, los datos deben de tener una distribución normal, es decir, un comportamiento como el presentado a continuación:


Para revisar el procedimiento completo visite el tutorial de Youtube: https://youtu.be/kMKqe-VykHE

jueves, 30 de marzo de 2017

Diseño de cuadrado latino

Diseño de Cuadrado Latino

El Diseño de Cuadrado Latino (DCL) es el segundo subtipo de diseño que utiliza bloqueo, con similares características de control de factores que el DBCA, el DCL tiene otros fundamentos adicionales que incluyen:

-Incorpora el control sobre otro factor adicional indeseado, por lo tanto controla simultáneamente dos fuentes no deseables de variación.

-Una regla primordial sobre este tipo de diseños es que los tratamientos y los factores no deseables que se quieren controlar NO DEBEN INTERACTUAR entre ellos. En síntesis, los tres factores deben afectar a la variable respuesta pero no entre ellos.
Si esta regla no es tenida en cuenta el DCL no producirá resultados validos.

-El DCL no es muy utilizado en la industria, debido a limitaciones que el diseño presenta.

-Su disposición matricial es de la siguiente forma, donde los diseños comúnmente utilizados son:


Al controlar dos fuentes de variabilidad, la tabla ANOVA aumenta añadiendo una fila adicional, a su vez que se debe verificar también una hipótesis para el segundo factor indeseado.

La ecuación estadística que modela el comportamiento de un DCL es el siguiente:



Por lo tanto, la tabla ANOVA queda de la siguiente forma:


Donde P es la cantidad de tratamientos o renglones o columnas del experimento, por ejemplo en un DCL 4x4, el valor de P sera 4 para los tratamientos, renglones y columnas.

N sera simplemente el total de datos del diseño matricial PxP, donde para el DCL 4x4 el total de datos sera 16.

No se necesario pero es muy recomendable calcular las pruebas Fisher para cada uno de los factores: columnas y renglones, y revisar si existe significancia, esto implica proponer las hipótesis necesarias con sus respectivas pruebas.

En el siguiente enlace se puede ver un ejemplo en STATGRAPHICS de como desarrollar DCL:

https://youtu.be/s9dN7i5nc10

Una extensión del diseño de cuadrado latino es el cuadrado greco-latino, también existen extensiones más complejas como el diseño cuadrado hiper greco-latino. El siguiente vídeo presenta una aplicación de un diseño de cuadrado greco-latino.


Diseño completamente aleatorio con factores de bloqueo


Diseño completamente aleatorio con factores de bloqueo





Existen varios diseños completamente aleatorios por bloqueo, los más importantes son: el diseño completamente aleatorio por bloqueo, el cual resulta ser el bloqueo más simple de todos, le siguen el diseño cuadrado latino y el diseño cuadrado greco latino.

Todos buscan controlar y minimizar el error obtenido en el experimento y el resultado de la variable respuesta a estudiar.

El DBCA (Diseño de Bloques Completamente Aleatorios) buscar lidiar como factores molestos dentro del experimento, este factor molesto transmite la variabilidad a la respuesta y por lo tanto se requiere controlar.

El bloqueo en el DBCA tiene unos principios fundamentales, principalmente los factores molestos pueden ser: materias primas, operarios, piezas de equipos o de laboratorio o factores de tiempo.

Muchos experimentos en investigación o industria incluyen factores de bloqueo.

Tipicamente la ecuación estadística que describe un experimento de tipo DBCA tiene la siguiente forma:


Donde a son el número de tratamientos y b son el numero de bloques.

La tabla ANOVA por lo tanto adiciona como fuente de variabilidad el efecto de los bloques, esto incluye por lo tanto una prueba de hipótesis adicional, la tabla ANOVA queda estructurada de la siguiente manera:


Las ecuaciones que modelan la tabla ANOVA anterior son las siguientes:


Nota 1: Si el MSB es considerablemente mayor que el MSE, esto sugiere que la creación del bloque valió la pena en el sentido de que sirvió para reducir el tamaño del error experimental. De lo contrario, si el MSB es menor que el MSE, entonces la creación de bloques ha bajado la potencia de las pruebas de hipótesis y ha incrementado la longitud de los intervalos de confianza para los contrates de los tratamientos.

Nota 2: Si el MSB es menor que el MSE, no es válido pretender que el experimento fue diseñado como un diseño completamente aleatorizado y remover los efectos de bloques del modelo.

Un ejemplo de aplicación se puede encontrar en los siguientes enlaces utilizando herramientas como STATGRAPHICS y EXCEL:

https://youtu.be/KjBM-16f69I

https://youtu.be/qBGjgfRRGnY