Buscar este blog

martes, 28 de enero de 2020

2. Medidas Estadísticas de resumen

El objetivo fundamental de las medidas estadísticas de resumen es calcular valores que recojan la información de todos los datos y que, proporcionen un acercamiento al comportamiento de las variables.

 Se clasifican en:

1.MEDIDAS DE TENDENCIA CENTRAL: Dan información acerca del comportamiento de los valores medios o centrales de la serie de datos. La medida de tendencia central principal es la media aritmética o promedio.

Media aritmética o promedio: Es la suma de todos los valores que asume la variable dividida por el total de estos.

Ventajas:
  •  Facilidad de comprensión y cálculo.
  •  Necesitan todos los valores de la variable, lo que la hace más confiable.
Desventajas:
Su validez puede ser afectada por valores extremos perdiendo representatividad, en este caso no debe utilizarse. 

2. MEDIDAS DE POSICIÓN: Determinan la posición que ocupa un determinado valor de la variable con respecto a las puntuaciones menores o iguales que ésta. Las cuales son: Moda, Mediana, Cuartiles, Deciles y Percentiles.

Moda: Es el dato que tiene la frecuencia mayor. Es la medida más descriptiva de los datos.

Ventajas:
  • Se puede calcular a todo tipo de variables.
  • No es influencia por valores extremos.
  • Puede ser bimodal, trimodal o polimodal, según el caso.
Desventajas:
  • Es inestable de muestra a muestra.
  • Puede no existir, si los valores de la variable tienen igual frecuencia.
Mediana: Es el valor medio o valor que divide los datos ordenados en dos partes iguales.  

Características:
  • Es fácil de calcular.
  • No la deforman los valores extremos.
  • Es útil cuando los valores se alejan demasiado del promedio.
  • Puede ser un valor que no coincida con ningún dato.
3. MEDIDAS DE DISPERSIÓN: Dan un valor de la diferencia o variabilidad de los datos tomando como referencia un valor particular, que es generalmente la media aritmética. Las cuales son: Rango, Varianza, Desviación estándar y Coeficiente de Variación.

Rango: Representa la diferencia entre el valor máximo y el valor mínimo de los datos. Se le denomina también Recorrido. 

Ventajas:
 Es una medida de dispersión absoluta.

Desventajas:
  • Sólo toma en cuenta los valores extremos de los datos.
  • Es sensible al tamaño de la muestra.
Varianza: Es aquel valor absoluto positivo, que acumula la variación promedio de los valores de la variable con respecto a la media en forma cuadrática. 

Ventajas:
  • Es de gran utilidad en los procedimientos de inferencia estadística.
  • Es una de las medidas estadísticas más importantes y de ella  se calcula la desviación estándar o desviación típica.
Desventajas:
No tiene una interpretación clara.

Desviación estándar: Describe la variabilidad de los datos alrededor de la media aritmética, elegida como medida de tendencia central.  Se calcula como la raíz cuadrada positiva de la varianza.

Ventajas:
  • Es la medida más conocida y comúnmente usada de la dispersión de una serie de datos.
  • Es recomendable usarla cuando la media aritmética es buena medida de tendencia central.
Desventajas:
 Es sensible a la variación de los datos.

Coeficiente de variación: Es una medida relativa de la variación de un conjunto de datos.

Características:
  • Es adecuado cuando se desea comparar la variabilidad en dos o más grupos.
  • Si el CV es inferior al 20%, se asume que los datos tienen una distribución homogénea.
4. MEDIDAS DE FORMA: Hacen referencia a la forma geométrica de la distribución de los datos. Estas son: Coeficiente de curtosis y coeficiente de asimetría.

_________________________________________________________________

The fundamental objective of the statistical summary measures is to calculate values ​​that collect the information of all the data and that provide an approach to the behavior of the variables.
 They are classified in:

1. MEASURES OF CENTRAL TREND: Give information about the behavior of the middle or core values ​​of the data series. The main central tendency measure is the arithmetic mean or average.


Arithmetic mean or average: It is the sum of all the values ​​assumed by the variable divided by the total of these.

Advantage:
 Ease of understanding and calculation.
 They need all the values ​​of the variable, which makes it more reliable.
Disadvantages:
Its validity can be affected by extreme values ​​losing representativeness, in this case it should not be used.

2. POSITION MEASURES: Determine the position that a certain value of the variable occupies with respect to scores less than or equal to it. Which are: Fashion, Medium, Quartiles, Deciles and Percentiles.

Mode: It is the data that has the highest frequency. It is the most descriptive measure of the data.

Advantage:
You can calculate all kinds of variables.
It is not influenced by extreme values.
It can be bimodal, trimodal or polymodal, depending on the case.

Disadvantages:
It is unstable from sample to sample.
It may not exist, if the values ​​of the variable have the same frequency.

Mediam: It is the average value or value that divides the ordered data into two equal parts.

Characteristics:
It is easy to calculate.
It is not deformed by extreme values.
It is useful when values ​​are too far from average.
It can be a value that does not match any data.

3. DISPERSION MEASURES: They give a value of the difference or variability of the data taking as reference a particular value, which is generally the arithmetic mean. Which are: Range, Variance, Standard deviation and Variation Coefficient.

Range: Represents the difference between the maximum value and the minimum value of the data. It is also called Tour.

Advantage:
 It is a measure of absolute dispersion.

Disadvantages:
Only take into account the extreme values ​​of the data.
It is sensitive to the sample size.

Variance: It is that positive absolute value, which accumulates the average variation of the values ​​of the variable with respect to the average in quadratic form.

Advantage:
It is very useful in statistical inference procedures.
It is one of the most important statistical measures and it calculates the standard deviation or standard deviation.

Disadvantages:
It does not have a clear interpretation.


Standard deviation: Describes the variability of the data around the arithmetic mean, chosen as a measure of central tendency. It is calculated as the positive square root of the variance.

Advantage:
It is the most known and commonly used measure of the dispersion of a series of data.
It is advisable to use it when the arithmetic mean is a good measure of central tendency.
Disadvantages:
 It is sensitive to the variation of the data.

Variation coefficient: It is a relative measure of the variation of a data set.

Characteristics:
It is appropriate when you want to compare the variability in two or more groups.
If the CV is less than 20%, it is assumed that the data have a homogeneous distribution.

4. FORM MEASURES: They refer to the geometric shape of the data distribution. These are: Curtosis coefficient and asymmetry coefficient.





No hay comentarios:

Publicar un comentario