sábado, 27 de septiembre de 2014

Medidas de dispersion II

Desviación Media


se define como la media aritmética del valor absoluto de las desviaciones individuales de los valores de la variable con relación a un  promedio.  En su cálculo a diferencia del rango y la desviación intercuartìlica. Se toman en cuenta todos los valores de la variable lo que la hace ser más objetiva que las dos anteriores.

  • Desviación Media Para datos NO agrupados:


Ejemplo: El número de pasajeros que abordaron 7 autobuses del transporte público al salir de su terminar durante una hora fue como sigue:
Xi= 35, 40, 43, 44, 45, 46, 46 
 Hallar la desviación media del conjunto de datos anteriores.

1er Paso: Hallar la media aritmética (promedio)

2do. Paso: Restar a cada valor de la variable del promedio
Xi

Xi-X
35
       |35-43| = 8
40
      |40-43| = 3 
43
      |43-43| = 0 
44
      |44-43| = 1
45
      |45-43| = 2
46
      |46-43| = 3
46
      |46-43| = 3

3er Paso. Sumar todos los valores y restarlo por la cantidad de valores

DM =  Σ|Xi-X|  = 8+3+0+1+2+3+3 = 20 = 2.9 pasajeros = 3 pasajeros (redondeado)
                N                     7                   7

  • Desviacion Media para Datos Agrupados
El peso de 65 personas adultas viene dado por la siguiente tabla:
Peso en Kgs
fi               
 (No. Personas)
[50, 60)
8
[60, 70)
10
[70, 80)
16
[80, 90)
14
[90, 100)
10
[100, 110)
5
[110, 120)
2
Total
65
1er Paso: Hallar la media aritmética para datos agrupados
X=Σ|Xi.fi|
        N

Con todos los datos organizados ahora si podemos calcular la desviacion media
Varianza s2

Es la media aritmetica del cuadrado de las desviaciones respect a la media de una distribucion estadistica.
Se representa como S2 σ2.


Para encontrar la varianza sigue estos pasos:
1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 
3. Ahora calcula la media de esas diferencias al cuadrado. 
¿por qué al cuadrado?
Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza)
Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho más grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.
Propiedades de la varianza 
Dos propiedades importantes de la varianza son:
1.     La varianza de una constante es cero
2.     Otra propiedad importante es que si se tiene la varianza s2 de de un conjunto de datos y a cada observación se multiplica por una constante b, entonces la nueva varianza de los datos se obtiene multiplicando a la varianza de los datos por  b2.

Para datos agrupados en tablas, usando las notaciones establcidas en los capítulos anteriores, la varianza se puede escibir como  

Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros:

3,3,4,4,5

Solución: Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto al cual vamos a medir las diferencias. Éste es la media: 


La varianza es:


Otro ejemplo:
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribución de la tabla:

xi
fi
xi · fi
xi2 · fi
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250


42
1 820
88 050













domingo, 22 de diciembre de 2013

Medidas de Dispersión

la estadistica segun hemos estudiado hasta el momento no solo te permite organizar datos sino tambien que si estos datos no sufren variaciones podemos determinar futuros resultados basados en los que ya conocemos, pero como todos sabemos el mundo esta en constante cambio y no son lo suficiente estaticas para definir con certeza de que ese sera el resultado futuro. por consiguiente debemos tambien conocer las posibles variantes que se pueden presentar en los valores para asegurarnos que nuestros resultados esten lo mas cercano posible a la realidad absoluta. De esto tratan las medidas de dipersion.

Es tan importante conocer un promedio como conocer la variabilidad de los datos alrededor de él.  Por ejemplo: Suponga que el ingreso promedio anual de 3 empleados de una compañía de seguros es de RD$ 19,000 pesos mensuales y que el ingreso promedio de 3 empleados de una compañía aérea sea de RD$19,000 pesos mensuales también.  Si solo nos fijamos en el ingreso promedio podríamos concluir erróneamente que los empleados de ambas compañías tienen sueldos idénticos o casi idénticos.   Pero si miramos por detalle los salarios vemos que la conclusión no es correcta puesto que los salarios de los empleados de la compañía de seguros es de RD$18,000.00, RD$19,000.00 y RD$20,000.00,  sin embargo los sueldos de los empleados de la compañía aérea es de RD$7,000.00 pesos, RD$20,000.00 y RD$30,000.00.   Por lo que se puede ver que independientemente de que el promedio de los empleados de ambas compañías es el mismo, la variabilidad o dispersión es muy distinta con respecto al promedio. esto denota de que analizar un conjunto de datos no es suficiente para determinar todas las caracteristicas de dicho conjunto de datos.

Existen varias formas de medir la dispersión o variabilidad de un conjunto de datos cuantitativos, estas son:
medidas de dispersion absolutas:

  • Recorrido o Rango (R)
  • Desviacion Intercuartilica (DQ)
  • Desviacion Media (DM)
  • Varianza (S2)
  • Desviacion Tipica o Standard (S)
  • Medidas de dispersion relativas
  • Coeficiente de Variacion (CV)
Recorrido o Rango (R)
 se define como la diferencia entre el valor máximo y valor mínimo (R = Xmax - Xmin). si usamos el ejemplo del ingreso mensual de los empleados de la compañia de seguros, observamos que el sueldo mayor es RD$20,000.00 pesos y el sueldo menor es RD$18,000.00.    al calcular el rango obtenemos:
R = Xmax - Xmin
R = 20,000 – 18,000 = RD$2,000.00 Pesos
El rango para los empleados de la segunda compañía de área es:
R = 30,000.00 – 7,000.00 = RD$23,000.00 Pesos.
 Esta se utiliza para hacernos una idea del comportamiento de los datos cuando se desea una medida simple de la variabilidad o cuando por falta de tiempo no se pueden emplear medidas más complejas.

Desviacion Intercuartilica (DQ)

Es una medida de dispersión absoluta, ya que al igual que el rango se basa en dos valores para su cálculo, que es el cuartil de orden 3 y el cuartil de orden 1, no se necesita de todos los valores de la distribución para su cálculo.

DQ = Q3 - Q1
        2
(El calculo del cuartil necesita que los datos esten organizados por grupos)

Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla:

Peso en Kgs
fi               
 (No. Personas)
[50, 60)
8
[60, 70)
10
[70, 80)
16
[80, 90)
14
[90, 100)
10
[100, 110)
5
[110, 120)
2
Total
65
1er Paso: Encontrar la frecuencia acumulada(FI) de la distribución de frecuencias

Peso en Kgs
fi                
 (No. Personas)
FI         
[50, 60)
8
8
[60, 70)
10
8 +10 = 18
[70, 80)
16
18 + 16 = 34
[80, 90)
14
34 + 14 = 48
[90, 100)
10
48 + 10 =58
[100, 110)
5
58 + 5 = 63
[110, 120)
2
63 + 2 =65
Total
65
















2do. Paso: Hallamos el Cuartil de orden 1.

LI = Limite inferior, por lo general es el primer limite
KN= frecuencia total
FI = frecuencia acumulada del cuartillo
fi-1 = frecuencia del grupo anterior al cuartillo
CI = diferencia entre limite superior y limite inferior

3er Paso. Hallamos el cuartil de tercer orden 

4to. Paso. con los valores de los cuartillos ya podemos calcular la desviacion

DQ = Q3 - Q1  = 90.75 - 68.25 = 22.5 = 11.25 Kgs
                2                        2                   2


En la proxima publicacion continuaremos con las restantes medidas de dispersion.








domingo, 5 de mayo de 2013

Proxima publicacion

Hola a todos.

Se que llevo un tiempo sin publicar mas contenidos pero ya he preparado el siguiente tema de estadistica para mostrarlo asi que no se desesperen que muy pronto ya estara publicado. El siguiente tema sera medida de dispersion. tratare de hacerlo lo mas claro posible y añadire varios ejemplos para que sea mas clara su comprension.

Gracias por sus visitas al sitio