domingo, 22 de diciembre de 2013

Medidas de Dispersión

la estadistica segun hemos estudiado hasta el momento no solo te permite organizar datos sino tambien que si estos datos no sufren variaciones podemos determinar futuros resultados basados en los que ya conocemos, pero como todos sabemos el mundo esta en constante cambio y no son lo suficiente estaticas para definir con certeza de que ese sera el resultado futuro. por consiguiente debemos tambien conocer las posibles variantes que se pueden presentar en los valores para asegurarnos que nuestros resultados esten lo mas cercano posible a la realidad absoluta. De esto tratan las medidas de dipersion.

Es tan importante conocer un promedio como conocer la variabilidad de los datos alrededor de él.  Por ejemplo: Suponga que el ingreso promedio anual de 3 empleados de una compañía de seguros es de RD$ 19,000 pesos mensuales y que el ingreso promedio de 3 empleados de una compañía aérea sea de RD$19,000 pesos mensuales también.  Si solo nos fijamos en el ingreso promedio podríamos concluir erróneamente que los empleados de ambas compañías tienen sueldos idénticos o casi idénticos.   Pero si miramos por detalle los salarios vemos que la conclusión no es correcta puesto que los salarios de los empleados de la compañía de seguros es de RD$18,000.00, RD$19,000.00 y RD$20,000.00,  sin embargo los sueldos de los empleados de la compañía aérea es de RD$7,000.00 pesos, RD$20,000.00 y RD$30,000.00.   Por lo que se puede ver que independientemente de que el promedio de los empleados de ambas compañías es el mismo, la variabilidad o dispersión es muy distinta con respecto al promedio. esto denota de que analizar un conjunto de datos no es suficiente para determinar todas las caracteristicas de dicho conjunto de datos.

Existen varias formas de medir la dispersión o variabilidad de un conjunto de datos cuantitativos, estas son:
medidas de dispersion absolutas:

  • Recorrido o Rango (R)
  • Desviacion Intercuartilica (DQ)
  • Desviacion Media (DM)
  • Varianza (S2)
  • Desviacion Tipica o Standard (S)
  • Medidas de dispersion relativas
  • Coeficiente de Variacion (CV)
Recorrido o Rango (R)
 se define como la diferencia entre el valor máximo y valor mínimo (R = Xmax - Xmin). si usamos el ejemplo del ingreso mensual de los empleados de la compañia de seguros, observamos que el sueldo mayor es RD$20,000.00 pesos y el sueldo menor es RD$18,000.00.    al calcular el rango obtenemos:
R = Xmax - Xmin
R = 20,000 – 18,000 = RD$2,000.00 Pesos
El rango para los empleados de la segunda compañía de área es:
R = 30,000.00 – 7,000.00 = RD$23,000.00 Pesos.
 Esta se utiliza para hacernos una idea del comportamiento de los datos cuando se desea una medida simple de la variabilidad o cuando por falta de tiempo no se pueden emplear medidas más complejas.

Desviacion Intercuartilica (DQ)

Es una medida de dispersión absoluta, ya que al igual que el rango se basa en dos valores para su cálculo, que es el cuartil de orden 3 y el cuartil de orden 1, no se necesita de todos los valores de la distribución para su cálculo.

DQ = Q3 - Q1
        2
(El calculo del cuartil necesita que los datos esten organizados por grupos)

Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla:

Peso en Kgs
fi               
 (No. Personas)
[50, 60)
8
[60, 70)
10
[70, 80)
16
[80, 90)
14
[90, 100)
10
[100, 110)
5
[110, 120)
2
Total
65
1er Paso: Encontrar la frecuencia acumulada(FI) de la distribución de frecuencias

Peso en Kgs
fi                
 (No. Personas)
FI         
[50, 60)
8
8
[60, 70)
10
8 +10 = 18
[70, 80)
16
18 + 16 = 34
[80, 90)
14
34 + 14 = 48
[90, 100)
10
48 + 10 =58
[100, 110)
5
58 + 5 = 63
[110, 120)
2
63 + 2 =65
Total
65
















2do. Paso: Hallamos el Cuartil de orden 1.

LI = Limite inferior, por lo general es el primer limite
KN= frecuencia total
FI = frecuencia acumulada del cuartillo
fi-1 = frecuencia del grupo anterior al cuartillo
CI = diferencia entre limite superior y limite inferior

3er Paso. Hallamos el cuartil de tercer orden 

4to. Paso. con los valores de los cuartillos ya podemos calcular la desviacion

DQ = Q3 - Q1  = 90.75 - 68.25 = 22.5 = 11.25 Kgs
                2                        2                   2


En la proxima publicacion continuaremos con las restantes medidas de dispersion.








domingo, 5 de mayo de 2013

Proxima publicacion

Hola a todos.

Se que llevo un tiempo sin publicar mas contenidos pero ya he preparado el siguiente tema de estadistica para mostrarlo asi que no se desesperen que muy pronto ya estara publicado. El siguiente tema sera medida de dispersion. tratare de hacerlo lo mas claro posible y añadire varios ejemplos para que sea mas clara su comprension.

Gracias por sus visitas al sitio

martes, 12 de marzo de 2013

Tabla de distribucion de frecuencia

Tabla de distribucion de frecuencia

El departamento de investigacion de la universidad estatal recolecto las puntuaciones de coeficiente de inteligencia de 70 personas  tomadas al azar , considerando un intervalo de clase   igual a 10. Construir una distribución de frecuencias

                            64       142      107      67       125   124      91      102    135  105
                            82       114      126      93       107   128    123       91    116   133
                           100      151       51     104       101   118    123       98      90     67
                           112       107      123    121      115     93      73      116   105   107
                           118       153      109     78         98    104    140     117   147   121
                             89         95        98      143    114    118    123     102     89     83 
                             135        101      120      84       76       158      78     136   107    105 

1-Lo primero que debemos hacer es organizar los datos (en este caso de menor a mayor).

51 78 91 98 104 107 116  121  124 140
64 82 91 100 105 107 116 121 125 142
67 83 93 101 105 109 117 123 126 143
67 84 93 101 105 112 118 123 133 147
73 89 95 102 107 114 118 123 135 151
76 89 98 102 107 114 118 123 135 153
78 90 98 104 107 115 120 124 136 158

2- una vez estan organizados podemos buscar el rango

R= Xmax - Xmin
R= 158 - 51= 107

3 - despues de determinado el rango, necesitamos en numero de clase. y nos dice que sera 10 (predeterminado en la descripcion del ejercicio en este caso) y luego el numero de clase. 

NC= R/Ci
NC= 107/10= 10.7= 11

4 - ya conocemos la amplitud de cada clase (Ci= 10) y la cantidad de clases que debe tener la tabla (NC= 11) ahora pasamos a construir la tabla con sus respectivas distribuciones.

5 - una ves presentada las clases podemos construir la frecuencia simple (fi).
Coeficiente  inteligencia
fi
50 – 60
1
60  - 70
3
70 – 80
4
80 – 90
5
90 – 100
9
100 – 110
16
110 – 120
10
120 – 130
11
130 – 140
4
140 – 150
4
150 -160
3
Total
70
6 - ahora podemos construir la frecuencia relativa (fr) tomando en cuenta que la fr = fi/ total de observaciones.
Coeficiente  inteligencia
fi
fr
50 – 60
1
1/70 = 0.01
60  - 70
3
3/70 =  0.04
70 – 80
4
4/70 = 0.06
80 – 90
5
5/70 = 0.07
90 – 100
9
9/70 = 0.13
100 – 110
16
16/70 = 0.23
110 – 120
10
10/70 = 0.14
120 – 130
11
11/70 = 0.16
130 – 140
4
4/70 = 0.06
140 – 150
4
4/70 = 0.06
150 -160
3
3/70 = 0.04
Total
70

7 - ahora podemos construir la frecuencia simple acumulativa (FI) y la frecuencia relativa acumulativa (Fr) que es igual a la secuencia de la suma de la frecuencia simple y la frecuencia relativa. en el caso de la frecuencia relativa, la suma total debe ser igual a 1 o un aproximado
Coeficiente  inteligencia
fi
fr
FI
Fr
50 – 60
1
1/70 = 0.01
1
0.01
60  - 70
3
3/70 =  0.04
1 + 3 = 4
0.01+0.04=0.05
70 – 80
4
4/70 = 0.06
4 + 4 = 8
0.05+0.06=0.11
80 – 90
5
5/70 = 0.07
8 + 5 = 13
0.11+0.07=0.18
90 – 100
9
9/70 = 0.13
13 + 9 = 22
0.18+0.13=0.31
100 – 110
16
16/70 =0.23
22 + 16 =38
0.31+0.23=0.54
110 – 120
10
10/70 =0.14
38 + 10 =48
0.54+0.14=0.68
120 – 130
11
11/70 =0.16
48 + 11 =59
0.68+0.16=0.84
130 – 140
4
4/70 = 0.06
59 + 4 = 63
0.84+0.06=0.9
140 – 150
4
4/70 = 0.06
63 + 4 = 67
0.9+0.06=0.96
150 -160
3
3/70 = 0.04
67 + 3 = 70
0.96+0.04=1.00
Total
70


podemos agregarle la potencia o hacerlo por simple inspeccion sabiendo que el total de observaciones es igual al 100% y lo multiplicamos por la frecuencia relativa. ejemplo

fr*100% -> 0.06*100= 6%

preguntas:
¿Qué porciento de personas tiene un coeficiente de 100-110?
23% de las personas observadas posee un coeficiente de 100-110 (porciento de la frecuencia relativa)

¿Cuántas personas tienen un coeficiente menor que 90?
13 prsonas tienen un coeficiente menor que 90 (frecuencia acumulativa simple)

ahora tu puedes formular tus preguntas y practicar con este mismo ejercicio