martes, 17 de noviembre de 2015

Datos Agrupados y No Agrupados misma base de datos.


MISMA BASE DE DATOS
DATOS AGRUPADOS Y NO AGRUPADOS.

     Tomando como base los datos de la unidad pasada estamos en el entendido que tengo 40 datos de los nacimientos en el municipio de Ecatepec entre hombre y mujeres  nacidos en el periodo antes mencionados en la unidad anterior.
Datos correspondientes a evidencia de aprendizaje de Unidad 1
16788
16522
19179
19033
18358
18267
21197
21065
17247
16956
19040
18591
18156
17854
17568
17316
17531
17323
18859
18331
17773
17661
16856
17052
18183
18047
18608
18150
18433
17862
16854
16417
18410
19193
17727
17479
18528
18277
16184
15618

     Este cuadro contiene los 40 datos de los bebes nacidos entre hombres y mujeres, con la finalidad de obtener las frecuencias de nacimientos en el municipio, de estos se extraerán los limites tanto mínimo como máximo, rango y demás datos.
Solucion
No De Datos
40
V máx.
21197
V min.
15618
Rango
5579
No De  Intervalo
6.286797971
Amplitud De Clases
929.8333333
Diferencia
1
                                                      
Intervalo de Clases
Marca de Clases
f1
F1
hi
f%
Límite  Inferior
límite Superior
15617
16546.83
32163.83
4
4
0.1
10
16547.83
17477.67
34025.5
8
12
0.2
20
17478.67
18408.5
35887.17
16
28
0.4
40
18409.5
19339.33
37748.83
10
38
0.25
25
19340.33
20270.17
39610.5
0
38
0
0
20271.17
21201
41472.17
2
40
0.05
5


SUMA
40

1
100

     Se observa la distribución de intervalos se obtiene por el método de sturges se calculan los límites que indican los valores más altos y el más chico en valor, el límite inferior que es valor total de datos menos una unidad y el límite superior es mi primer límite inferior más la amplitud de clases y ya tengo mis dos primeros límites.

     De igual modo límite inferior es primer límite superior más la diferencia y el límite superior es segundo límite inferior más amplitud y así para los demás límites, obteniendo los limites en diferentes 6 valores estudiados.

     La marca de clases es el promedio entre los límites y aplicar en los valores estudiados.

     La (fi) frecuencia absolutas que es la fórmula de frecuencia con los datos de referencia del problema y los grupos de referencia que son los límites que ya se han calculado, aceptamos y ya tenemos las frecuencias absolutas y al sumar las tendrá que dar el total de datos, en exel no nos dará la sumatoria, habré que editar la fórmula para convertir en matriz presionando control, shif y entre al mismo tiempo, se convierten en matriz con las llaves en la fórmula, dándonos el valor de     cuantas  veces se repiten los datos entre sus límites establecidos.

     La (FI) frecuencia absoluta acumulada se calcula con la primera frecuencia absoluta más la que sigue

     La (hi) frecuencia relativa división de frecuencias absolutas entre el total de datos dando F2, F4 para conservar los valores absolutos, al sumar nos tendrá que dar uno.

     La (f%) frecuencia porcentuales que es Frecuencia relativa multiplicado por 100 y se convierten en porcentajes. 


Esta es la segunda manera de representar los datos de la primera unidad


     Tomando como base los datos de la unidad pasada estamos en el entendido que tengo 40 datos de los nacimientos en el municipio de Ecatepec entre hombre y mujeres  nacidos en el periodo antes mencionados en la unidad anterior.

Datos correspondientes a evidencia de aprendizaje de Unidad 1
16788
16522
19179
19033
18358
18267
21197
21065
17247
16956
19040
18591
18156
17854
17568
17316
17531
17323
18859
18331
17773
17661
16856
17052
18183
18047
18608
18150
18433
17862
16854
16417
18410
19193
17727
17479
18528
18277
16184
15618


     Este cuadro contiene los 40 datos de los bebes nacidos entre hombres y mujeres, con la finalidad de obtener las frecuencias de nacimientos en el municipio, de estos se extraerán los limites tanto mínimo como máximo, rango y demás datos.

Xi
Xi  Categoría de datos
ni
ni.  Frecuencia Absoluta
Ni
Ni  Frecuencia Absoluta Acumulada
fi
Fi   Frecuencia Relativa
F1
FI   Frecuencia Relativa Acumulada
Li
Límite Inferior
Ls
Limite Superior

Se ordenaran los datos de menor a mayor en un tabla, categoría de datos (XI), y se procederá a nombrar las frecuencias, absoluta (nI) que es el número de ocasiones que aparece el dato en conjunto de datos y el acumulado (NI) dando el total de la muestra.

Xi
ni
Ni
fi
F1
LI
Ls
15618
1
1
2.5%
2.5%
15618

16184
1
2
5%
5%


16417
1
3
7.5%
7.5%


16522
1
4
10%
10%


16788
1
5
12.5%
12.5%


16854
1
6
15%
15%


16856
1
7
17.5%
17.5%


16956
1
8
20%
20%


17052
1
9
22.5%
22.5%


17247
1
10
25%
25%


17316
1
11
27.5%
27.5%


17323
1
12
30%
30%


17479
1
13
32.5%
32.5%


17531
1
14
35%
35%


17568
1
15
37.5%
37.5%


17661
1
16
40%
40%


17727
1
17
42.5%
42.5%


17773
1
18
45%
45%


17854
1
19
47.5%
47.5%


17862
1
20
50%
50%


18047
1
21
52.5%
52.5%


18150
1
22
55%
55%


18156
1
23
57.5%
57.5%


18183
1
24
60%
60%


18267
1
25
62.5%
62.5%


18277
1
26
65%
65%


18331
1
27
67.5%
67.5%


18358
1
28
70%
70%


18410
1
29
72.5%
72.5%


18433
1
30
75%
75%


18528
1
31
77.5%
77.5%


18591
1
32
80%
80%


18608
1
33
82.5%
82.5%


18859
1
34
85%
85%


19033
1
35
87.5%
87.5%


19040
1
36
90%
90%


19179
1
37
92.5%
92.5%


19193
1
38
95%
95%


21065
1
39
97.5%
97.5%


21197
1
40
100%
100%

21197
     (fi) frecuencia relativa, son los porcentajes que corresponden en relación a las repeticiones de cada valor en el conjunto de datos

    (FI) frecuencia relativa acumulada es igual a la frecuencia relativa en su primer valor de la tabla más el segundo valor de la misma, en este caso en específico no habrá frecuencias relativas acumulada por que las frecuencias son igual a el número de datos ya que no se repiten.

     Es decir las datos son 40 y todos son diferentes entre si no hay repeticiones ni numero distinto de apariciones en el conjunto, las frecuencias serán idéntica a los valores acumulados, como se observa en la tabla.

     (LI) Límite inferior es el número más pequeño dentro del conjunto de datos.

     (Ls) Límite superior es el número más grande dentro del conjunto de datos.

Conclusiones:
     En este primer ejercicio se tomó como base el método de sturges y los datos dan los valores que son esperados, como en las frecuencias absolutas 40 datos y en frecuencias porcentuales 100%
     En este segundo ejercicio es caro que no hay movimiento de los datos, y el principal motivo es que son los mismos datos que no se repiten, cada uno es diferente y es por lo que las frecuencias no varían cada una es correspondiente a la clase de datos