lunes, 19 de abril de 2010

0 comentarios  

PROBABILIDAD Y ESTADÍSTICA DINÁMICA”

Rama de las matemáticas que a través de la recopilación, organización e interpretación de los datos se puede representar a través de graficas.

  • LA ESTADÍSTICA DESCRIPTIVA: se ocupa de la colección, clasificación y descripción de un conjunto de datos con el fin de describir sus características de una población.
    LA ESTADÍSTICA INFERENCIA: se encarga de interpretar datos y resultados obtenidos con las técnicas descriptivas. Trabaja con muestras y sub conjuntos formados de un grupo de individuos por una población.
    Población: es un grupo de individuos que se desea estudiar.
    Muestra: es aquella parte de la población que se desea estudiar
    Parámetro: es una medida que se calcula para describir las características de una población. Ejemplo: edad, sexo, color de ojos, etc.
    Dato estadístico: es una característica medible mediante un valor o atributo de un elemento de estudio.
    Variable: es el conjunto de características de individuos que se interesan en una investigación científica que tiene una misma característica y estas pueden ser cualitativas y cuantitativas, aleatorias y discretas.
    Variables cualitativas: son aquellas que describen los atributos o cualidades de un objeto de un objeto. Ejemplo: color de ojos, estado cibi, esta.
    Variables cuantitativas: son aquellas que se representan a través de un valor numérico y pueden ser: discretas, continuas y aleatorias.
    Variables aleatorias: se utiliza en probabnilidad, son aquellos valores numéricos que toman una variable y por medio de factores fortuitos, por lo cual pueden ser escogidos al azar para su estudio, elegidos para la muestra.
    Variable discreta: son aquellos que están asociados un proceso de conteo en el cual deben ser números enteros. Ejemplo: 25, 24,66 y no 24.5 o 66.5.
    Variable continua: están asociados a un proceso de medición que pueden tomar cualquier valor dentro de un intervalo de valores. Ejemplo: talla y peso.
    Datos agrupados:
    conjunto de datos que se han organizado en términos cuantitativos en una tabla de frecuencia.
    Datos no agrupados: son aquel conjunto de recopilación obtenida, se utiliza en términos cualitativos.
    Dato estadístico: es el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar.

  • CLASIFICACIÓN DE LOS DATOS
    Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos.
    Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad.
    Ejemplo:
    Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.

    Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos.
    Ejemplo:
    Se clasifican los estudiantes del Núcleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.
    Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son reconocidos como cronológicos.
    Ejemplo:
    Al registrar los promedios de notas de los Alumnos del Núcleo San Carlos de la UNESR en los diferentes semestres.
    Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos geográficos.
    Ejemplo
    El número de estudiantes de educación superior en las distintas regiones del país.


    Fuentes de datos Estadísticos:
    Los datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a través de fuentes primarias y fuentes secundarias.
    Fuentes de datos primarias: es la persona o institución que ha recolectado directamente los datos.

    Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la información.
    Las fuentes primarias más confiables, son las efectuadas por oficinas gubernamentales encargadas de tal fin.

    Frecuencia : el numero de veces que se repite cada elemento que contiene cada clase o categoría.
    limite de clase: son aquellos intervalos conformados por un extremo inicial y uno final.
    Ejemplo: inicial 15 – 25 final
    Intervalo de clase: tiene correspondecia con los valores cuantitatoivos por que se agrupan de la misma manera y con el mismo tamaño.

    RANGO
    Para comenzar con la tabulación y poder obtener el tamaño del intervalo primero se obtiene el rango, el cual resulta con el dato mayor menos el dato menor de un conjunto, ejemplo:
    Tenemos un conjunto de datos tales como:

    45 23 25 48
    9 25 36 43
    14 27 37 56
    20 39 65 90

    90 – 9=81 + 1


    Cabe mencionar que al rango se le tiene que sumar la unidad para determinar el tamaño del intervalo posterior.

    Posteriormente debemos sacar el número de clase calculando la raíz cuadrada del total de datos:

Numero de clase: √16 = 4

Para obtener el intervalo se debe dividir el rango entre el número d clase:

Tamaño del intervalo: 82/4 =20.5 21

NOTA: cuando el intervalo cae en número par se debe subir al número non siguiente
intervalo
9-29
30-50
51-71
72-92
93-113

Como se puede observar, entre cada espacio de los intervalos existe una diferencia de 21, el cual es el valor obtenido anteriormente




Graficas
Las graficas tienen por objeto representar las características esenciales de los resultados obtenidos en la tabulación y dentro de ellos tenemos: grafica de barras, histogramas, polígonos de frecuencia, ojiva o circulo grama o grafica de pastel.

GRAFICA DE BARRAS

Se emplea para representar las frecuencias relativas y absolutas de acontecimientos y se utiliza en dos ejes, uno vertical y otro horizontal, en el eje X u horizontal se representan los intervalos, clases o tipos de resultados o acontecimientos y en la línea vertical las frecuencias de acuerdo al número de veces de cada resultado dejando un espacio entre cada barra, por ejemplo:
intervalo edad

101-105 8

106-110 5
111-115 5
116-120 11
121-125 25
126-130 4
131-135 5
136-140 15
141-145 24

En él en un salón de belleza que está en alcuco asisten a la semana personas de diferentes edades como se presenta en el siguiente cuadro:
Intervalo edades

1-5 3
6-10 5
11-15 15
16-20 16
21-25 8
26-30 6
31-35 9
36-40 12

HISTOGRAMAS

En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Tiene por diferencia a la grafica de barras que estas van juntas ya que no permite huecos...

CIRCULOGRAMA
Las Gráficas circulares denominadas también gráficas de pastel o gráficas del 100%, se utilizan para mostrar porcentajes y proporciones.
Angulo = (360°(f))/n
Ejemplo:
Al realizar un estudio sobre el color de gelatinas que vende don chuy se obtuvieron los siguientes datos:

ANIMAL CONTEO PORCENTAJE %
perro 6 16.48855
leon 9 24.73282
gallo 15 41.22137
tigre 25 68.70229
cotorro 4 10.99237
caballo 16 43.96947
ardilla 10 27.48092
gato 14 38.47328
Rata 16 43.96947
conejo 7 19.23664
mapache 9 24.73282


MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.
Son aquellas que nos señalan, el punto medio y que se agrupan alrededor del mismo, en ellas se encuentran: la media, mediana, moda, los presiles, y presentiles.

PARA DATOS NO AGRUPADOS
MEDIA

Para datos no agrupados se define como la suma de todos los datos divididos entre el número de los datos que se tengan, su fórmula es:
X ̅ = εxi/n
Por ejemplo
Las edades de los alumnos de tercero 17 ,18.20,22,19,23 (17+18+20+22+19+23)/6=19.8

MEDIANA

Es el valor central de los datos que pueden ser representados de manera par e impar, se encuentran en el centro de distribución de forma ordenada ascendente y descendente, si el número de datos es par la mediana es igual al promedio de los datos que se encuentran en el centro.
Notación: x ̃

MODA
Para datos no agrupados la moda es representada por el dato que más veces se repite en una serie de números, ejemplo:


Amodales: cuando no hay ningún número que se repita,
Ejemplo:
20,21,22,232,24,25,26,27,28,29,30,31 en este caso no se repite ningún numero


Modales: cuando se repite un solo número.
Ejemplo:
1,2,3,4,5,6,8,9,10,11,8 solo se repite un numero y es el 8

Bimodales: cuando se repiten dos números las mismas veces.
Ejemplo:
2,4,6,8,7,9,3,4,6 4 se repiten las mismas veces el mismo numero 4 y 6


Multimodal: cuando se repiten más de dos números distintos las mismas veces.
Ejemplo:
6 ,7,8,9,1,0,8,7,6,Se repiten varios números las mismas veces

PARA DATOS AGRUPADOS
MEDIA

Para datos agrupados la formula es:
X ̅= (εf(x))/n

Ejemplo:
De los datos recolectados por los alumnos de la primaria de San Lucas de todos los grupos mostraron que de 0-10 estudiantes 5 obtuvieron baja calificación, de 10-20, obtuvieron un promedio alto y así sucesivamente hasta llegar a los 100 estudiantes con el siguiente promedio: 21 excelente, 27 bueno, 31 regular, 35 bajo, 21 muy malos, 14 fueron los peores, 9 en regularización y 5 no se presentaron. Ordene sus intervalos y obtenga la media de los datos agrupados

Intervalo frecuencia mc (f) (mc)
0-10 5 5 25
10-20 12 15 180
20-30 21 25 525
30-40 27 35 945
40-50 31 45 1395
50-60 35 55 1925
60-70 21 65 1365
70-80 14 75 1050
80-90 9 85 765
90-100 5 95 475
ε 180 ε 8650
X ̅= ε 8650/180
X ̅=48

MEDIANA

Se obtiene mediante una distribución de frecuencias con la siguiente fórmula:
x ̃= L + [ (n/2-fa )/(fx ̃ )] C
Donde:
x ̃= mediana
L= límite real del intervalo que contiene a la mediana.
N= número de datos.
Fa= frecuencia acumulada que contiene a la mediana del intervalo anterior.
fx ̃= frecuencia del intervalo que contiene a la mediana.
C= tamaño del intervalo.
Ejemplo:
En una fabrica localizada en la comunidad de San Pedro, se venden canteras de diferentes medidas, se realizo un censo de acuerdo a sus pedidos y se obtuvo la siguiente tabla:

intervalo frecuencia fa
100-110 4 4
110-120 7 11
120-130 11 22
130-140 17 39
140-150 25 64
150-160 33 97
160-170 30 127
170-180 21 148
180-190 16 164
190-200 17 181
∑▒181
Identificamos los datos de la formula:
n= 181/2= 90.5
L= 150
fa= 64
C= 10
fx ̃=33
Sustituimos y resolvemos:
x ̃= 150 + [(90.5-64)/33] 10
x ̃= 150 + [26.5/33] 10
x ̃= 150 + 0.803 (10)
x ̃= 158.03
Moda
Se obtiene de la diferencia de donde ubicamos a la moda y de la frecuencia del intervalo anterior.
x^1= L +[A_1/A_(1+ A_2 ) ]
Donde:
x^1= moda
A_1= diferencia de donde ubicamos a la moda y la frecuencia del intervalo anterior.
A_2= diferencia de donde ubicamos a la moda y la frecuencia del intervalo siguiente.
C= tamaño del intervalo.
L= limite real de clase.

Ejemplo:
En una tienda de ropa “la moda” se obtuvieron los siguientes datos:
Intervalo frecuencia
9000-1000 41
8000-9000 54
7000-8000 80
6000-7000 96
5000-6000 55
4000-5000 65
3000-4000 47
2000-3000 72
1000-2000 37
0-1000 12

Obtenemos a delta 1 y a delta 2, identificando al dato de mayor frecuencia restándolo al dato anterior a este y al dato siguiente del mismo.
∆1=96-80 ∆2=96-55
x ̂ = L + { ∆1/(∆1+ ∆2)}+c
x ̂=6000 + {41
/(41+6)}+1000
x ̂=6719.29

Cuantiles
Los cuantiles se dividen en Cuartiles, deciles y percentiles.

CUARTILES
Estos representan el valor que está al 25%, 50% y 75% de la totalidad de los datos, estos se dividen en cuatro como su nombre lo indica.
Q1=(n/4)+ 1/2
Q2=(2n/4)+ 1/2
Q3=(3n/4)+ 1/2
Q4=(4n/4)+ 1/2

DECILES
Del primero al noveno marcan el valor ubicado del 10% al 90% de los datos y su fórmula es:
D=(n/10)+ 1/2


PERCENTILES
Indican el valor que esta del 1% al 98%,99% de los datos y su fórmula es:

P=(n/100)+ 1/2
NOTA: para indicar que cuartil, decil, o percentil se está buscando se coloca con numero y se multiplica por n (numero de datos)
Ejemplo:
Pedro en una fiesta con sus amigos realizo una encuesta sobre las edades de sus amigos y las personas presentes y estos fueron los datos que obtuvo:
3, 5, 6, 25, 27, 27, 28, 28, 45, 47, 48, 48, 11, 14, 18, 18, 20, 24, 31, 33, 34, 36, 44, 50, 50, 52.
Con esto él quiere obtener el valor del 3 cuartil, 4 decil y 17 percentil:
Identificamos que el número de datos es 26
Cuartil decil percentil

Q3=(3n/4)+ 1/2 D4=(n/10)+ 1/2 P4=(n/100)+ 1/2
Q3=(((3)(26))/4)+ 1/2 D4=(((4)(26))/10)+ 1/2 P4=(n/100)+ 1/2
Q3=20 D4=10.9 P17=4.92



Posteriormente ordenamos los datos y contando en numero de lugares ubicamos nuestros resultados:
3 5 6 11 14 18 18 20 24 25 27 27 28 28 3 33 34 36 44 45 47 48 48 50 50 52
17 percentil= 14 4 decil= 27 3 cuartil= 45


MEDIA GEOMÉTRICA
Es una medida que se puede aplicar al crecimiento exponencial, ya que obtiene la raíz enésima de un grupo de n datos multiplicados entre sí, su fórmula es:
G=√(n&x1*x2*x3..)
Ejemplo:
Alonso va a una tienda de sabritas y observa que los precios son los siguientes con los cuales desea obtener la media geométrica:
3, 4, 5, 6, 7
G=√(5&3*4*5*6*7.)
G=√(5&2520.)
G= 1.2246 x 1035
MEDIA ARMONICA
Se denota con la letra H, es una serie de n números es la reciproca a la media aritmética o media y su fórmula es:
H=N/(∑▒1/x)
Ejemplo:
Ana tiene a sus hermanos los cuales tienen las siguientes edades 2, 4, 8:
H=3/(1/2+1/4+1/8)
H=3/(7/8)
H=3.42
GRAFICA DE BARRAS
Se emplea para representar las frecuencias absolutas y relativas de acontecimientos y se utiliza en dos ejes uno vertical y uno horizontal.
intervalo edad
101-105 8
106-110 5
111-115 5
116-120 11
121-125 25
126-130 4
131-135 5
136-140 15
141-145 24


CIRCULOGRAMA O GRAFICA DE PASTEL

Se emplea generalmente para representar términos cuantitativos o cualitativos que corresponde a un porcentaje y debido en partes o cuñas por medio de un trazado de radios, también se determina el porcentaje que representa a cada clase de frecuencia y se obtiene con la siguiente expresión:
Angulo= (360" (f))/n % (f (intervalo)x 100)/n

CUANTILES
Así como la media marca la mitad de los valores los curtiles señalan el valor que esta 25%, 50%, y 75% de la totalidad de los datos.
Se dividen en 4 como su nombre lo dice, su fórmula es la siguiente:
Q_1= (n/4+ 1/2), Q_2= ((2*n)/4+ 1/2), Q_3= ((3*n)/4+ 1/2), Q_4= ((4*n)/4+ 1/2)
Los deciles del 1-9 indican el valor ubicado de 10 en 10……..90% de los datos.
D_1= (n/10+ 1/2)

PERCENTILES
Indican el valor que esta del 1% al 98%,99% de los datos y su fórmula es:

P=(n/100)+ 1/2
NOTA: para indicar que cuartil, decil, o percentil se está buscando se coloca con numero y se multiplica por n (numero de datos)
Ejemplo:
Pedro en una fiesta con sus amigos realizo una encuesta sobre las edades de sus amigos y las personas presentes y estos fueron los datos que obtuvo:
3, 5, 6, 25, 27, 27, 28, 28, 45, 47, 48, 48, 11, 14, 18, 18, 20, 24, 31, 33, 34, 36, 44, 50, 50, 52.
Con esto él quiere obtener el valor del 3 cuartil, 4 decil y 17 percentil:
Identificamos que el número de datos es 26
Cuartil decil percentil

Q3=(3n/4)+ 1/2 D4=(n/10)+ 1/2 P4=(n/100)+ 1/2
Q3=(((3)(26))/4)+ 1/2 D4=(((4)(26))/10)+ 1/2 P4=(n/100)+ 1/2
Q3=20 D4=10.9 P17=4.92



Posteriormente ordenamos los datos y contando en numero de lugares ubicamos nuestros resultados:
3 5 6 11 14 18 18 20 24 25 27 27 28 28 3 33 34 36 44 45 47 48 48 50 50 52
17 percentil= 14 4 decil= 27 3 cuartil= 45

MEDIA GEOMÉTRICA
Es una medida que se puede aplicar al crecimiento exponencial, ya que obtiene la raíz enésima de un grupo de n datos multiplicados entre sí, su fórmula es:
G=√(n&x1*x2*x3..)
Ejemplo:
Alonso va a una tienda de sabritas y observa que los precios son los siguientes con los cuales desea obtener la media geométrica:
3, 4, 5, 6, 7
G=√(5&3*4*5*6*7.)
G=√(5&2520.)
G= 1.2246 x 1035

MEDIA ARMONICA

Se denota con la letra H, es una serie de n números es la reciproca a la media aritmética o media y su fórmula es:
H=N/(∑▒1/x)
Ejemplo:
Ana tiene a sus hermanos los cuales tienen las siguientes edades 2, 4, 8:
H=3/(1/2+1/4+1/8)
H=3/(7/8)
H=3.42

CUARTILES PARA DATOS AGRUPADOS.

Para obtener los Cuartiles para datos agrupados:
n/4+ 1/2 Q_1=Li+ (2n/4 - (εf)a)/f i
Donde:
Li= límite inferior de clase.
(εf)a= es la frecuencia acumulada del intervalo anterior.
f= frecuencia de clase que contiene al intervalo.
i= tamaño del intervalo.
Medidas de dispersión

Nos indican que tan alejado o disperso están los datos unos de otros y entre ellos tenemos: desviación media, varianza, desviación estándar o típica, coeficiente de variación y medidas de sesgo.
Desviación media: es el valor del promedio de los valores absolutos de las desviaciones de los datos con respecto a la media ya que indican en promedio el número de unidades en que cada dato se encuentra alejado del mismo y de la media.
Desviación media para datos no agrupados: es el valor absoluto de las desviaciones de los diferentes valores de un conjunto de datos.