Estadistica Simple
"Nuestra vida es un juego de Azar..Con un solo evento cierto: La nada infinita. A.Jiménez M
Estadística: En un sentido estricto el término se utiliza para denotar la toma, recopilación, organización, análisis y presentación de datos; incluso el término es aplicado a los mismos datos o números que se derivan de ellos, así se habla de estadística de empleo, estadística de accidentes, etc. La estadística es un método empleado en la toma de decisiones cuando estamos frente a la incertidumbre, partiendo de estudio de datos numéricos.
Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población.
Las personas o cosas que forman parte de la población se denominan elementos.
A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo,Etc.
Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos de un centro de enseñanza, o grupo clase.
Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que pudiese considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita
Un estudio estadístico, generalmente se realiza sobre un subconjunto de elementos de la población. Este subconjunto recibe el nombre de muestra.
Variables y atributos.
Los caracteres de un elemento que forman parte de la población los podemos clasificar en: dos grandes clases:
*Variables Cuantitativas.
*Variables Cualitativas o Atributos.
Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el peso, Altura, Edad, etc…
A su vez este tipo de variables se puede dividir en dos subclases:
Cuantitativas discretas: Aquellas a las que se les puede asociar un número entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos, páginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc.
No obstante en muchos casos el tratamiento estadístico hace que a las variables discretas las trabajemos como si fuesen continuas y viceversa.
Variables Cualitativas: Son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos asignar un número. Por ejemplo: Sexo, profesión, estado civil, etc.
A su vez las podemos clasificar en:
Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El nivel de estudios, etc.
No ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.
REDONDEO DE DATOS
El resultado de redondear un número como 72.8 al entero más próximo es 73, puesto que 72.8 está más cerca de 73 que de 72. De la misma manera, 72.8146 redondeado al número decimal con dos decimales será 72.81 puesto que 72.8146 está más cerca de 72.81 que de 72.82
DISTRIBUCIONES DE FRECUENCIAS
Toma de Datos:
Es la obtención de una colección de los mismos que no han sido ordenados numéricamente. Por ejemplo, Un conjunto de alturas de 100 estudiantes de una universidad.
Ordenación:
Es ordenar los datos obtenidos y colocarlos en forma creciente o decreciente de magnitud. Rango: Es la diferencia entre el mayor y el menor de los datos dentro de una colección. Por ejemplo, si la altura mayor de los 100 estudiantes de una muestra es de 74 pulgadas y la menor es de 60 pulgadas, el rango es de 14 pulgadas ( =74 – 60 ).
Distribución de Frecuencias:
Los datos se pueden distribuir en clases o categorías y determinar el número de individuos o elementos pertenecientes a cada clase .
Intervalos de Clases y Límites de Clases:
Si nos fijamos en el cuadro superior, un intervalo de clase es una rango de valores observados. Delimitados por dos números extremos que reciben el nombre de límite superior y límite inferior. Por ejemplo, 63 - 65 es un intervalo, donde el límite inferior es 63 y el superior es 65
Limites Reales de Clases:
Estos límites se obtienen sumando el límite superior e inferior de dos intervalos de clases contiguos. Por ejemplo:
60 - 62
63 - 65
62 + 63 = 125/2 = 62,5
Tamaño o ancho de un intervalo de clase (= C)
Es la diferencia entre el límite superior e inferior de un intervalo de clases.
Marcas de Clases:
Es el punto medio del intervao de clase y se obtiene sumando los límites inferior y superior de la clase y dividiendo por dos. Por ejemplo, el siguiente intervalo:
66 - 68
tiene como marca de clase el número 67 = ( 66+68)/2
Reglas Generales para construir las Distribuciones de Frecuencias:
- Determinar el mayor y el menor entre los datos registrados, realizar su resta y así encontrar el rango (= r)
- Dividir el rango en un número conveniente de intervalos de clases del mismo tamaño. El número de intervalos se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de clase se eligen tambien de forma que las marcas de clases o puntos medios coincidan con algunos datos realmente observados.
- Encontrar el número de observaciones que caen dentro de cada intervalo de clase; es decir, encontrar las frecuencias de clases. Para ésto es mejor utilizar una columna de conte
Los kilómetros recorridos por 20 estudiantes al venir a la universidad desde sus casas, estan dados a continuación:
Mediana :
Calculo de la Moda para datos agrupados:
La Moda de una serie de números es aquel valor que se presenta con mayor frecuencia, es decir, es el valor más común. La moda puede no existir, incluso si existe puede no ser única. Una distribución que tiene una sola moda se llama unimodal. Para datos agrupados, la moda puede obtenerse mediante la siguiente fórmula:
Si deseas puedes bajarte el archivo sobre Media, Mediana y Moda:
Clik AquiSi deseas puedes consultar un ejercicio resuelto Media, Mediana, Histograma: Click Aqui
HISTOGRAMAS Y POLIGONOS DE FRECUENCIA.
Son dos representaciones gráficas de las distribuciones de frecuencia.
1. Un HISTOGRAMA DE FRECUENCIA, consiste en una serie de rectángulos que tienen:
a) Sus bases sobre el eje horizontal (eje X) con centros en las marcas de clases y longitud igual al tamaño de los intervalos de clase
b) Alturas proporcionales a las frecuencias de clase
2. Un POLIGONO DE FRECUENCIA, es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse uniendo los puntos medios de los techos de los rectángulos en el histograma
Ejercicio Resuelto:
LA DESVIACION TIPICA Y OTRAS MEDIDAS DE DISPERSION
El grado de dispersión de los datos númericos alrededor de un valor medio recibe el nombre de variación o dispersón de los datos. Entre las medidas de dispersión, tenemos: a) El Rango, b) la Desviación Media, c) Cuartiles, Deciles y Percentiles. D)La Desviación Típica
RANGO:
El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos.
Ejemplo: El rango de los números 2, 3, 3, 5, 5, 5, 8, 10, 12 es: 10
DESVIACION MEDIA:
La Desviación Media (=DM), es un promedio de la sumatoria de las desviaciones de un conjunto de datos con respecto a su media
CUARTILES, DECILES, PERCENTILES:
Entre otras medidas de posición no central, se suele utilizar una serie de valores que dividen la muestra en tramos iguales:
CUARTILES: Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, cada uno de estos tramos concentra el 25% de los resultados.
DECILES: Son 9 valores que distribuyen la serie de datos, ordenada en forma creciente o decreciente, en diez tramos o partes iguales, en los que cada uno de ellos concentra el 10% de los resultados.
PERCENTILES:Son 99 valores que distribuyen la serie de datos, ordenada en forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados
Ejemplo:Vamos a calcular los cuartiles de una serie de datos referidos a la estatura de un grupo de alumnos. Los deciles y percentiles se calculan de una manera igual, aunque para ello haría falta distribuciones con mayor número de datos
Otenemos los datos, de un grupo de estudiantes
Luego los ordenamos en forma creciente y anotamos sus frecuencias ( veces en que se repiten las estaturas). Primero, sus FRECUENCIAS ABSOLUTAS (simples y acumuladas). Luego, sus FRECUENCIAS RELATIVAS (simples y acumuladas)
El Primer cuartil, es el valor 1.22 Cm, ya que por debajo de él se sitúa el 25% de la frecuencia, como se puede ver en la columna de la frecuencia relativa acumulada.
El segundo cuartil, es el valor: 1.26 Cm, ya que entre este valor y el primer cuartil se situa otro 25% de la frecuencia, para un acumulado del 50%
El tercer cuartil, es el valor: 1.28 Cm, ya que entre este valor y el segundo cuartil se sitúa otro 25% de la frecuencia, para un acumulado del 75%.
DESVIACIÓN TIPICA:
Vaya a la ventana Pizarra, seleccione Estadist I. Resuelva el Problema No.1
Para datos agrupados, la Desviación Típica se calcula de la siguiente manera: