LA ESTADÍSTICA Y LOS FENÓMENOS SOCIOLÓGICOS, PSICOLÓGICOS,...
En la naturaleza existen
fenómenos que no obedecen a leyes fijas y que dependen de circunstancias
prácticamente incontrolables: Fenómenos sociológicos, psicológicos, económicos,
médicos, biológicos, etc.
En estos casos, para
obtener información del desarrollo del fenómeno, no se pueden estudiar las causas
que lo motivan y se recurre a un estudio estadístico del mismo.
El estudio estadístico
no se refiere nunca a hechos aislados, sino a conjuntos con elevado número de
elementos.
Investigando un elevado
número de casos en los que el fenómeno ha tenido lugar se podrá predecir cómo
se verificará en el futuro.
La Estadística se refiere, en un sentido técnico, a
una rama de la Matemática aplicada que se ocupa de la interpretación de la
información numérica.
HISTORIA
Es muy difícil
establecer una cronología exacta de los orígenes de la
estadística. Parece ser que los datos más antiguos que se conocen son los
censos chinos ordenados por el emperador Tao hacia el 2200 a. de J.C.
Tácito cuenta que
Augusto mandó realizar una gran encuesta sobre las riquezas del Imperio.
Enumeró los habitantes
(censo), los soldados, los navíos y toda suerte de recursos y rentas públicas.
A lo largo de la Edad
Media y hasta principios del siglo XVII, la Estadística era puramente
descriptiva.
El Ministro del Interior
en Francia ordenó en 1801 el primer censo general de la población.
Quetelet (1796-1874)
extendió el método al estudio de cualidades físicas, morales e intelectuales de
los seres humanos.
En el siglo XX la
Estadística ha recibido un gran impulso por parte, entre otros, del ruso
Kolmogoroff y los anglosajones Pearson y Fisher.
La necesidad de disponer de la adecuada información
estadística ha hecho que cada país posea un servicio oficial de Estadística que
ayude a adoptar medidas a sus gobiernos. La elaboración de los censos de
población es una de sus misiones más importantes.
PARA INTERROGARSE
Se denomina población
al
conjunto de todos los elementos que cumplen una determinada característica, que
deseamos medir o estudiar.
Se llama individuo
a
cada uno de los elementos de la población. Una muestra
es
un subconjunto de la población, suficientemente representativa de la misma.
Si se pretende estudiar la intención de voto de los españoles, la población será el conjunto de españoles con derecho a voto y en vista de las grandes dificultades que representa el estudio de un grupo tan numeroso, se elige otro más reducido que sería una muestra. En este caso, una muestra podría ser los españoles con derecho a voto de una población.
Propón otras fórmulas para obtener una muestra.
PARA SABER LEER Y COMPRENDER
Cada una de las propiedades
(aspectos) que pueden estudiarse en los individuos de una población recibe el
nombre de carácter estadístico.
Un carácter
permite clasificar a los individuos de la población.
Un carácter
puede ser cuantitativo si se puede medir:
Ejemplo: La talla de un
individuo, el diámetro de una pieza de precisión, el número de acciones
vendidas en la Bolsa de Madrid, el coeficiente intelectual de un alumno, el
número de granos que tiene una espiga, son caracteres cuantitativos.
Un carácter
es cualitativo si no se puede medir:
Ejemplo: La profesión de tus padres, el estado civil, el color de los
ojos, la carrera que piensas estudiar, son caracteres cualitativos.
El conjunto de valores que toma un carácter estadístico cuantitativo se llama variable estadística.
Los valores que toma una variable estadística se acostumbran a representar por: x1 , x2 , x3 , . . . , xi , . . .
Una variable estadística se llama discreta cuando sólo puede tomar determinados valores (con más precisión, cuando puede tomar un número finito o infinito numerable de valores):
Son
variables discretas:
El número de empleados de
cada fábrica, el número de hijos de cada familia, el número de goles marcados
por la Selección Nacional de Fútbol en cada partido, el número de granos de cada
espiga.
Una variable estadística se
llama continua cuando puede tomar cualquiera de los infinitos valores
de un intervalo (valores tan próximos como se quiera):
Son
variables continuas:
La medida del cráneo de los recién nacidos, las temperaturas registradas
en un observatorio cada hora, el peso de cada español, la altura de todos los europeos.
Los valores de una variable continua se suelen agrupar
en intervalos, llamados intervalos de clase, para
obtener una idea más concreta de la realidad. Si los valores de una variable
discreta se clasifican por intervalos, tal
variable pasa a ser considerada continua.
Ejemplo: Si queremos medir
la altura de 100 personas, en centímetros, es conveniente agruparlas en
intervalos, por ejemplo:
[155,160); [160,165); [165,170); [175,180);
[180,1859; [185,190)
Así el recuento se hace más rápido y claro. El corchete indica que cada
intervalo incluye su extremo inferior.
El punto medio entre los extremos de
cada intervalo se llama marca de clase.
Siempre
que se agrupe una variable por intervalos se produce una pérdida de
información, pues lo que se tiene en cuenta es la pertenencia o no de cada dato
al intervalo y no su valor exacto.
Ejemplo: Se conocen las
edades de 100 personas que se encuentran entre 16 y
35 años. Podemos agrupar estos valores en intervalos
de cinco años.
Se construirán pues, los
intervalos: [16, 21) ; [21, 26) ; [26, 31) ; [31, 36)
Las marcas
de cada intervalo son: 18,5; 23,5; 28,5; 33,5
PARA PRACTICAR
En una variable estadística la frecuencia absoluta de
un determinado valor es el número de veces que la variable toma dicho
valor. Las frecuencias absolutas se suelen
ordenar en la llamada tabla de frecuencias absolutas.
Observa que el 15 aparece 9 veces;
es decir, hay 9 alumnos que tienen 15 años. La frecuencia
absoluta del valor 15.
Frecuencia relativa de un determinado valor es el cociente
entre la frecuencia absoluta de dicho valor y el número total de valores
observados.
Si multiplicamos por 100 la
frecuencia relativa de una característica obtendremos el tanto por ciento de
individuos que poseen esa característica.
Frecuencia relativa del valor 15 es 9/30 = 0.3, un 30%.
La frecuencia absoluta acumulada de un valor x de la variable es la
suma de las frecuencias absolutas de los valores de la variable menores o
iguales a x.
Para hallar la frecuencia
absoluta acumulada de 15 debemos sumar los números de
alumnos con edades 13, 14, 15 años, es decir 6 +
9 + 9 = 24.
La frecuencia absoluta acumulada de 14 es 6 + 9 = 15
Frecuencia
relativa acumulada de un determinado valor resulta de sumar a su frecuencia relativa las
frecuencias relativas de los valores anteriores.
TABLA DE FRECUENCIAS
PARA APLICAR
1. Se ha lanzado un dado
con las caras numeradas del 1 al 6 y se han obtenido los siguientes resultados:
{1, 3, 4, 3, 5, 3, 2, 6,
4, 2, 2, 1, 5, 1, 6, 3, 3, 4, 1, 5}
Efectúa el recuento y
forma la tabla estadística de las frecuencias absolutas, relativas y acumuladas.
2. Se ha lanzado una moneda
con cara (c) y cruz (x) y se han obtenido los siguientes resultados:
{c, c, c, x, c, x, x, x,
c, x, c, x, c, c, x}
Efectúa el recuento y forma la tabla estadística de
las frecuencias absolutas, relativas y acumuladas.
3. En la siguiente tabla se muestran los resultados de
una encuesta entre 100 personas, sobre sus preferencias por espectáculos.
Construye la tabla estadística de las frecuencias absolutas, relativas y acumuladas.
PARA RELACIONAR
Los gráficos son muy utilizados en
la prensa, en la televisión y en los libros para presentar los datos de una
forma más vistosa. Además, también se consigue que, de un solo vistazo, podamos
darnos cuenta de los detalles fundamentales.
Algunos de los gráficos más usados son:
diagrama de barras, histogramas, o diagrama de barras, pirámides de población, polígonos de
frecuencias, diagrama de sectores, pictogramas,…
Utilizar
los gráficos más usados en estadística para el estudio de los ejercicios del apartado anterior.
PARA PLANTEAR Y RESOLVER PROBLEMAS
Medidas de
centralización y de dispersión.
Designamos con este nombre a los números
que describen, de manera concisa, el comportamiento y las características
generales de un conjunto de
datos estadísticos. Algunas de estas
medidas son de uso corriente; así se habla de estaturas medias, de moda de
primavera, etc. Estos parámetros se agrupan en
dos categorías:
Medidas de
centralización: Media aritmética, Mediana y Moda
Medidas
de dispersión: Rango, Varianza y Desviación típica
Medidas de centralización
Media aritmética de una serie de valores
numéricos es el cociente entre la suma de todos los valores y el número total de ellos (es el valor
promedio de la distribución)
La
fórmula para calcular la media se
abrevia, utilizando un símbolo sumatorio
Ejemplo: La media
aritmética de las notas obtenidas por un estudiante en sus siete
asignaturas: {9, 7, 6, 5, 4, 3, 8} se
obtiene sumando las siete notas y dividiendo el resultado entre siete.
Mediana de una serie de valores numéricos es el valor central de los datos cuando
éstos se han dispuesto ordenadamente de menor a mayor (separa en la
distribución la mitad superior de la inferior)
Ejemplo: Las notas obtenidas por un
estudiante en una asignatura son: {5, 8, 6 , 9 , 3 , 2 , 3, 9} Los
ordenamos de menor a mayor: 2, 3, 3, 5, 6, 8, 9, 9
La mediana es la media
aritmética de 5 y 6, es
decir 5.5
Moda de una serie estadística es el valor de la
variable que presenta la mayor frecuencia absoluta (el valor que más se repite
en la distribución)
Ejemplo: Hallar la moda en un grupo de números: 2, 4, 5, 5, 5, 7, 8, 8, 9, 12
La moda es 5
Medidas de dispersión
El Rango o recorrido es el intervalo
de variación de una distribución estadística, es la diferencia
entre el mayor y el menor de los valores de la variable.
Ejemplo:
Las densidades de
población en habitantes por km2 en 1981 en las provincias gallegas y catalanas
son las que se detallan en la tabla
El recorrido
en las provincias gallegas es 192
- 41 = 151.
El recorrido
en las provincias catalanas es 597
- 30 = 567.
Es evidente que en el
primer caso los valores están más agrupados que en el segundo.
Desviación media es la media aritmética
de los valores absolutos de las diferencias de los valores de la variable
respecto a su media aritmética.
Varianza
de una
variable es la media aritmética de los cuadrados de los valores de la variable
respecto a su media aritmética.
Ejemplo: Vamos a calcular desviación media de la serie estadística formada por las horas de lectura dedicadas durante un mes por 40 personas.
La media de horas de lectura es 160/40= 4
La desviación media es 188/40 = 4,7
A la vista de la media y desviación media
podemos decir que los valores de la variable son muy dispares.
Varianza de una variable es la media aritmética de los cuadrados
de los valores de la variable respecto a su media aritmética.
Para calcular la varianza suele ser más cómoda la
fórmula equivalente
Ejemplo: El número de coches vendidos, por 10
vendedores de un concesionario durante un mes está dado en la tabla
La media es 10,6 y la
varianza es 3,236
Desviación típica se
define como la raíz cuadrada de la varianza.
En el ejercicio anterior la desviación típica 1,80
Hallar: la Media, Moda,
Mediana, Recorrido, Varianza y Desviación Típica de:
a) 5, 6, 7, 7, 8
b) 10, 12, 13, 14, 15, 19, 21
Calcular la Media, Moda, Mediana, Recorrido, Varianza y Desviación Típica
de los siguientes datos: 4, 4, 6, 5, 8, 5, 8,
11, 3, 8, 6, 8, 3, 5, 2
PARA PENSAR MÁS
REALIZAR UN TRABAJO ESTADÍSTICO
Algunas directrices a tener en cuenta:
1. Definir los objetivos del trabajo
Tener claro que aspectos de la población se pretenden estudiar, que tipos de caracteres (cuantitativos o cualitativos) y de variables (discretas o continuas) se pretenden conocer.
2. Elegir la muestra adecuada
Dado que normalmente no se podrá obtener información de la totalidad de la población, se seleccionará una parte de ésta. A este proceso se le llama muestreo y es muy importante para obtener unos resultados aproximados a la realidad que queremos conocer.
3. Elaboración de un cuestionario
Este debe ser concreto y claro. Debe contemplar todas las posibilidades de respuesta, evitando preguntas complejas, comprometedoras.
4. Recopilar datos
Para recopilar datos es necesario tener en cuenta los siguientes aspectos del proceso:
- Fijar los criterios de aplicación del cuestionario. En una encuesta, por ejemplo, no es lo mismo entrevistar a un estudiante un día ordinario en clase, que hacerlo por la calle.
- Considerar el tipo de datos: cuantitativos o cualitativos.
- Determinar el número de valores posibles que puede tomar cada carácter estadístico que pretendemos medir.
- Hacer el recuento de frecuencias.
5. Presentación de los datos
Se pueden presentar en forma de tabla o en forma de gráfico.
6. Calcular las Medidas de centralización y de dispersión
7. Interpretación del estudio realizado
8. Conclusiones.