En esta ocasión se trata de realizar un ejercicio tipo del título del artículo. Para ello se usa pandas para crear las tablas de frecuencias y hacer los cálculos. Para realizar los gráficos se ha usado matplotlib (gráfico de barras y de sectores) y tikz para dibujar el semicírculo graduado.
Fichero en formato LyX con el código python necesario para hacerlo. Para compilarlo puede ser necesario eliminar las dos líneas que contienen
\IfFileExists{fichero.svg}{\includesvg{fichero.svg}}{}
y una vez realizada la primera compilación volver a ponerlas para obtener el pdf final.
Fichero en formato pdf que se obtiene como resultado de compilar el fichero anterior. El fichero en formato pdf organiza los gráficos con el entorno minipágina a diferencia del resultado que se pone en formato html.
En el fichero LyX solo se tiene que cambiar la línea:
#datos del problema datos=[2, 1, 3, 1, 1, 0, 0, 3, 0, 1, 4, 2, 1, 0, 0, 0, 1, 1, 2, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 1, 3, 2 ]
para obtener como resultado:
Una pequeña empresa de seguros está realizando un estudio de los accidentes de tráfico que han tenido sus asegurados en el último mes, con intención de revisar el precio de las primas. Ha elegido aleatoriamente asegurados y obtenido los siguientes datos
2, 1, 3, 1, 1, 0, 0, 3, 0, 1, 4, 2, 1, 0, 0, 0, 1, 1, 2, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 1, 3, 2
- Completa la tabla de frecuencias
- Representa la distribución utilizando un diagrama de barras
- Representa la distribución utilizando un diagrama de sectores
- Calcula las medidas de centralización: moda, mediana y media.
- Calcula las medidas de dispersión: rango, desviación típica y coeficiente de variación.
Solución
valores que toma la variable
frecuencia absoluta: número de veces que aparece un determinado resultado de la variable estadística entre todos los datos que se han recogido
frecuencia absoluta acumulada: suma de todas las frecuencias absolutas de ese resultado y todos lo que están antes que él.
frecuencia relativa: cociente entre su frecuencia absoluta y el número total de datos.
frecuencia relativa acumulada: suma de las frecuencia relativa del resultado y de todos los anteriores.
porcentaje
0.0 20.0 20.0 0.500 0.500 50.0 1.0 11.0 31.0 0.275 0.775 27.5 2.0 5.0 36.0 0.125 0.900 12.5 3.0 3.0 39.0 0.075 0.975 7.5 4.0 1.0 40.0 0.025 1.000 2.5 Representa la distribución utilizando un diagrama de barras
Representa la distribución utilizando un diagrama de sectores
En primer lugar tendremos que obtener al ángulo de cada sector, teniendo en cuenta que . Podemos usar la tabla de frecuencias y añadir una última columna para la amplitud del ángulo de cada sector circular:
Ángulo 0.0 20.0 20.0 0.500 0.500 50.0 180.0 1.0 11.0 31.0 0.275 0.775 27.5 99.0 2.0 5.0 36.0 0.125 0.900 12.5 45.0 3.0 3.0 39.0 0.075 0.975 7.5 27.0 4.0 1.0 40.0 0.025 1.000 2.5 9.0 Diagrama de sectores
Transportador de ángulos
Calcula las medidas de centralización: moda, mediana y media.
moda: valor que más se repite entre los datos de que disponemos
mediana: si suponemos que los datos están ordenados numéricamente de menor a mayor, es el valor que está en el centro, es decir, el valor que tiene por delante la mitad de los valores y por detrás la otra mitad.
media (aritmética): suma de todos los valores obtenidos y divididos entre el número total de datos.
Para las dos primera nos basaremos en la tabla de frecuencias.
, ya que y tenemos que coger la media aritmética de los valores que están en la posición nº y
0 20 0 0 1 11 11 11 2 5 10 20 3 3 9 27 4 1 4 16 40 34 74 A partir de la tabla tenemos que:
Calcula las medidas de dispersión: rango, desviación típica y coeficiente de variación.
rango: diferencia entre el mayor y el menor valor de la variable
varianza: media aritmética de los cuadrados de las diferencias entre los valores de la variable y la media.
desviación típica: raíz cuadrada de la varianza.
coeficiente de variación: es un número neutro, es decir, no está referido a ninguna medida. Por ello nos permite comparar datos correspondientes a elementos distintos.
- rango: