Intervalo de confianza para la media y la proporción poblacional

En 2º de bachillerato de CCSS se estudia la forma de construir intervalos de confianza para le media (con σ\sigma conocida) y proporción poblacional. Usando LyX/LaTeX/pythontex y la librería statistics de python se han resuelto dos ejercicios, uno para la media poblacional y otro para la proporción. En este caso la cantidad de código necesaria de python es pequeño.

Partiendo de los dos ejercicios resueltos en el fichero en formato LyX, que se puede descargar al final del artículo, es fácil cambiar los datos/enunciados para disponer de un fichero que permita resolver casi todo este tipo de ejercicios para ese nivel de estudios.

Los dos ejercicios resueltos tienen de enunciado:

La longitud de los cables de auriculares que fabrica una empresa es una variable aleatoria que sigue una ley Normal con desviación típica 3.53.5 cm. Para estimar la longitud media se han medido los cables de una muestra aleatoria de 1414 auriculares y se han obtenido las siguientes longitudes, en cm:

205, 196, 202, 204, 197, 194, 196, 201, 203, 200, 202, 198, 201, 200

  1. Halla un intervalo de confianza, al 95.095.0%, para la longitud media de los cables.
  2. Determina el tamaño mínimo que debe tener una muestra de estos cables para que el error de estimación de la longitud media sea inferior a 0.750.75 cm, con un nivel de confianza del 9090%.

Se desea estimar la proporción de votantes a un determinado partido político mediante una muestra aleatoria.

  1. Si de una muestra de 600600 personas 150150 dicen que lo votan, calcule con un nivel de confianza del 99.099.0% un intervalo para la proporción de votantes a ese partido en la población.
  2. Si la proporción de votantes en otra muestra ha sido 0.30.3 y el error cometido en la estimación ha sido inferior a 0.050.05, con un nivel de confianza del 95.095.0%, calcule el tamaño mínimo de dicha muestra.

Y se resuelven a partir de los datos:

  • Para el primer problema:

    #Datos del problema
    #Desviación típica
    dt=3.5
    
    #Valores
    datos=np.array([205, 196, 202, 204, 197, 194, 196, 201, 203, 200, 202, 198, 201, 200])
    #Si se opta por dar la media de la muestra solo hay que ponerla aquí
    #y comentar la parte de Cálculos para el array
    #x=
    #n=
    
    #Niveles de confianza
    nc=0.95
    nc1=0.90
    
    #Error del segundo apartado
    e=0.75
    
  • Para el segundo problema:

    #tamaño de la muestra
    n=600
    #nº de personas que sí
    nv=150
    
    #Nivel confianza primer apartado
    nc= 0.99
    
    #Datos segundo apartado
    pm1=0.3
    ee=0.05
    nc1=0.95
    

Esos valores de entrada se pueden cambiar en el código python y de esa forma poder obtener soluciones o ejercicios diferentes con sólo cambiar un poco el enunciado del problema.

Para los datos que se muestran en los enunciados anteriores, la solución que se obtiene al compilar el fichero LyX es similar a:

Ejercicio 1

Tenemos los datos: σ=3.5\sigma=3.5 y n=14n=14

  1. Calculamos la media a partir de los datos que nos facilitan y sale Xˉ=xin=279914=199.929\bar{X}=\dfrac{\sum x_{i}}{n}=\dfrac{2799}{14}=199.929

    1α=0.95α=0.05α2=0.052=0.0251α2=10.025=0.975P(Z<z0.975)=0.975z0.9751.96\begin{aligned} 1-\alpha & =0.95\Rightarrow\alpha=0.05\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.05}{2}=0.025\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.025=0.975\Rightarrow P(Z<z_{0.975})=0.975\Rightarrow\\ & z_{0.975}\simeq1.96\end{aligned}E=z1α2σn=1.963.514=1.833E=z_{1-\frac{\alpha}{2}}\cdot\dfrac{\sigma}{\sqrt{n}}=1.96\cdot\dfrac{3.5}{\sqrt{14}}=1.833

    Por tanto el intervalo pedido es de la forma:

    (XˉE,Xˉ+E)=(199.9291.833,199.929+1.833)==(198.096,201.762)\begin{aligned} (\bar{X}-E,\,\bar{X}+E) & =(199.929-1.833,199.929+1.833)=\\ = & (198.096,\,201.762)\end{aligned}
  2. Nos piden nn

    1α=0.9α=0.1α2=0.12=0.051α2=10.05=0.95P(Z<z0.95)=0.95z0.951.645\begin{aligned} 1-\alpha & =0.9\Rightarrow\alpha=0.1\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.1}{2}=0.05\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.05=0.95\Rightarrow P(Z<z_{0.95})=0.95\Rightarrow\\ & z_{0.95}\simeq1.645\end{aligned}E=z1α2σn=1.6453.5n<0.75n>1.6453.50.75=7.677n>7.6772=58.936n=59\begin{aligned} E & =z_{1-\frac{\alpha}{2}}\cdot\dfrac{\sigma}{\sqrt{n}}=1.645\cdot\dfrac{3.5}{\sqrt{n}}<0.75\Rightarrow\sqrt{n}>\dfrac{1.645\cdot3.5}{0.75}=7.677\\ \Rightarrow & n>7.677^{2}=58.936\,\Rightarrow n=59\end{aligned}

    auriculares.

Ejercicio 2

  1. Tenemos los datos:

    n=600n=600\Rightarrowp^=150600=0.25\hat{p}=\dfrac{150}{600}=0.25\Rightarrow q^=1p^=10.25=0.75\hat{q}=1-\hat{p}=1-0.25=0.75

    Como pp es desconocido opto por tomar p=p^=0.25p=\hat{p}=0.25 y q=q^=0.75q=\hat{q}=0.75

    1α=0.99α=0.01α2=0.012=0.0051α2=10.005=0.995P(Z<z0.995)=0.995z0.9952.5758\begin{aligned} 1-\alpha & =0.99\Rightarrow\alpha=0.01\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.01}{2}=0.005\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.005=0.995\Rightarrow P(Z<z_{0.995})=0.995\Rightarrow\\ & z_{0.995}\simeq2.5758\end{aligned}E=z1α2pqn=2.57580.250.75600=0.0455E=z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{pq}{n}}=2.5758\cdot\sqrt{\dfrac{0.25\cdot0.75}{600}}=0.0455

    Por tanto el intervalo pedido es de la forma:

    (p^E,p^+E)=(0.250.0455,0.25+0.0455)=(0.2045,0.2955)\begin{aligned} (\hat{p}-E,\,\hat{p}+E) & =(0.25-0.0455,0.25+0.0455)=\\ & (0.2045,\,0.2955)\end{aligned}

    Que en %\% es (20.45,29.55)\left(20.45,\,\,29.55\right)

  2. Como pp es desconocido opto por tomar p=p^=0.3p=\hat{p}=0.3 y q=q^=0.7q=\hat{q}=0.7

    1α=0.95α=0.05α2=0.052=0.0251α2=10.025=0.975P(Z<z0.975)=0.975z0.9751.96\begin{aligned} 1-\alpha & =0.95\Rightarrow\alpha=0.05\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.05}{2}=0.025\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.025=0.975\Rightarrow P(Z<z_{0.975})=0.975\Rightarrow\\ & z_{0.975}\simeq1.96\end{aligned}E=z1α2pqnn>z1α2pqE=1.960.30.70.05=17.9637n>322.6945n=323\begin{aligned} E & =z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{pq}{n}}\Rightarrow\sqrt{n}>\dfrac{z_{1-\frac{\alpha}{2}}\cdot\sqrt{p\cdot q}}{E}=\dfrac{1.96\cdot\sqrt{0.3\cdot0.7}}{0.05}=17.9637\\ \Rightarrow & n>322.6945\Rightarrow n=323\end{aligned}