Intervalo de confianza para la media y la proporción poblacional

En 2º de bachillerato de CCSS se estudia la forma de construir intervalos de confianza para le media (con \(\sigma\) conocida) y proporción poblacional. Usando LyX/LaTeX/pythontex y la librería statistics de python se han resuelto dos ejercicios, uno para la media poblacional y otro para la proporción. En este caso la cantidad de código necesaria de python es pequeño.

Partiendo de los dos ejercicios resueltos en el fichero en formato LyX, que se puede descargar al final del artículo, es fácil cambiar los datos/enunciados para disponer de un fichero que permita resolver casi todo este tipo de ejercicios para ese nivel de estudios.

Los dos ejercicios resueltos tienen de enunciado:

La longitud de los cables de auriculares que fabrica una empresa es una variable aleatoria que sigue una ley Normal con desviación típica \(3.5\) cm. Para estimar la longitud media se han medido los cables de una muestra aleatoria de \(14\) auriculares y se han obtenido las siguientes longitudes, en cm:

205, 196, 202, 204, 197, 194, 196, 201, 203, 200, 202, 198, 201, 200

  1. Halla un intervalo de confianza, al \(95.0\)%, para la longitud media de los cables.
  2. Determina el tamaño mínimo que debe tener una muestra de estos cables para que el error de estimación de la longitud media sea inferior a \(0.75\) cm, con un nivel de confianza del \(90\)%.

Se desea estimar la proporción de votantes a un determinado partido político mediante una muestra aleatoria.

  1. Si de una muestra de \(600\) personas \(150\) dicen que lo votan, calcule con un nivel de confianza del \(99.0\)% un intervalo para la proporción de votantes a ese partido en la población.
  2. Si la proporción de votantes en otra muestra ha sido \(0.3\) y el error cometido en la estimación ha sido inferior a \(0.05\), con un nivel de confianza del \(95.0\)%, calcule el tamaño mínimo de dicha muestra.

Y se resuelven a partir de los datos:

  • Para el primer problema:

    #Datos del problema
    #Desviación típica
    dt=3.5
    
    #Valores
    datos=np.array([205, 196, 202, 204, 197, 194, 196, 201, 203, 200, 202, 198, 201, 200])
    #Si se opta por dar la media de la muestra solo hay que ponerla aquí
    #y comentar la parte de Cálculos para el array
    #x=
    #n=
    
    #Niveles de confianza
    nc=0.95
    nc1=0.90
    
    #Error del segundo apartado
    e=0.75
    
  • Para el segundo problema:

    #tamaño de la muestra
    n=600
    #nº de personas que sí
    nv=150
    
    #Nivel confianza primer apartado
    nc= 0.99
    
    #Datos segundo apartado
    pm1=0.3
    ee=0.05
    nc1=0.95
    

Esos valores de entrada se pueden cambiar en el código python y de esa forma poder obtener soluciones o ejercicios diferentes con sólo cambiar un poco el enunciado del problema.

Para los datos que se muestran en los enunciados anteriores, la solución que se obtiene al compilar el fichero LyX es similar a:

Ejercicio 1

Tenemos los datos: \(\sigma=3.5\) y \(n=14\)

  1. Calculamos la media a partir de los datos que nos facilitan y sale \(\bar{X}=\dfrac{\sum x_{i}}{n}=\dfrac{2799}{14}=199.929\)

    \begin{equation*} \begin{aligned} 1-\alpha & =0.95\Rightarrow\alpha=0.05\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.05}{2}=0.025\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.025=0.975\Rightarrow P(Z<z_{0.975})=0.975\Rightarrow\\ & z_{0.975}\simeq1.96\end{aligned} \end{equation*}
    \begin{equation*} E=z_{1-\frac{\alpha}{2}}\cdot\dfrac{\sigma}{\sqrt{n}}=1.96\cdot\dfrac{3.5}{\sqrt{14}}=1.833 \end{equation*}

    Por tanto el intervalo pedido es de la forma:

    \begin{equation*} \begin{aligned} (\bar{X}-E,\,\bar{X}+E) & =(199.929-1.833,199.929+1.833)=\\ = & (198.096,\,201.762)\end{aligned} \end{equation*}
  2. Nos piden \(n\)

    \begin{equation*} \begin{aligned} 1-\alpha & =0.9\Rightarrow\alpha=0.1\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.1}{2}=0.05\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.05=0.95\Rightarrow P(Z<z_{0.95})=0.95\Rightarrow\\ & z_{0.95}\simeq1.645\end{aligned} \end{equation*}
    \begin{equation*} \begin{aligned} E & =z_{1-\frac{\alpha}{2}}\cdot\dfrac{\sigma}{\sqrt{n}}=1.645\cdot\dfrac{3.5}{\sqrt{n}}<0.75\Rightarrow\sqrt{n}>\dfrac{1.645\cdot3.5}{0.75}=7.677\\ \Rightarrow & n>7.677^{2}=58.936\,\Rightarrow n=59\end{aligned} \end{equation*}

    auriculares.

Ejercicio 2

  1. Tenemos los datos:

    \(n=600\Rightarrow\)\(\hat{p}=\dfrac{150}{600}=0.25\Rightarrow\) \(\hat{q}=1-\hat{p}=1-0.25=0.75\)

    Como \(p\) es desconocido opto por tomar \(p=\hat{p}=0.25\) y \(q=\hat{q}=0.75\)

    \begin{equation*} \begin{aligned} 1-\alpha & =0.99\Rightarrow\alpha=0.01\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.01}{2}=0.005\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.005=0.995\Rightarrow P(Z<z_{0.995})=0.995\Rightarrow\\ & z_{0.995}\simeq2.5758\end{aligned} \end{equation*}
    \begin{equation*} E=z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{pq}{n}}=2.5758\cdot\sqrt{\dfrac{0.25\cdot0.75}{600}}=0.0455 \end{equation*}

    Por tanto el intervalo pedido es de la forma:

    \begin{equation*} \begin{aligned} (\hat{p}-E,\,\hat{p}+E) & =(0.25-0.0455,0.25+0.0455)=\\ & (0.2045,\,0.2955)\end{aligned} \end{equation*}

    Que en \(\%\) es \(\left(20.45,\,\,29.55\right)\)

  2. Como \(p\) es desconocido opto por tomar \(p=\hat{p}=0.3\) y \(q=\hat{q}=0.7\)

    \begin{equation*} \begin{aligned} 1-\alpha & =0.95\Rightarrow\alpha=0.05\Rightarrow\dfrac{\alpha}{2}=\dfrac{0.05}{2}=0.025\Rightarrow\\ & 1-\dfrac{\alpha}{2}=1-0.025=0.975\Rightarrow P(Z<z_{0.975})=0.975\Rightarrow\\ & z_{0.975}\simeq1.96\end{aligned} \end{equation*}
    \begin{equation*} \begin{aligned} E & =z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{pq}{n}}\Rightarrow\sqrt{n}>\dfrac{z_{1-\frac{\alpha}{2}}\cdot\sqrt{p\cdot q}}{E}=\dfrac{1.96\cdot\sqrt{0.3\cdot0.7}}{0.05}=17.9637\\ \Rightarrow & n>322.6945\Rightarrow n=323\end{aligned} \end{equation*}