Ejercicios de distribuciones de muestreo: medias y proporciones

Voy a mostrar un par de ejercicios de distribuciones de muestreo, uno para la distribución de medias muestrales y otro para la distribución de proporciones. Para realizarlo con LyX/pythontex hago uso de scipy.stats para calcular las probabilidades y de numpy y matplotlib para realizar los gráficos.

Para obtener las probabilidades de la distribución normal, al contrario que en otras entradas anteriores en las que usé sympy, he optado por usar scipy.stats. Si se compara con el código del artículo Ejercicio de cálculo de probabilidades con la distribución normal se pueden analizar los cambios entre ambos y optar para realizar ambos de la forma que más nos guste. El optar por scipy.stats también hace que cambie un poco respecto del artículo de la distribución normal el código usado para realizar las gráficas que ilustran la forma en que se obtienen las probabilidades pedidas.

Para realizar los dos ejercicios solo hay que tener en cuenta loa datos de entrada:

  • Primer ejercicio de medias muestrales:

    # redondeo
    r = 4
    # valores para trabajar
    me = 8
    varp = 7.29
    n = 36
    # valores para calcular la probabilidad
    # debe ser el primero menor que la media y el segundo mayor que ella
    izq = 7.82
    der = 8.36
    
  • Segundo ejercicio de proporciones muestrales:

    # redondeo
    r = 4
    # valores para trabajar
    # proporción poblacional y tamaño muestral
    p = 0.05
    n = 400
    
    # valor para calcular la probabilidad del primer apartado, debe ser mayor que p
    pt = 0.06
    
    # valor para calcular la probabilidad del segundo apartado, debe ser menor que p
    pt1 = 0.03
    

Para los datos anteriores se obtiene dos enunciados del tipo:

Ejercicios

  1. El número de horas semanales que los estudiantes de Bachillerato de una ciudad dedican a la redes sociales se distribuye según una ley Normal de media \(8\) y varianza \(7.29\).
    1. Para muestras de tamaño \(36\), indique cuál es la distribución de las medias muestrales.
    2. ¿Cuál es la probabilidad de que la media de una muestra de tamaño \(36\), esté comprendida entre \(7.82\) y \(8.36\) horas?
  2. Una empresa le ha encargado a una imprenta que le haga tarjetas de visita. Esta imprenta suele imprimir un \(5.0\)% de tarjetas defectuosas. Si han encargado \(400\) tarjetas:
    1. ¿Cuál es la probabilidad de que reciban más del \(6.0\)% de tarjetas defectuosas?
    2. ¿Cuál es la probabilidad de que reciban menos de un \(3.0\)% de tarjetas defectuosas?

y se obtiene de solución:

Solución

    1. Como \(\sigma^{2}=7.29\Rightarrow\sigma=\sqrt{7.29}\approx2.7\). Por tanto

      \begin{equation*} \bar{X}\rightsquigarrow N(\mu,\sigma_{\bar{x}}=\dfrac{\sigma}{\sqrt{n}})=N\left(8{\displaystyle \,,\,\frac{\sqrt{7.29}}{\sqrt{36}}}=\dfrac{2.7}{6.0}\right){\displaystyle =N\left(8\,;\,0.45\right)} \end{equation*}
    2. \begin{equation*} P\left(7.82\leq\bar{X}\leq8.36\right)={\displaystyle P\left(\frac{7.82-8}{0.45}\leq Z\leq\frac{8.36-8}{0.45}\right)} \end{equation*}
      \begin{equation*} =P(-0.4\leq Z\leq0.8)=P(Z\leq0.8)-P(Z\leq-0.4) \end{equation*}

      Como

      \begin{equation*} P(Z\leq0.8)=0.7881 \end{equation*}

      image

      y

      \begin{align*} P(Z\leq-0.4)=P(Z>0.4)=1-P(Z<0.4)=\\=1-0.6554=0.3446 \end{align*}

      image1image2image3

      tenemos que

      \begin{align*} P\left(7.82\leq\bar{X}\leq8.36\right)=P(Z\leq0.8)-P(Z\leq-0.4)=\\0.7881-0.3446=0.4435 \end{align*}

      image4

  1. Llamamos distribución muestral de proporciones a la distribución de los valores de \(\hat{P}\). La variable aleatoria \(\hat{P}\)  tiene las siguientes características:

    • La media es: \(\mu=p\).
    • La desviación típica es: \(\sigma_{\hat{P}}=\sqrt{\frac{\mathit{pq}}{n}}\), siendo \(q=1-p\).
    • Para muestras donde \(n\geq30\) y \(p\) no cercano a 0 ni 1, la distribución de \(\hat{P}\)  se aproxima a una distribución normal \(N\left(p,\,\sqrt{\frac{\mathit{pq}}{n}}\right)\).

    En este caso:

    \(n=400\ge30\)  y \(p=0.05\Rightarrow\,q=1-0.05=0.95\Rightarrow \\ p\cdot q=0.05\cdot0.95=0.0475\)

    \(\hat{P}\hookrightarrow N(p,\sqrt{\frac{\mathit{pq}}{n}})=N(0.05\,;\,\sqrt{\frac{0.0475}{400}})=N\left(0.05\,;\,0.0109\right)\)

    Nos piden:

    1. \(P\left(\hat{P}\ge0.06\right)=P\left({\displaystyle \frac{\hat{P}-0.05}{0.0109}}\ge{\displaystyle \frac{0.06-0.05}{0.0109}}\right)=\)

      \(=P\left(Z\ge0.9174\right)=1-P\left(Z<0.9174\right)=1-0.8205=\\=0.1795\)

      image5image6

    2. \(P\left(\hat{P}<0.03\right)=P\left({\displaystyle \frac{\hat{P}-0.05}{0.0109}}<\frac{{\displaystyle 0.03-0.05}}{{\displaystyle 0.0109}}\right)\\=P\left(Z<-1.8349\right)=\)

      \(=P\left(Z>1.8349\right)=1-P\left(Z<1.8349\right)=1-0.1795=\\=0.8205\)

      image7image8image9

Fichero fuente y el pdf final de una posible compilación con los datos de entrada anteriores.