jueves, 14 de junio de 2012

Conceptos Básicos de Muestreo


El muestreo es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos.
Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, ejemplificar las características de la misma.

Tipos de Muestreo

Inferencia estadística


Estudia como sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

Muestreo probabilístico


Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos de muestreo:

Muestreo aleatorio simple


Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra.


Muestreo aleatorio sistemático

Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra.Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes elementos de la muestra.
2, 6, 10, 14,..., 98

Muestreo aleatorio estratificado

Se divide la población en clases o estratos y se escoge, aleatoria mente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato.En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.soluciónsoluciónsoluciónsoluciónUn muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita.En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición.Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos calcular un estadístico (media, desviación típica, proporción, ...) que variará de una a otra.Así obtenemos una distribución del estadístico que se llama distribución muestral.

Teorema del Límite Central

El teorema del límite central o teorema central del límite indica que, en condiciones muy generales, si Sn es la suma de n variables aleatorias independientes, entonces la función de distribución de Sn «se aproxima bien» a una distribución normal (también llamada distribución gaussianacurva de Gauss o campana de Gauss). Así pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes es lo suficientemente grande.

Definición

Sea \mathcal{N}(\mu,\sigma^2) la función de densidad de la distribución normal definida como
f_{\mu,\sigma^2}(x)=\tfrac{1}{\sqrt{2\pi\sigma^2}}\; e^{ -\frac{(x-\mu)^2}{2\sigma^2} },
con una media µ y una varianza σ2. El caso en el que su función de densidad es \mathcal{N}(0,1), a la distribución se le conoce como normal estándar.
Se define Sn como la suma de n variables aleatorias, independientes, idénticamente distribuidas, y con una media µ y varianza σ2 finitas (σ2≠0):
 S_n = X_1 + \cdots + X_n \,
de manera que, la media de Sn es n·µ y la varianza n·σ2, dado que son variables aleatorias independientes. Con tal de hacer más fácil la comprensión del teorema y su posterior uso, se hace una estandarización de Sn como
 Z_n\ =\ \frac{S_n - n \mu}{\sigma \sqrt{n}}
para que la media de la nueva variable sea igual a 0 y la desviación estándar sea igual a 1. Así, las variables Zn convergerán en distribución a la distribución normal estándar N(0,1), cuando n tienda a infinito. Como consecuencia, si Φ(z) es la función de distribución de N(0,1), para cada número real z:
 \lim_{n\to\infty} \operatorname{Pr}(Z_n \le z) = \Phi(z)\,
donde Pr( ) indica probabilidad y lim se refiere a límite matemático.

No hay comentarios:

Publicar un comentario