Muestreo probabilístico (aleatorio):
En este tipo de muestreo, todos los individuos de la población pueden formar parte de la muestra, tienen probabilidad positiva de formar parte de la muestra. Por lo tanto es el tipo de muestreo que deberemos utilizar en nuestras investigaciones, por ser el riguroso y científico.
Muestreo no probabilístico (no aleatorio):
En este tipo de muestreo, puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra. Por ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que no tienen teléfono o que están trabajando, no podrán formar parte de la muestra.
Muestreo aleatorio simple
En un muestreo aleatorio simple todos los individuos tienen la misma probabilidad de ser seleccionados. La selección de la muestra puede realizarse a través de cualquier mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de salir. Por ejemplo uno de estos mecanismos es utilizar una tabla de números aleatorios, o también con un ordenador generar números aleatorios, comprendidos entre cero y uno, y multiplicarlos por el tamaño de la población, este es el que vamos a utilizar.
Muestreo aleatorio estratificado
Es frecuente que cuando se realiza un estudio interese estudiar una serie de subpoblaciones (estratos) en la población, siendo importante que en la muestra haya representación de todos y cada uno de los estratos considerados. El muestreo aleatorio simple no nos garantiza que tal cosa ocurra. Para evitar esto, se saca una muestra de cada uno de los estratos.
Hay dos conceptos básicos:
Estratificación: El criterio a seguir en la formación de los estratos será formarlos de tal manera que haya la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la máxima heterogeneidad entre los estratos.
Afijación: Reparto del tamaño de la muestra en los diferentes estratos o subpoblaciones. Existen varios criterios de afijación entre los que destacamos:
1. Afijación igual: Todos los estratos tienen el mismo número de elementos en la muestra.
2. Afijación proporcional: Cada estrato tiene un número de elementos en la muestra proporcional a su tamaño.
3. Afijación Neyman: Cuando el reparto del tamaño de la muestra se hace de forma proporcional al valor de la dispersión en cada uno de los estratos.
Muestreo aleatorio sistemático
Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan según un patrón que se inicia con una elección aleatoria.
Considerando una población de N elementos, si queremos extraer una muestra de tamaño n, partimos de un número h=N/n, llamado coeficiente de elevación y tomamos un número al azar a comprendido entre 1 y h que se denomina arranque u origen.
La muestra estará formada por los elementos: a, a+h, a+2h,....a+(n-1)h.
De aqui se deduce que un elemento poblacional no podrá aparecer más de una vez en la muestra. La muestra será representativa de la población pero introduce algunos sesgos cuando la población está ordenada en función de determinados criterios.
Muestreo aleatorio por conglomerados o áreas
Mientras que en el muestreo aleatorio estratificado cada estrato presenta cierta homogeneidad, un conglomerado se considera una agrupación de elementos que presentan características similares a toda la población.
Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia de los programas y cadenas de televisión, se utiliza un muestreo por conglomerados-familias que han sido elegidas aleatoriamente.
Las familias incluyen personas de todas las edades, muy representativas de las mismas edades y preferencias que la totalidad de la población.
Una vez seleccionados aleatoriamente los conglomerados, se toman todos los elementos de cada uno para formar la muestra. En este tipo de muestreo lo que se elige al azar no son unos cuantos elementos de la población, sino unos grupos de elementos de la población previamente formados. Elegidos estos grupos o "conglomerados" en un número suficiente, se pasa posteriormente a la elección, también al azar, de los elementos que han de ser observados dentro de cada grupo, o bien, según se desee, a la observación de todos los elementos que componen los grupos elegidos.
Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia de los programas y cadenas de televisión, se utiliza un muestreo por conglomerados-familias que han sido elegidas aleatoriamente. Las familias incluyen personas de todas las edades, muy representativas de las mismas edades y preferencias que la totalidad de la población.
Una vez seleccionados aleatoriamente los conglomerados, se toman todos los elementos de cada uno para formar la muestra. En este tipo de muestreo lo que se elige al azar no son unos cuantos elementos de la población, sino unos grupos de elementos de la población previamente formados. Elegidos estos grupos o "conglomerados" en un número suficiente, se pasa posteriormente a la elección, también al azar, de los elementos que han de ser observados dentro de cada grupo, o bien, según se desee, a la observación de todos los elementos que componen los grupos elegidos.
Muestreo no Probabilístico
Existen otros procedimientos para seleccionar las muestras, que son menos precisos que los citados y que resultan menos costosos. El procedimiento más utilizado es el muestreo no probabilístico, denominado opinático consistente en que el investigador selecciona la muestra que supone sea la más representativa, utilizando un criterio subjetivo y en función de la investigación que se vaya a realizar.
Con el muestreo opinático la realización del trabajo de campo puede simplificarse enormemente pues se puede concentrar mucho la muestra. Sin embargo, al querer concentrar la muestra, se pueden cometer errores y sesgos debidos al investigador y, al tratarse de un muestreo subjetivo (según las preferencias del investigador), los resultados de la encuesta no tienen una fiabilidad estadística exacta.
Un muestreo no probabilístico muy utilizado hoy en día por los institutos de opinión es el de itinerarios, consistente en facilitar al entrevistador el perfil de las personas que tiene que entrevistar en cada uno de los itinerarios en que se realizan las entrevistas.
El muestreo denominado de cuotas, utiliza en sucesivos sondeos al mismo conjunto muestral (inicialmente seleccionado de forma aleatoria) y es el empleado para medir índices de audiencia de programas televisivos.
En muestreo se entiende por población a la totalidad del universo que interesa considerar, y que es necesario que esté bien definido para que se sepa en todo momento que elementos lo componen.
No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre población teórica: conjunto de elementos a los cuales se quieren extrapolar los resultados, y población estudiada: conjunto de elementos accesibles en nuestro estudio.
Censo: En ocasiones resulta posible estudiar cada uno de los elementos que componen la población, realizándose lo que se denomina un censo, es decir, el estudio de todos los elementos que componen la población.
La realización de un censo no siempre es posible, por diferentes motivos: a) economía: el estudio de todos los elementos que componen una población, sobre todo si esta es grande, suele ser un problema costoso en tiempo, dinero, etc.; b) que las pruebas a las que hay que someter a los sujetos sean destructivas; c) que la población sea infinita o tan grande que exceda las posibilidades del investigador.
Si la numeración de elementos, se realiza sobre la población accesible o estudiada, y no sobre la población teórica, entonces el proceso recibe el nombre de marco o espacio muestral.
Concepto de muestreo
El muestreo es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observación de sólo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos.
Muestra: En todas las ocasiones en que no es posible o conveniente realizar un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal una parte representativa de la población. Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población, ejemplificar las características de la misma.
Cuando decimos que una muestra es representativa indicamos que reúne aproximadamente las características de la población que son importantes para la investigación.
a. Población Los estadísticos usan la palabra población para referirse no sólo a personas si no a todos los elementos que han sido escogidos para su estudio.
b. Muestra Los estadísticos emplean la palabra muestra para describir una porción escogida de la población. Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones como la Media, Mediana, la moda, la desviación estándar. Cuando éstos términos describen una muestra se denominan estadísticas.
Una estadística es una característica de una muestra, los estadísticos emplean letras latinas minúsculas para denotar estadísticas y muestras.
Tipos de muestreo Los autores proponen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.
Terminología
• Población objeto: conjunto de individuos de los que se quiere obtener una información.
• Unidades de muestreo: número de elementos de la población, no solapados, que se van a estudiar. Todo miembro de la población pertenecerá a una y sólo una unidad de muestreo.
• Unidades de análisis: objeto o individuo del que hay que obtener la información.
• Marco muestral: lista de unidades o elementos de muestreo.
• Muestra: conjunto de unidades o elementos de análisis sacados del marco.
Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:
El método otorga una probabilidad conocida de integrar la muestra a cada elemento de la población, y dicha probabilidad no es nula para ningún elemento.
Los métodos de muestreo no probabilisticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.
(En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.)
Entre los métodos de muestreo probabilísticos más utilizados en investigación encontramos:
• Muestreo aleatorio simple
• Muestreo estratificado
• Muestreo sistemático
• Muestreo polietápico o por conglomerados
Muestreo aleatorio simple:
El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.
Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.
Muestreo aleatorio estratificado:
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.
Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.
Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa.
Muestreos No Probabilísticos:
• de Conveniencia
• de Juicios
• por Cuotas de Bola de Nieve Discrecional
Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.
Muestreo opinático o intencional:
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.
Muestreo casual o incidental:
Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).
Bola de nieve:
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
Muestreo Discrecional • A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio. • Ej. : muestreo por juicios; cajeros de un banco o un supermercado; etc.
EL MUESTREO POR CONVENIENCIA
Es una técnica comúnmente usada.
Consiste en seleccionar una muestra de la población por el hecho de que
sea accesible. Es decir, los individuos empleados en la investigación se
seleccionan porque están fácilmente disponibles, no porque hayan sido
seleccionados mediante un criterio estadístico. Esta conveniencia, que se suele
traducir en una gran facilidad operativa y en bajos costes de muestreo, tiene
como consecuencia la imposibilidad de hacer afirmaciones generales con rigor
estadístico sobre la población.
Por ejemplo, supongamos que
queremos conocer la opinión de los estudiantes universitarios chilenos acerca
de la política. Una muestra probabilística requeriría acceder a un censo del
total de estudiantes de todas las universidades chilenas con el fin de
seleccionar al azar un grupo de individuos y encuestarlos. Una muestra por
conveniencia podría consistir en dirigirme a 3 universidades cercanas,
simplemente porque están en la población en la que reside el encuestador, y
encuestar a unos cuantos individuos que acepten participar al salir de las
aulas por la mañana.
Las limitaciones de
este tipo de muestreo son obvias. En el ejemplo anterior, podría suceder que
diferentes tipos de universidades correlacionen con estratos sociales y con
opiniones políticas. Es más, si selecciono estudiantes de 3 universidades
concretas y los encuesto por la mañana, sus opiniones podrían ser diferentes de
las de estudiantes del turno de tarde (que tal vez trabajan al mismo tiempo que
estudian).
¿Significa lo anterior que los
resultados de una muestra por conveniencia son totalmente irrelevantes, que no
nos dicen nada de la población? No exactamente. Si tenemos buenas razones para
pensar que la selección por conveniencia no va a introducir sesgos respecto al
total de la población, los resultados que obtendré pueden ser una buena imagen
del universo estudiado. El problema es que no sabré exactamente cómo de
buena es esa imagen: no puedo usar herramientas estadísticas como el margen de error y el intervalo de confianza para medir la
precisión de mis resultados. Los lectores del estudio tendrán que confiar en
los criterios de la selección hecha por el investigador.
Los estudios clínicos
No debemos ver el muestreo por
conveniencia como un método inútil. De hecho, es habitual su uso exitoso en
muchos ámbitos. Por ejemplo, los estudios clínicos con voluntarios. En dichos
estudios, se solicita a personas con ciertas características físicas que acudan
voluntariamente para formar parte de algún tipo de investigación o incluso algún
tratamiento. El investigador clínico que usa esta técnica está considerando que
cualquier individuo que cumpla con una cierta características (por ejemplo, ser
diabético) va a ser representativo del universo. O dicho de otra manera, el
hecho de que un individuo vea o no vea la solicitud de voluntarios, acceda o no
a participar, sea de una región o de otra, etc. no va a afectar a sus
resultados en el estudio.
A diferencia del ejemplo anterior
sobre estudiantes chilenos, en el caso del estudio clínico el uso de un
muestreo por conveniencia parece apropiado y no hace pensar que se vayan a
producir sesgos en los resultados. La clave está en considerar si la
“conveniencia” en la selección realmente va a representar un sesgo.
Estudios piloto
Otro uso frecuente de este tipo
de muestreo es la realización de un estudio piloto. Una muestra por
conveniencia en una fase inicial de un proyecto nos puede dar información sobre tendencias
y resultadosque vamos a encontrar al usar una muestra probabilística. Esta
información podemos usarla para modificar el planteamiento del estudio antes de
incurrir en una técnica de muestreo más costosa.
Ventajas e inconvenientes
Dadas las características de este
tipo de muestreo, sus pros y sus contras son evidentes.
La principal virtud del
muestreo por conveniencia… ¡es su conveniencia! Simple, económico, rápido… Nos
puede dar información valiosa en muchas circunstancias, especialmente cuando no
existen razones fundamentales que diferencien a los individuos que tengo
accesibles de los que forman el total de la población.
El principal defecto,
la falta de representatividad, la imposibilidad de hacer aseveraciones
estadísticas sobre los resultados y el riesgo de incurrir en sesgos debido al
criterio de muestreo empleado. En el peor de los casos, mi muestra conveniente
puede presentar un sesgo sistemático respecto al total de la población, lo que
produciría resultados distorsionados.
Margen de error y nivel de
confianza
Es un tema que tratamos en un
post anterior. No es correcto usar muestreo por conveniencia y expresar los resultados
del estudio indicando un margen de error y un nivel de confianza.
Sin embargo, es algo que se suele hacer.
Si optas por calcular ese margen
de error, deberías indicar que no corresponde a la muestra empleada, sino a una
muestra del tamaño aleatoria simple de ese tamaño. Y, en cualquier caso,
siempre que usemos una muestra por conveniencia, deberíamos acompañar los
resultados con una descripción de cómo se ha obtenido dicha muestra para
que el lector valore qué credibilidad puede dar a los resultados.