y es el concepto que en estadística define un tipo de error por el que los resultados que se obtienen en una muestra (llamadas telefónicas) no se corresponden con los resultados que se obtienen en la población (elecciones bajo sufragio del censo).
Me llaman mucho la atención los estudios estadísticos que se publican en los medios, generalmente carecen de validez científica o esta no es comprobable. Y si digo "validez científica" me refiero a que no se puede esperar la coincidencia entre los resultados del estudio y la realidad. Los pasos para obtener resultados fiables son, a grosso modo, los siguientes:
1.- Se identifica la población de estudio y un dato o variable estadística para analizar:
a) 5000 bolitas de color blanco y negro en un bombo de las que quiero conocer sus porcentajes respectivos
b) Ciudadanos estadounidenses con derecho a voto de los que quiero conocer los porcentajes de intención de voto para Bush y Kerry (igual que blanco/negro)
2.- Se hace una "selección" de bolitas/ciudadanos que representen a la población, ya que por motivos económicos o prácticos no es posible analizar uno a uno los elementos de la población. A esta seleción se le llama muestra, al proceso de seleccionar, muestreo, y existen diversos métodos. El único fiable, el muestreo aleatorio, donde los elementos son seleccionados estrictamente al azar. Cuanto mayor sea el tamaño de la muestra, podré acercarme más al resultado real de la población. En muestras de miles de individuos se obtiene una fiabilidad casi idéntica a la que obtendríar con una población de infinitos elementos. Es necesario que la distribución de la variable sea uniforme, lo que significa que:
a) No haya zonas del bombo en las que los porcentajes de bolas blancas/negras sea sustancialmente distintos: para eso le damos unas vueltas al bombo y las revolvemos bien.
b) No haya subpoblaciones en las que predomine el voto hacia Bush o Kerry. Sé que esto no es cierto, tengo que solucionarlo de alguna manera.
3.- Entonces obtengo la muestra y la mido:
a) Extraigo 100 bolitas del bombo, y cuento sus colores: 45 negras y 55 blancas. Deduzco por inferencia estadística que las negras son el 45% y las blancas el 55% en el bombo.
b) Contacto con 5000 electores escogidos al azar ....
¿Como escogo 5000 electores al azar? Este es el mayor problema, pues no es nada fácil. Conviene hacer subdivisiones en las poblaciones, según sexo, edad, "grupo étnico", lugar de residencia (y más variables si es necesario) pues es sabido (de anteriores estudios) que en estas subpoblaciones (negros de 30 años, mujeres de 50 años de Alabama) los resultados obtenidos son significativamente distintos entre si. Al construir la muestra por azar debo intentar conservar la proporción entre todas las subpoblaciones significativas en el estudio, realizando un muestreo por estratos ya que será mucho más fiable. Pero debo aumentar el número de elementos en cada subpoblación o tendré un error mayor. Además no dispongo de un listado o censo de la población con esos datos, imprescindible para hacer un sorteo al azar, luego no será fácil obtener la misma fiabilidad
Podría entonces contratar a 100 personas que se desplacen por todos los Estados Unidos y entrevisten a cada uno de los seleccionados, pero es demasiado caro. Es mucho más barato y rápido llamar por teléfono que desplazarse in situ. Deduzco entonces que si la distribución de votantes a Bush/Kerry es la misma entre la población inicial y la subpoblación formada por los electores que tienen teléfono fijo puedo realizar el muestreo entre la población con teléfono.
¿Es igual la distribución del voto entre los que tienten teléfono?¿Se encuesta al primero que coge el teléfono o se busca una persona con cierto perfil?¿Como se mantienen las proporciones entre los distintos estratos de la población?
Estas incorrecciones son las que hacen aumentar el error entre la muestra y la realidad hasta límites inaceptables o incalculables, y hacen que los estudios carezcan de valor científico, lo que ademas no impide que puedan acertar por casualidad.
Cuentan que la primera vez que hicieron encuestas telefónicas para las presidenciales, el candidato que ganó no era el que calcularon. La gente que entonces no tenía teléfono prefería al que ganó realmente.
Se llama sesgo
(Puntos:3, Informativo)Me llaman mucho la atención los estudios estadísticos que se publican en los medios, generalmente carecen de validez científica o esta no es comprobable. Y si digo "validez científica" me refiero a que no se puede esperar la coincidencia entre los resultados del estudio y la realidad. Los pasos para obtener resultados fiables son, a grosso modo, los siguientes:
1.- Se identifica la población de estudio y un dato o variable estadística para analizar:
a) 5000 bolitas de color blanco y negro en un bombo de las que quiero conocer sus porcentajes respectivos
b) Ciudadanos estadounidenses con derecho a voto de los que quiero conocer los porcentajes de intención de voto para Bush y Kerry (igual que blanco/negro)
2.- Se hace una "selección" de bolitas/ciudadanos que representen a la población, ya que por motivos económicos o prácticos no es posible analizar uno a uno los elementos de la población. A esta seleción se le llama muestra, al proceso de seleccionar, muestreo, y existen diversos métodos. El único fiable, el muestreo aleatorio, donde los elementos son seleccionados estrictamente al azar. Cuanto mayor sea el tamaño de la muestra, podré acercarme más al resultado real de la población. En muestras de miles de individuos se obtiene una fiabilidad casi idéntica a la que obtendríar con una población de infinitos elementos. Es necesario que la distribución de la variable sea uniforme, lo que significa que:
a) No haya zonas del bombo en las que los porcentajes de bolas blancas/negras sea sustancialmente distintos: para eso le damos unas vueltas al bombo y las revolvemos bien.
b) No haya subpoblaciones en las que predomine el voto hacia Bush o Kerry. Sé que esto no es cierto, tengo que solucionarlo de alguna manera.
3.- Entonces obtengo la muestra y la mido:
a) Extraigo 100 bolitas del bombo, y cuento sus colores: 45 negras y 55 blancas. Deduzco por inferencia estadística que las negras son el 45% y las blancas el 55% en el bombo.
b) Contacto con 5000 electores escogidos al azar .... ¿Como escogo 5000 electores al azar? Este es el mayor problema, pues no es nada fácil. Conviene hacer subdivisiones en las poblaciones, según sexo, edad, "grupo étnico", lugar de residencia (y más variables si es necesario) pues es sabido (de anteriores estudios) que en estas subpoblaciones (negros de 30 años, mujeres de 50 años de Alabama) los resultados obtenidos son significativamente distintos entre si. Al construir la muestra por azar debo intentar conservar la proporción entre todas las subpoblaciones significativas en el estudio, realizando un muestreo por estratos ya que será mucho más fiable. Pero debo aumentar el número de elementos en cada subpoblación o tendré un error mayor. Además no dispongo de un listado o censo de la población con esos datos, imprescindible para hacer un sorteo al azar, luego no será fácil obtener la misma fiabilidad
Podría entonces contratar a 100 personas que se desplacen por todos los Estados Unidos y entrevisten a cada uno de los seleccionados, pero es demasiado caro. Es mucho más barato y rápido llamar por teléfono que desplazarse in situ. Deduzco entonces que si la distribución de votantes a Bush/Kerry es la misma entre la población inicial y la subpoblación formada por los electores que tienen teléfono fijo puedo realizar el muestreo entre la población con teléfono.
¿Es igual la distribución del voto entre los que tienten teléfono?¿Se encuesta al primero que coge el teléfono o se busca una persona con cierto perfil?¿Como se mantienen las proporciones entre los distintos estratos de la población?
Estas incorrecciones son las que hacen aumentar el error entre la muestra y la realidad hasta límites inaceptables o incalculables, y hacen que los estudios carezcan de valor científico, lo que ademas no impide que puedan acertar por casualidad.
Anteriormente
(Puntos:1)( http://barrapunto.com/tags/restalman | Última bitácora: Jueves, 12 Abril de 2018, 20:25h )
__
Comprare è combattere.