En el libro How to Lie with Statistics [amazon.co.uk] (Cómo mentir con las Estadísticas) se explica bastante bien lo fácil que es mentir o equivocarse al hacer estadísticas. Es un libro muy interesante y que ayuda a comprender mejor la información que presentan los periódicos o las noticias de TV.
Entrevistas que se realizan en la calle en horas en que la mayoría de personas trabajan. Estadísticas que no se realizan en los barrios pobres porque se consideran menos importantes. etc. Aquí [lamolina.edu.pe] podeis ver un ejemplo de "mentira" estadística.
por
pobrecito hablador
el Sábado, 02 Octubre de 2004, 06:38h
(#364207)
No te preocupes, si esos usuarios de telefonía móvil votan se notará el 2-N.
Pero para guapos ZP. En su visita al primer ministro británico los periodistas le preguntaron a Blair qué es lo que podía destacar del nuevo primer ministro español. Blair se quedó pensativo y luego dijo:
"Mi esposa dice que es más guapo que yo".
ZP sonrió ingenuo y complacido. A
Alguien después de la rueda de prensa, con algunaos dedos de frente más, le dijo a ZP que lo que le habían llamado es tonto, porque sólo pudieron destacar de él como político su "belleza"... evidentemente la cena posterior a la reunión fué suspendida sin que ninguna de las partes anunciara las razones.
Y es que en la política no todos sienten el flechazo de Bush y Aznar.
Yo sigo pensando que en EE.UU puede pasar como en España, que las encuestas daban como claro vencedor al partido gobernante y después las urnas dijeron todo lo contrario, o podría ser que no, pero claro, la esperanza es lo último que se pierde :-)
--
FDO. ER_MELENAS
No te preguntes sólo qué puede hacer el S.L. por ti, sino también qué puedes hacer tú por él
Es celebre una encuesta que se hizo durante lo mas crudo de la epoca Franquista en la que resulto (sin trampa ni carton) que los Españoles tenian el mejor nivel de vida, sino del mundo, al mayor nivel Europeo. La encuesta se hizo por via telefonica en una epoca en la que solo los ricos tenian telefono :D ,por supuesto.
y es el concepto que en estadística define un tipo de error por el que los resultados que se obtienen en una muestra (llamadas telefónicas) no se corresponden con los resultados que se obtienen en la población (elecciones bajo sufragio del censo).
Me llaman mucho la atención los estudios estadísticos que se publican en los medios, generalmente carecen de validez científica o esta no es comprobable. Y si digo "validez científica" me refiero a que no se puede esperar la coincidencia entre los resultados del estudio y la realidad. Los pasos para obtener resultados fiables son, a grosso modo, los siguientes:
1.- Se identifica la población de estudio y un dato o variable estadística para analizar:
a) 5000 bolitas de color blanco y negro en un bombo de las que quiero conocer sus porcentajes respectivos
b) Ciudadanos estadounidenses con derecho a voto de los que quiero conocer los porcentajes de intención de voto para Bush y Kerry (igual que blanco/negro)
2.- Se hace una "selección" de bolitas/ciudadanos que representen a la población, ya que por motivos económicos o prácticos no es posible analizar uno a uno los elementos de la población. A esta seleción se le llama muestra, al proceso de seleccionar, muestreo, y existen diversos métodos. El único fiable, el muestreo aleatorio, donde los elementos son seleccionados estrictamente al azar. Cuanto mayor sea el tamaño de la muestra, podré acercarme más al resultado real de la población. En muestras de miles de individuos se obtiene una fiabilidad casi idéntica a la que obtendríar con una población de infinitos elementos. Es necesario que la distribución de la variable sea uniforme, lo que significa que:
a) No haya zonas del bombo en las que los porcentajes de bolas blancas/negras sea sustancialmente distintos: para eso le damos unas vueltas al bombo y las revolvemos bien.
b) No haya subpoblaciones en las que predomine el voto hacia Bush o Kerry. Sé que esto no es cierto, tengo que solucionarlo de alguna manera.
3.- Entonces obtengo la muestra y la mido:
a) Extraigo 100 bolitas del bombo, y cuento sus colores: 45 negras y 55 blancas. Deduzco por inferencia estadística que las negras son el 45% y las blancas el 55% en el bombo.
b) Contacto con 5000 electores escogidos al azar....
¿Como escogo 5000 electores al azar? Este es el mayor problema, pues no es nada fácil. Conviene hacer subdivisiones en las poblaciones, según sexo, edad, "grupo étnico", lugar de residencia (y más variables si es necesario) pues es sabido (de anteriores estudios) que en estas subpoblaciones (negros de 30 años, mujeres de 50 años de Alabama) los resultados obtenidos son significativamente distintos entre si. Al construir la muestra por azar debo intentar conservar la proporción entre todas las subpoblaciones significativas en el estudio, realizando un muestreo por estratos ya que será mucho más fiable. Pero debo aumentar el número de elementos en cada subpoblación o tendré un error mayor. Además no dispongo de un listado o censo de la población con esos datos, imprescindible para hacer un sorteo al azar, luego no será fácil obtener la misma fiabilidad
Podría entonces contratar a 100 personas que se desplacen por todos los Estados Unidos y entrevisten a cada uno de los seleccionados, pero es demasiado caro. Es mucho más barato y rápido llamar por teléfono que desplazarse in situ. Deduzco entonces que si la distribución de votantes a Bush/Kerry es la misma entre la población inicial y la subpoblación formada por los electores que tienen teléfono fijo puedo realizar el muestreo entre la población con teléfono.
¿Es igual la distribución del voto entre los que tienten teléfono?¿Se encuesta al primero que coge el teléfono o se busca una persona con cierto perfil?¿Como se mantienen las proporciones entre los distintos estratos de la población?
Estas incorrecciones son las que hacen aumentar el error entre la muestra y la realidad hasta límites inaceptables o in
Cuando se quiere obtener realmente una información útil y mas o menos real de un informe estadístico es necesario tener acceso al tamaño muestral, prodecencia de la muestra, método de muestreo, forma de obtención de los datos, análisis estadísticos que se han realizado, posibles implicaciones de los estadísticos y personas que han obtenido los datos con el tema que se está analizando, etc.
Es la única forma válida de extraer alguna conclusión. Leer sólo los resultados y ver gráficos no es suficiente.
--
- "No sabían que era imposible, por eso lo hicieron"
Hay dos problemas con esta noticia. La primera es que supone que a Kerry le votan más los jóvenes, cuando en realidad Kerry sale ganador sólo en el segmento de "mediana edad", mientras que Bush gana en jóvenzuelos y viejetes. El segundo es que supone que un sesgo determinado de la estadística no se corrije después. Eso es falso; es lo que se llama "cocina" y se hace en todas las encuestas. Muchas preguntas se hacen con intención de corregir ese sesgo.
Precisamente, si os acordáis, Pepe Blanco se quejaba de que había un "exceso de cocina" en el CIS. Cuando cambió el gobierno y con él el director del CIS, cumplieron su palabra y dieron diferencias brutales en la europeas que no se produjeron, además de indicar que la participación iba a superar las de las generales. No tener "cocina" lleva a estos fallejos.
En el caso del que estamos hablando, si a las empresas les salen menos jóvenes por lo del móvil, lo que hacen es aumentar el peso de las respuestas de esos jóvenes para hacerlo coincidir con el porcentaje esperado de voto en ese segmento de población. Es decir, que si pregunta a 800 mayores de 30 años y 200 menores de esa edad y se calcula (ahí es donde está la cocina y el mayor margen de error) que el 30% de los votantes serán menores de 30, se reduce el peso de los 800 y se aumenta el de los 200.
-- Daniel Rodríguez (redliberal.com, liberalismo.org, juandemariana.org)
Bueno, no se han hecho siempre las encuestas por teléfono fijo, desde luego. Otra cosa es que ahora esté muy extendido.
Por otro lado, si mi memoria no me falla, hay ya más móviles que fijos en España y el porcentaje de personas que no tienen fijo no es despreciable (¿Cuántos casos de personas que comparten el coste de un piso has visto en que no hay teléfono fijo? Yo, unos cuantos, sobre todo cuando se trata de estudiantes).
Reconozco que el artículo probablemente no proporcione mucha información nueva a algunos barrapunteros (como yo), pero siempre hay gente que no ha tenido la oportunidad de saber qué falla en las encuestas que se publican (cuando fallan), y algunos de los comentarios de esta noticia son bastante informativos (no, los de el hilo de Zapatero y Blair no lo son, sobre todo cuando derivan siempre hacia los mismos asuntos debatidos ya hasta el aburrimiento).
-- Marcos (cualquier parecido con la coincidencia es pura realidad)
yo tambien
(Puntos:3, Divertido)( http://barrapunto.com/ | Última bitácora: Domingo, 18 Febrero de 2007, 19:36h )
Además eso no es algo nuevo, Aznar era mas feo por los moviles, el "pasalo" en realidad quería decir "pasa de el" ;)
When penguins Ruled the Earth
Como mentir con las estadísticas
(Puntos:3, Informativo)( http://vidaartificial.com/blog | Última bitácora: Miércoles, 10 Octubre de 2007, 20:48h )
Entrevistas que se realizan en la calle en horas en que la mayoría de personas trabajan. Estadísticas que no se realizan en los barrios pobres porque se consideran menos importantes. etc.
Aquí [lamolina.edu.pe] podeis ver un ejemplo de "mentira" estadística.
Mi blog: Vida Artificial [vidaartificial.com]
ZP si que es guapo.
(Puntos:1, FueraDeTema)Pero para guapos ZP. En su visita al primer ministro británico los periodistas le preguntaron a Blair qué es lo que podía destacar del nuevo primer ministro español. Blair se quedó pensativo y luego dijo:
"Mi esposa dice que es más guapo que yo".
ZP sonrió ingenuo y complacido. A
Alguien después de la rueda de prensa, con algunaos dedos de frente más, le dijo a ZP que lo que le habían llamado es tonto, porque sólo pudieron destacar de él como político su "belleza"... evidentemente la cena posterior a la reunión fué suspendida sin que ninguna de las partes anunciara las razones.
Y es que en la política no todos sienten el flechazo de Bush y Aznar.
Saludos.
Yo sigo pensando....
(Puntos:3, Inspirado)( http://www.kdehispano.org/ | Última bitácora: Viernes, 16 Septiembre de 2011, 21:31h )
Yo sigo pensando que en EE.UU puede pasar como en España, que las encuestas daban como claro vencedor al partido gobernante y después las urnas dijeron todo lo contrario, o podría ser que no, pero claro, la esperanza es lo último que se pierde :-)
FDO. ER_MELENAS
No te preguntes sólo qué puede hacer el S.L. por ti, sino también qué puedes hacer tú por él
Ya paso en España.
(Puntos:2, Interesante)( Última bitácora: Viernes, 03 Febrero de 2012, 15:18h )
Se llama sesgo
(Puntos:3, Informativo)Me llaman mucho la atención los estudios estadísticos que se publican en los medios, generalmente carecen de validez científica o esta no es comprobable. Y si digo "validez científica" me refiero a que no se puede esperar la coincidencia entre los resultados del estudio y la realidad. Los pasos para obtener resultados fiables son, a grosso modo, los siguientes:
1.- Se identifica la población de estudio y un dato o variable estadística para analizar:
a) 5000 bolitas de color blanco y negro en un bombo de las que quiero conocer sus porcentajes respectivos
b) Ciudadanos estadounidenses con derecho a voto de los que quiero conocer los porcentajes de intención de voto para Bush y Kerry (igual que blanco/negro)
2.- Se hace una "selección" de bolitas/ciudadanos que representen a la población, ya que por motivos económicos o prácticos no es posible analizar uno a uno los elementos de la población. A esta seleción se le llama muestra, al proceso de seleccionar, muestreo, y existen diversos métodos. El único fiable, el muestreo aleatorio, donde los elementos son seleccionados estrictamente al azar. Cuanto mayor sea el tamaño de la muestra, podré acercarme más al resultado real de la población. En muestras de miles de individuos se obtiene una fiabilidad casi idéntica a la que obtendríar con una población de infinitos elementos. Es necesario que la distribución de la variable sea uniforme, lo que significa que:
a) No haya zonas del bombo en las que los porcentajes de bolas blancas/negras sea sustancialmente distintos: para eso le damos unas vueltas al bombo y las revolvemos bien.
b) No haya subpoblaciones en las que predomine el voto hacia Bush o Kerry. Sé que esto no es cierto, tengo que solucionarlo de alguna manera.
3.- Entonces obtengo la muestra y la mido:
a) Extraigo 100 bolitas del bombo, y cuento sus colores: 45 negras y 55 blancas. Deduzco por inferencia estadística que las negras son el 45% y las blancas el 55% en el bombo.
b) Contacto con 5000 electores escogidos al azar
Podría entonces contratar a 100 personas que se desplacen por todos los Estados Unidos y entrevisten a cada uno de los seleccionados, pero es demasiado caro. Es mucho más barato y rápido llamar por teléfono que desplazarse in situ. Deduzco entonces que si la distribución de votantes a Bush/Kerry es la misma entre la población inicial y la subpoblación formada por los electores que tienen teléfono fijo puedo realizar el muestreo entre la población con teléfono.
¿Es igual la distribución del voto entre los que tienten teléfono?¿Se encuesta al primero que coge el teléfono o se busca una persona con cierto perfil?¿Como se mantienen las proporciones entre los distintos estratos de la población?
Estas incorrecciones son las que hacen aumentar el error entre la muestra y la realidad hasta límites inaceptables o in
Interpretando estadísticas
(Puntos:1)( http://smiorgan.blogspot.com/ )
Es la única forma válida de extraer alguna conclusión. Leer sólo los resultados y ver gráficos no es suficiente.
- "No sabían que era imposible, por eso lo hicieron"
Fortune
(Puntos:2)( http://barrapunto.com/ )
Este es el fortune que me sale al final de este post.
La eleccion del mismo, ¿es al azar, es en funcion del tema, o es puesto por un ser humano?
No tengais falsas esperanzas
(Puntos:4, Informativo)( http://www.redliberal.com/ )
Precisamente, si os acordáis, Pepe Blanco se quejaba de que había un "exceso de cocina" en el CIS. Cuando cambió el gobierno y con él el director del CIS, cumplieron su palabra y dieron diferencias brutales en la europeas que no se produjeron, además de indicar que la participación iba a superar las de las generales. No tener "cocina" lleva a estos fallejos.
En el caso del que estamos hablando, si a las empresas les salen menos jóvenes por lo del móvil, lo que hacen es aumentar el peso de las respuestas de esos jóvenes para hacerlo coincidir con el porcentaje esperado de voto en ese segmento de población. Es decir, que si pregunta a 800 mayores de 30 años y 200 menores de esa edad y se calcula (ahí es donde está la cocina y el mayor margen de error) que el 30% de los votantes serán menores de 30, se reduce el peso de los 800 y se aumenta el de los 200.
Daniel Rodríguez (redliberal.com, liberalismo.org, juandemariana.org)
Re:Encuestas
(Puntos:1)( http://barrapunto.com/ | Última bitácora: Miércoles, 06 Noviembre de 2013, 12:05h )
Por otro lado, si mi memoria no me falla, hay ya más móviles que fijos en España y el porcentaje de personas que no tienen fijo no es despreciable (¿Cuántos casos de personas que comparten el coste de un piso has visto en que no hay teléfono fijo? Yo, unos cuantos, sobre todo cuando se trata de estudiantes).
Reconozco que el artículo probablemente no proporcione mucha información nueva a algunos barrapunteros (como yo), pero siempre hay gente que no ha tenido la oportunidad de saber qué falla en las encuestas que se publican (cuando fallan), y algunos de los comentarios de esta noticia son bastante informativos (no, los de el hilo de Zapatero y Blair no lo son, sobre todo cuando derivan siempre hacia los mismos asuntos debatidos ya hasta el aburrimiento).
Marcos (cualquier parecido con la coincidencia es pura realidad)