ves esta página sin formato por que esta hecha cumpliendo el estándar web CSS 2.
tú navegador no soporta este estándar, o tienes dicho soporte desactivado.
si estas en el primer caso, actualízate. merece mucho la pena.

la boca
artículos, escritos y demás piezas perfectamente obviables perpetradas por Javier Armentia

Blogalia
FeedBurner

StatCou nte r

Ver Estadísticas

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons.

Para contactar con el autor:

Archivos
desde el 24 de enero de 2002

<Octubre 2008
Lu Ma Mi Ju Vi Sa Do
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
26 27 28 29 30 31  
             

www.flickr.com


Nos enlazan según Google


Blogalia


Últimos comentarios aquí...

  • Yabba en Los Libros De Bautismo No Son Datos Protegibles
  • Miguel Angel en Los Libros De Bautismo No Son Datos Protegibles
  • LábilAstur en Los Nobel 2007: VIH Y VPH - (Fisiología Y Medicina)
  • xa2 en Misterios Del Aire
  • ElPez en Los Nobel 2007: VIH Y VPH - (Fisiología Y Medicina)
  • yo en Los Nobel 2007: VIH Y VPH - (Fisiología Y Medicina)
  • rvr en Los Nobel 2007: VIH Y VPH - (Fisiología Y Medicina)
  • pepepotamo en Es La Astrología, Estúpido
  • LábilAstur en Es La Astrología, Estúpido
  • LábilAstur en Cada Año, La Ciencia Que Provoca Sonrisas...
  • Inicio > Historias > Estrellas Y Salud
    2007-02-19
    )

    Estrellas Y Salud
    2007-02-19

    Me llega una noticia, acerca de una investigación de Peter Austin y otros tres investigadores del Instituto de Ciencias de Evaluación Clínica (Institute for Clinical Evaluative Sciences) de Toronto. La fuente, el sistema Eurekalert de noticias científicas, que pertenece a la Asociación Estadounidense para el Progreso de las Ciencias (American Asociation for the Advancement of Sciences), suele ser fiable: no en vano es la asociación profesional de científicos más grande y conocida del mundo, editores de Science y en todos los órdenes, un lugar obligado y de referencia. Precisamente estos días, entre el 15 y el 19, están en San Francisco realizando su reunión anual. Y, precisamente, de una presentación en esa reunión viene la nota de prensa... Como suele pasar, hay que entender que este congreso anual es un verdadero escaparate para la ciencia estadounidense, con una gran afluencia de científicos de todas las ramas, pero también de medios de comunicación. Es importante hacer notar, por lo tanto, que conseguir una noticia en este congreso supone un empujón nada desdeñable para sus autores a la hora de conseguir renombre y financiación para sus trabajos. Mucho más que una publicación en una revista "seria" (me refiero a los mínimos criterios de revisión por pares etcétera), si hablan de tí por una presentación en el congreso de la AAAS has conseguido un verdadero éxito. Lo digo para que no lo olvide el lector. Y porque por lo que se lee en la nota, no hay una publicación "seria" detrás de la noticia que vamos a comentar.

    Y ya vale de preámbulos. Pues eso, que esta noticia es altamente inquietante. La pongo tal cual para luego comentar el tema:
    Charting our health by the stars

    Natural Sciences and Engineering Research Council grantee Peter Austin and three other researchers at the Institute for Clinical Evaluative Sciences in Toronto have just completed a survey of hospital visits in Ontario, showing that, compared to people born under other astrological signs, Virgos have an increased risk of vomiting during pregnancy, Pisces have an increased risk of heart failure, and Libras have an increased risk of fracturing their pelvises.

    In fact, each of the 12 astrological signs had at least two medical disorders associated with them, thus placing people born under a given sign at increased risk compared to those born under different signs.

    The study, which used data from 10,000,000 Ontario residents in 2000, was conducted with tongue firmly in cheek.

    “Replace astrological signs with another characteristic such as gender or age, and immediately your mind starts to form explanations for the observed associations,” says Austin. “Then we leap to conclusions, constructing reasons for why we saw the results we did. We did this study to prove a larger point – the more we look for patterns, the more likely we are to find them, particularly when we don’t begin with a particular question.”

    Austin will discuss his results at the American Association for the Advancement of Science (AAAS) Conference in San Francisco, which runs from Feb. 15 to 19, 2007. What he found was that even though each astrological sign had its own unique disorders, his initial results were not reproduced when they were explicitly tested in a second population.

    “Scientists take pains to make sure their clinical studies are conducted accurately,” says Austin, “but sometimes erroneous conclusions will be obtained solely due to chance.” Statistical chance means that 5 per cent of the time, scientists will incorrectly conclude that an association exists, when in reality no such association exists in the population that the scientists are studying.

    One way to reduce the chances of drawing a wrong conclusion is to try and reproduce unexpected results in further studies.

    “There is a danger in basing scientific decisions on the results of one study, particularly if the results were unanticipated or the association was one that we did not initially decide to examine,” says Austin. “But when several studies all arrive at similar conclusions, we reduce the risk of arriving at an incorrect outcome.”


    ¿Que hay una correlación significativa entre el signo del zodiaco y algunas enfermedades? Leches, esto es la repanocha... Sin duda, la noticia implica tal revolución en lo que conocemos de las enfermedades y del Universo que conviene estudiarla con detenimiento. Por eso decía que era "inquietante".

    En primer lugar, veamos las dos variables que quedan conectadas: por un lado el signo astrológico. Ya saben lo que es: una arbitraria división del año en 12 partes de aproximadamente 30 días, que vienen a comenzar los 21-22 de cada mes. Sin duda, tienen una antigua tradición, y hasta hubo una época en que esa división tenía algo que ver con el cielo, pero no ahora. Tengamos esto en cuenta: se trata de dar 12 nombres diferentes a unas partes aproximadamente similares en duración de tiempo del año, comenzando -por poner un momento- en esa fecha de cada mes. Y punto. No le busquen conexiones cósmicas, porque estamos hablando de signos astrológicos y no de nada que tenga que ver con el cielo (con el cielo de hoy, de ahora).

    En el otro lado, tenemos diferentes enfermedades. Peter Austin y sus colaboradores han encontrado que DOS de ellas (al menos, dicen en la nota) tienen esa correlación con cada valor de la variable anteriormente presentada. En concreto, se especifica que han encontrado que los "Virgo" tienen un riesgo mayor de vomitar durante el embarazo (deberíamos haber puesto, evidentemente LAS Virgo). Por otro lado, los "Piscis" tienen un mayor riesgo de fallo cardiaco. Finalmente, los "Libra" tienen mayor riesgo de fracturarse la pelvis. La nota comenta que cada signo tenía "al menos dos enfermedades asociadas". Quiere esto decir que, frente a los otros signos, esas enfermedades estaban significativamente más presentes en los nativos de esos signos...

    La nota habla del universo del estudio: 10.000.000 de residentes en Ontario durante el año 2000. Son un buen montón de personas con las que hacer correlaciones, sin duda. Peter Austin trabaja en estadística sanitaria, así que no pensemos que es un mindundi sin repajolera idea de cómo tratar adecuadamente los datos. Y con numerosas publicaciones (véanse, ya puestos, los 13 últimos trabajos que incorpora a su currículo). Quiero con ello hacer notar que si estamos ante un trabajo de análisis estadístico, tenemos aparentemente a alguien que sabe de qué se habla...

    ¿Entonces? ¿Es cierto lo que cuenta? Cabe pensar que . ¿Se saca de aquí una confirmación de las afirmaciones astrológicas, en cuanto que "predicen" que los signos tienen que ver con la salud -de una u otra manera, es cierto, pero ahí queda...-?

    Pues no. Pero hay que acudir al texto de la nota para entenderlo un poco mejor. Veamos por un lado el quinto párrafo, donde dice: "his initial results were not reproduced when they were explicitly tested in a second population". Es decir, que afortunadamente, Austin y los suyos tuvieron la precaución de disponer de otra población, para comprobar si la estadística se confirmaba. Y vieron que no.

    ¿Cómo podemos entonces entender todo esto?

    Les cuento un poco de la historia. En primer lugar, cuando leí el titular, Caracterizando nuestra salud por las estrellas, me dio medio vuelco el corazón. Más al leer el asunto de las enfermedades y los signos y el tamaño de la muestra... Pero resulta que algún descerebrado (o perfecto cabrón) ha redactado la noticia con el fin de conseguir precisamente ese efecto (me temo, no he visto la prensa, que como tal conexión astrológica será referenciada por más de un medio, que la peña de los medios es así de directa, y un titular vende más que cualquier realidad...). Con un poco más de calma, la nota en sí da las pistas para poder darse cuenta de que el estudio de Austin concluye precisamente lo contrario, que a veces podemos encontrar correlaciones curiosas que, realmente, no tienen nada de relevancia -a pesar de ser estadísticamente significativas...

    De hecho, la ponencia de Peter Austin en el congreso de la AAAS se titula, mucho más apropiadamente: Multiple Testing and False Claims: The Association Between Astrological Signs and Health, es decir, "Pruebas múltiples y afirmaciones falsas: la asociación entre signos astrológicos y salud". Acabáramos... si Austin es "de los nuestros", justo lo contrario que nos habíamos temido (de ahí el "inquietante" que puse al comienzo).

    Así que recapitulemos. Y recomiendo volver a leer, ahora con más calma, la nota de prensa. En ella, Austin explica que estaban buscando correlaciones entre múltiples variables que conocían de esos diez millones de personas atendidas por la sanidad de Ontario. Miraron sexo, edad, y muchísimas otras cosas. Y, en un momento, pudieron encontra que había algunas correlaciones llamativas, como ser de Piscis y los fallos cardiacos etcétera...

    Conociendo cómo está el percal en tantas cosas de este mundo, más de un "investigador" habría usado esas correlaciones como PRUEBA de que algo tenía que ver el signo del zodiaco. Afortunadamente, repito, Austin es un buen experto en temas de análisis estadísticos, y se dedicó a formar otras muestras, por ver si ese "efecto astrológico" se mantenía. No fue así, con lo que cualquiera debería sospechar que simplemente estábamos ante un artefacto y no algo real.

    ¿Por qué artefacto? Hay numerosos sesgos: por ejemplo, al probar posibles correlaciones entre diferentes magnitudes, el investigador de turno, simplemente, desdeña aquellas que NO se producen y se queda con las que SÍ se producen. Ojo, que esto es perfectamente natural, en principio. Pero no tener en cuenta todo aquello que NO funciona, es decir, olvidarlo, nos puede llevar a un autoengaño. Pensemos que estamos haciendo un experimento de tirar monedas al aire y registrar si sale cara o cruz. En una tirada suficientemente larga, es lógico que suceda una serie seguida de caras o cruces (o una serie seguida de cara-cruz-cara-cruz etcétera... la configuración que queramos). Si nos quedamos con esa serie en concreto, podemos calcular la probabilidad de que algo así suceda al azar. Y siempre resulta ser ridículamente baja. Pongamos 10 veces seguidas de caras. Como una cara o una cruz tienen una probabilidad de 1/2, y cada tirada es un suceso independiente (en principio) del anterior, es evidente que sacar dos caras -en concreto- tendrá una probabilidad de 1/2 x 1/2, es decir, 1/4. ¿Hace falta seguir? 10 caras es un suceso ciertamente improbable: 1/2^10 = 1/1024 = 0,00098, o sea que sólo una de cada mil veces -aproximadamente- pasaría algo así. Desde luego, sin más, cuando nos dicen que alguien es capaz de tirar 10 caras seguidas, sin más, nos podemos sorprender. ¡¡Sólo una de cada 10.000 personas podría hacer algo así!! Pues no. Hay que recordar que estamos calculando una probabilidad TRAS el suceso. Que hemos sesgado una serie posiblemente más amplia para quedarnos con lo que queríamos. En latín le dicen a esta falacia "post hoc ergo propter hoc". No vale calcular la probabilidad a posteriori, no señor.

    El caso de las múltiples variables que metemos en nuestro flamante paquete estadístico no es exactamente similar, pero podemos hacernos una idea con el asunto que comentaba de las monedas. Al correlacionar diferentes datos, es más que probable que aparezcan algunas correlaciones, para una muestra (o Universo) determinado. Pero esto no vale sin más para hacer una conclusión.

    Afortunadamente, la estadística misma proporciona formas de poder evaluar si hay sesgos a la hora de encontrar estas correlaciones. En el caso de las monedas, como dispondríamos de las series "largas", podríamos ver sin más que la elección de la serie que nos venía bien para conseguir ese sujeto que siempre tiraba caras era incorrecta. En el caso que nos ocupa, pasa lo mismo. Y Peter Austin hizo bien su trabajo: bastaba con partir el Universo inicial aleatoriamente en grupos para ver si esas curiosidades estadísticas seguían teniendo valor. Otra opción, claro, sería disponer de los datos de otra provincia, o de otra época. Hay métodos muy potentes en estadística (como las simulaciones Monte Carlo) para comprobar si una correlación es realmente significativa.

    Perdonen todo este rollo, de un "casi" lego en estadística, además (perdonen los matemáticos las simplificaciones adoptadas en la explicación, por cierto). Si volvemos al texto de la nota de prensa de Eurekalert, vemos cuál es la moraleja que quería transmitir Austin en su charla de las "falsas afirmaciones": "los científicos se toman la molestia de asegurar que sus ensayos clínicos se realizan de forma precisa, pero a veces se obtienen conclusiones erróneas simplemente debido al azar".

    Ahí está el quid de la cuestión. Lo gracioso es que Peter Austin ha "medido" además ese proceder. Concluye que "estadísticamente un 5% de las veces, los científicos concluirán erróneamente que existe una asociación, cuando en realidad tal asociación no existe realmente en la población que estudiaban".

    ¡Qué gran verdad! Realmente, del estudio de Austin se concluye que no podría sino darse alguna correlación entre signos del zodiaco y enfermedades, al menos algunas veces, para algunas poblaciones de estudio. Sobre todo si tenemos los suficientes elementos de cada variable: 12 signos, un buen montón de enfermedades...

    Puede que el lector haya llegado hasta aquí diciendo: bueno, esto es TAN EVIDENTE que no hacía falta decirlo... Pues no. Este error es terriblemente común, y la obcecación en el error, cuando a la escasa precaución en el uso de las correlaciones y estadísticas en general unimos además una creencia en que algo TIENE QUE suceder, es demasiado frecuente.

    Una de las "controversias" más importantes de los últimos 3 decenios en el mundo del análisis estadístico de las afirmaciones astrológicas es el llamado efecto Marte o efecto Gauquelin. Lo cierto es que nos llevaría mucho tiempo hablar a fondo de este asunto, pero digamos en plan resumen que unos análisis estadísticos de Michel Gauquelin a mediados de los años 70 le llevaron a concluir que, por ejemplo, los deportistas más relevantes de cada especialidad en todo el mundo (nacidos antes de que los métodos obstétricos de programar el parto fueran importantes, frente al parto más "natural", esto es, dejar que el crío salga cuando se le ponga en gana....) tenían a Marte en ciertas posiciones relativas del cielo que aparecía en el momento de su nacimiento. El asunto Gauquelin dio mucho juego, con comités estadounidenses -marcó, precisamente, hace 30 años, la época del nacimiendo del CSICOP, la principal organización escéptica a escala mundial-, y europeos, como el Comité PARA que intentaron reanalizar los datos. Ya casi desde el principio se comentó que estaba operando algo similar a lo que ahora nos cuenta Austin: cabía pensar que Gauquelin (la pareja, él y su mujer, quien le ayudó durante años) habían tenido sesgos de selección. Por un lado, selección en las muestras (esto dio lugar a agrios debates sobre qué se consideraba -o no- un deportista de élite), pero tambié a la selección de las variables adecuadas. Por eso en otras muestras no aparecía ese efecto Marte, o aparecían otros efectos incompatibles.

    Llevo 20 años discutiendo con astrólogos de todo pelaje, y sistemáticamente, los más "serios" (ya sé que ser astrólogo y serio es realmente imposible, pero los hay que se consideran más serios...) acuden siempre a Gauquelin como una especie de santo patrón que les defiende de la crítica escéptica. Nunca han sido capaces de entender el fenómeno del que estamos hablando aquí. Me temo que, en cuanto algún medio de comunicación transmita la noticia mal (algo muy probable, dado el tendencioso titular y comienzo de la nota de prensa), volveremos a las andadas.

    Esta anotación está siendo ya demasiado larga, pero quería comentar que, entre otros, sesgos similares al que comentamos se han descubierto en las históricas series de ESP (percepción extrasensorial) que se realizaron en universidades inglesas y estadounidenses en los años 30-40. El nacimiento de la "parapsicología de laboratorio", con Rhine y otros, mostró precisamente cómo la estadística groseramente utilizada (en algunos casos esto incluía manipulaciones deliberadas, que todo hay que decirlo) podía crear un efecto donde sólo había un sesgo.

    Me perdonarán que haya esbozado dos temas (Gauquelin y Rhine) sin entrar demasiado en ellos. Pero es que entonces me tendría que poner a escribir mucho más. Quizá otro día hablemos de estas cosas. Por el momento, ya saben: si esta semana alguien les dice que ha leido u oido o visto que en Ontario han demostrado que la astrología funciona, acuérdense de explicar que, más bien, ha sucedido -una vez más- lo contrario. Y si tienen tiempo, expliquen por qué precisamente esas presuntas verdades estadísticas son uno de los argumentos para sospechar que realmente no hay esas influencias zodiacales.





    2007-02-19 01:45
    Enlace | 126 Comentarios | Versión imprimible | Menéame


    Referencias (TrackBacks)

    URL de trackback de esta historia http://javarm.blogalia.com//trackbacks/47281

    Comentarios

    1
    De: Mugalari Fecha: 2007-02-19 12:22

    Vaya!! Y yo que estaba deseando conocer de que voy a morir, y resulta que no resumen de que mueren lo Capricornio de Ontario!!
    jejeje, la verdad es que con la estadistica muchas veces se pueden hacer juegos muy divertidos...
    Desde luego, quienes nos dedicamos a la experimentación, muchas veces nos llevamos grandes sustos al intentar correlacionar los resultados. Voy a empezar tambiéna incluir la posición de las estrellas como variables de análisis, jejeje



    2
    De: ElPez Fecha: 2007-02-19 12:26

    Pues cuéntenos, Mugalari, a ver qué encuentra... prometo darle la máxima difusión :)



    3
    De: germanPG Fecha: 2007-02-19 13:23

    vale Javier !
    Poca gente se da cuenta de que las extrañas casualidades o correlaciones, no son tales si se da un numero suficiente de personas buscandolas, o se realiza un numero elevado de intentos.
    Siempre habra mas "extrañas casualidades" entre noticias o casos de amplia distribucion que entre otros mas locales.
    No nos damos cuenta de que nos parece muy improbable que lanzando 10 dados salgan 10 ases, por que somos capaces de identificar esa tirada y no otra.
    saludos
    german



    4
    De: Fernando* Fecha: 2007-02-19 14:51

    Y ni siquiera son necesarias series largas para obtener 10 caras seguidas, basta con tener suficientes monedas (mas de 10000) e ir tirándolas, y seleccionando las que den cara.



    5
    De: ricardo galli Fecha: 2007-02-19 18:45

    > was conducted with tongue firmly in cheek.

    Eso te debería haber dado una pista inmediata de qué iba la noticia (es genial :-)



    6
    De: El Judas. Fecha: 2007-02-19 22:19

    .

    Tampoco sería tan raro que hubiera similitudes entre gente del mismo signo, al fin y al cabo han nacido en la misma estación del año y han vivido sus primeros meses en condiciones similares, y diferentes a las de los demas nacidos en otras estaciones.

    Estoy seguro de que los astros no tienen influencia astrológica, de lo que no estoy seguro es de la influencia del medio ambiente en el embarazo y en los primeros meses de vida. Quizás el medioambiente influya en futuras alergias, rasgos psicológicos, metabolismo o yo que sé.

    Además, si existe esa influencia medioambiental se notará menos en las generaciones más recientes y de paises más ricos, y más entre los más pobres por sufrir con mayor rigor el clima, así que será cada vez más difícil de detectar. Sería un conocimiento tradicional incomprendido por la ciencia actual.

    Por si alguien lo duda no creo en la astrología ni tengo ni puta idea de si los bebes pueden ser tan sensibles al medio ambiente, es sólo que se me ha ocurrido.

    .



    7
    De: Suminona Fecha: 2007-02-20 09:15

    [... tonterías pseudomatemáticas previas ... ]

    "En latín le dicen a esta falacia "post hoc ergo propter hoc". No vale calcular la probabilidad a posteriori, no señor."

    Nuevamente, otro que no termina de entender el asunto.

    Supongamos que diseño un generador pseudoaleatorio de tiradas, y quiere comprobar qué tan aleatorio es realmente.
    Lanzo 20 monedas, y obtengo
    1 0 1 0 0 1 0 0 0 1 1 1 0 0 1 1 1 0 1 1

    ¿Cuál es la probabilidad de obtener esta secuencia en concreto? (1/2)^20

    ¿Y si obtengo ésta?

    1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

    La probabilidad vuelve a ser (1/2)^20.

    Sin embargo, si ésta es la primera secuencia de tiradas que realizo, y he programado bebiendo 8 cervecillas: ¿haré bien en revisar el código?
    Curioso que cualquiera con dos dedos de frente contestaría positivamente, y alguien influido por las tonterías besuguianas podría hasta dudar.

    La respuesta matemática a esto es muy sencilla, y, de forma vulgar, tiene hasta nombre: ZIP.



    8
    De: ElPez Fecha: 2007-02-20 11:10

    Por supuesto, Suminona, insultos aparte, no hace sino darme la razón. A pesar de que no se entere: si el científico jugando a buscar correlaciones se queda con la que le parece "bonita", es como si lo de las cervezas. Que se lo mire, y el código también. Y usted, de paso, también.



    9
    De: Anónima Fecha: 2007-02-20 11:25

    suminona:

    Si los sucesos sucesivos son independientes y de igual probabilidad, no tendrías más motivos para revisar el programa en uno y otro caso.

    La cuestión es que el segundo caso podría ser indicativo de que los sucesos no son independientes o no tienen la misma probabilidad, lo que haría que fuera bueno revisar el programa.

    Eso mismo es lo que hace el científico del post: observa una correlación extraña y la pone en cuestión.

    No veo en que puede ser nefastas las influencias del Pez en este caso :)



    10
    De: Anónima Fecha: 2007-02-20 11:31

    Judas:

    Cuando leí el post pensé lo mismo que tú pero en un caso en el que se vería más claro.

    Dividamos la población por año de nacimiento. Estudiemos la correlación entre signo del zodiaco y peso. Curiosamente en la franja de edad de los 0 a 1 años se observa una fuertísima correlación, incluso es posible que dicha correlación se note hasta los dos o tres años ;-)



    11
    De: Anónima Fecha: 2007-02-20 11:35

    Pez,

    Me ha encantado el post y la expresión tongue in cheek, que no conocía :-).

    En la próxima discusión sobre si está demostrado que las mujeres tal o cual cosa creo que voy a darme el gusto de citarlo, junto con todos los argumentos obre si correlación no implica causalidad, posible influencia de otras variables, etc...



    12
    De: Suminona Fecha: 2007-02-20 11:57

    ElPez, lea la respuesta de Anónima y verá que no hace más que reconfirmar lo que yo decía.



    13
    De: Suminona Fecha: 2007-02-20 12:01

    " se queda con la que le parece "bonita"

    En realidad, hay un orden primordial en las secuencias, relacionado en cierta forma con la entropía.

    Haga un experimento casero muy sencillo: copie las secuencias a archivos de texto independientes, y comprímalos en ZIP. Observe el peso.
    Puede probar con secuencias mucho mayores, generando aleatoriamente los números, o introduciendo ciertas correlaciones.
    Observará cómo, de manera casi indefectible, las secuencias aleatorias pesan más.



    14
    De: Suminona Fecha: 2007-02-20 12:02

    Es decir, se puede determinar el grado de aleatoriedad de una muestra, completamente a posteriori. Con cierto margen de confianza.



    15
    De: velaza Fecha: 2007-02-20 19:22

    Suminona, eso que estás fumando...¡que rule!



    16
    De: Suminona Fecha: 2007-02-20 19:29

    "Suminona, eso que estás fumando...¡que rule!"

    Sí, claro, la definición de ElPez "secuencia que le parece bonita" es de un científico que acojona. A ver quién está más fumado.



    17
    De: Yabba Fecha: 2007-02-20 20:29

    Uno diría que "divulgar" consiste precisamente en usar expresiones menos técnicas o "científicas" para que así lo entendamos los legos. Simplificar, vamos. Algo que agradecemos mucho los legos, contrariamente al dolor de cabeza que me producen las tiradas de monedas zipeadas :)



    18
    De: Diego (MrDeejay) Fecha: 2007-02-20 20:44

    Seguro que tarde o temprano, este tema acabaran comentandolo en "Redes"
    ¿Como lo explicaria el Punset?

    Saludos Yabba, ¿que tal por Madrid?

    Aqui estoy con el ordenador medio arreglado, y me he pasado un ratillo por aqui, a ver que se cuece.



    19
    De: Yabba Fecha: 2007-02-20 20:47

    Estupendamente bien, Diego, buenos ratos con buenos amigos, dos teatros, dos borracheras, dos resacas. Vamos, redondo :)



    20
    De: Diego (MrDeejay) Fecha: 2007-02-20 21:00

    Me alegro, a ver si te animas a repetir lo mismo por aqui :).

    Aunque bueno, teatro no se si podria ofrecerte, pero si te animas al estreno del cortometraje, que lo mas seguro sera en un cine. Eso si, la borrachera despues estaria asegurada. ;)



    21
    De: Suminona Fecha: 2007-02-21 09:14

    "Algo que agradecemos mucho los legos, contrariamente al dolor de cabeza que me producen las tiradas de monedas zipeadas :)"

    Lo del ZIP es muy sencillo, querido Yabba.
    Cuando existe cierto orden en los datos, es mucho más fáciles comprimirlos.
    Por ejemplo, en la secuencia en que la mitad son caras y la otra mitad son cruces consecutivas, es decir

    C C C C C C C C C C X X X X X X X X X X

    es muy fácil reproducir la tirada anterior diciendo, por ejemplo

    10C10X

    en la que la nomenclatura es bastante obvia, el número en cifras delante del resultado indica la repetición. En este caso, en vez de 20 letras, hemos usado 6 (en realidad, usando bytes en lugar de letras, tanto la definición exhaustiva de la lista, sin comprimir, como la comprimida, ocuparían algo menos, pero así es más claro didácticamente).

    Ahora en cambio, en la secuencia que puse (con la nomenclatura C y X):

    C X C X X C X X X C C C X X C C C X C C

    si queremos repetir la misma "compresión", tendríamos, sin utilizar el 1 y el 2 por razones obvias:

    C X C X X C 3X 3C X X 3C X C C

    en el que ganamos sólo 3 letras en compresión.

    Así, una secuencia que está más ordenada, que tiene menos de azar en ella, es más fácil comprimirla.
    Por lo tanto, está claro que de las dos secuencias, una de ellas tiene una "firma digital" que es bien distinta de la otra, y eso en ciertas ocasiones puede ser utilizado para determinar la aleatoriedad de una secuencia, más allá del hecho obvio de que ambas tienen la misma probabilidad de salir (0.5 ^ 20) o de que pueda "parecer más bonita".



    22
    De: Gorgorito Fecha: 2007-02-21 12:38

    Me ha gustado el enfoque del ZIP para abordar las secuencias aleatorias. Pero la premisa "las secuencias aleatorias pesan menos" no es correcta porque, como has dicho, todas son aleatorias. Y además no se cumple en todos los casos:

    010011000111000011110000011111 es una secuencia preciosa, pero 'zipeada' ocupa un pico.



    23
    De: Suminona Fecha: 2007-02-21 13:44

    No creas.
    010011000111000011110000011111 ==>

    N(XC)N=1;5

    Convención, N es repetición paramétrica, con N de 1 a 5.



    24
    De: Suminona Fecha: 2007-02-21 13:47

    Huy, mi profesor de "Zipeado de secuencias pseudoaleatorias 101" me hubiera cateado:

    NXC5

    Sobran los paréntesis, el igual, el punto y coma e incluso el 1 inicial. hasta la segunda N ciertamente. N ya contendría toda esa información, por convención.
    ¿Zipeado con bastante ratio, no?



    25
    De: Peggy Fecha: 2007-02-21 15:33

    Usted no tiene perdon de Dios ....con lo romantico que era pensar que piscis padecia de los pies ......:) a veces me gusta el mundo de las hadas



    26
    De: Suminona Fecha: 2007-02-21 18:16

    Por cierto, he encontrado el siguiente estupendo artículo de divulgación sobre el último tema que nos ocupaba.
    Contiene incluso un ejemplo similar a la primera de las compresiones, nombra la entropía, la aleatoriedad de series. los formatos ZIP. En fin, todo lo que, según Velaza, indicaba que había estado fumando alguna hierba rara.

    http://www.elpauer.org/stuff/compresor.pdf



    27
    De: Yabba Fecha: 2007-02-21 18:41

    Yo debo aclarar (para una vez que sé algo) que la técnica de compresión ZIP si que la conocía, era la aplicación estadística la que me mareaba (un efecto que la estadística me suele producir). Pero la explicación ha sido perfecta, Suminona, y seguro que hay mucha gente que se ha beneficiado de ella. Enhorabuena.

    Pero sigo diciendo que "la secuencia bonita" sigue siendo una forma más fácil de explicar a un lego que el otro enfoque, y que esto iba, según yo lo entiendo, en un plan didáctico. Vamos, que es un detalle menor la exactitud del comentario, comparado con el beneficio en comprensión que se puede tener al simplificar la cosa. Nada más.



    28
    De: Suminona Fecha: 2007-02-21 18:48

    "Pero la explicación ha sido perfecta, Suminona, y seguro que hay mucha gente que se ha beneficiado de ella. Enhorabuena."

    Gracias, Yabba.

    En cualquier caso, el tema no está zanjado ni mucho menos, en cierto artículo sobre los montículos se objetó con cierta objeción que hizo Feynman sobre temas similares a los comentados por ElPez:
    "As Feynman has remarked, the invalid procedure is like saying: "I came here in a taxi with the license plate LPG408. This is quite remarkable. What is the chance, of all possible taxis in the city, I select by accident one with license plate number LPG408?"

    Lo cual, es una evidente gilipollez. Similar a la pregunta de ¿cuál es la probabilidad de obtener precisamente esta secuencia de caras y cruces?, que, aunque arroja el mismo valor en los dos casos, no nos dice nada acerca de que, completamente a posteriori, y si la secuencia "sospechosa" no está rodeada de demasiado ruido (al principio de la tanda de tiradas, por ejemplo), se puede intentar determinar dicha probabilidad de ocurrencia.



    29
    De: Suminona Fecha: 2007-02-21 18:52

    "se puede intentar determinar dicha probabilidad de ocurrencia."

    La cual, por cierto, será bastante más alta que (1/2)^20, y que, a grosso modo, y siguiendo tu consejo, se reformula a partir de la siguiente pregunta: "¿cuál es la probabilidad de que, al principio de la tirada de secuencias, se obtenga una que pertenezca al conjunto de secuencias bonitas?



    30
    De: Yabba Fecha: 2007-02-21 18:56

    Mmmm... me pierdo. Lo siento, con todo esto yo siempre me pierdo. Ya que me escuchaste el consejo (gracias, por cierto), te hago otra petición. Así, con palabras sencillas, ¿en qué afecta todo esto al tema en discusión? ¿Te parece estadísticamente significativo que se encuentren correlaciones entre posibles enfermedades que sufren las personas según el signo bajo el que nacen o coincides (de la manera que sea) en que si bien los números salen así es por una mala elección de los supuestos bajo los que se hace ese muestreo? En resumen, ¿es en tu opinión una realidad lo que postula ese muestreo o una tontada? :)



    31
    De: Diego (MrDeejay) Fecha: 2007-02-21 18:59

    "era la aplicación estadística la que me mareaba (un efecto que la estadística me suele producir)"

    Creo que es algo que tenemos en comun los legos.

    Como suelo decir algunas veces: cada uno tiene su fuerte en lo suyo.

    Pero vamos, que me uno tambien a la felicitacion para suminona, si lo he entendido hasta yo, con lo ceporro que soy para estas cosas. :P



    32
    De: Diego (MrDeejay) Fecha: 2007-02-21 19:14

    A mi la verdad, es que me cuesta creer que tengan alguna influencia sobre la salud de las personas,en el momento de su nacimiento. La posicion de gigantescas bolas de gas incandescente que se encuentran a millones de kilometros de la tierra (descripccion de una estrella realizada por Pumba en el "rey leon")

    Bromas a parte, en serio, carece de toda logica.



    33
    De: Suminona Fecha: 2007-02-21 19:19

    "En resumen, ¿es en tu opinión una realidad lo que postula ese muestreo o una tontada? :)"

    Efectivamente, el estudio demuestra que, necesariamente, siempre se encontrará algún tipo de correlación.

    Lo que yo objetaba era a la afirmación bastante gratuita por parte de ElPez acerca de que no debe nunca estudiarse una probabilidad a posteriori. Se puede, pero conviene ir con precaución, sólo eso. Por eso, siempre que se puede, es conveniente comprobar la hipótesis con un conjunto "fresco" de datos.
    Pero, si no se puede, y he aquí lo importante, existen herramientas que permiten dar una probabilidad significativa.

    Por ejemplo, en el caso de los montículos marcianos, tests como el de Kolmogorov-Smirnov permiten decir que la probabilidad de que la distribución espacial de los montículos fuera no "aleatoria" era de un 95%.



    34
    De: Suminona Fecha: 2007-02-21 19:21

    "Pero vamos, que me uno tambien a la felicitacion para suminona, si lo he entendido hasta yo, con lo ceporro que soy para estas cosas. :P"

    Gracias, Diego.
    De todas formas, no te considero ceporro ni mucho menos. Esa categoría la reservo para Mc Arra y su amigo Enriquito.



    35
    De: Diego (MrDeejay) Fecha: 2007-02-21 19:27

    "Esa categoría la reservo para Mc Arra y su amigo Enriquito."

    Jajajaja, estoy completamente deacuerdo con eso.



    36
    De: ElPez Fecha: 2007-02-21 21:10

    Suminona, sin embargo no ha comentado a Gorgorito algo que dijo muy acertadamente. Usted presentó esas dos secuencias como obtenidas en dos tiradas diferentes al azar. Comprimidas, una ocupa menos que la otra, pero... ¿y?

    Le recuerdo que escribió:

    Lanzo 20 monedas, y obtengo
    1 0 1 0 0 1 0 0 0 1 1 1 0 0 1 1 1 0 1 1

    ¿Cuál es la probabilidad de obtener esta secuencia en concreto? (1/2)^20

    ¿Y si obtengo ésta?

    1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0

    La probabilidad vuelve a ser (1/2)^20.


    No siempre la "apariencia" final (medida, si así lo quiere, con el tamaño tras un proceso de compresión) es síntoma de correlación, causalidad... post hoc, ergo propter hoc, que le decía yo.



    37
    De: velaza Fecha: 2007-02-21 23:19

    Vamos a ver...
    No hay peor cosa que alguien dándoselas de que domina algo con semejante empanada mental.

    Suminona dijo:
    "las secuencias aleatorias pesan más" refiriéndose al lanzamiento sucesivo de una moneda ideal (no descompensada ni trucada)

    Yo digo, eso es del todo incierto ya que todas las secuencias que anotemos en el lanzamiento de esa moneda son aleatorias.

    Se podría decir que las secuencias con un cierto orden de repetición de sucesos pesan menos al comprimirlas matemáticamente, pero eso poco tiene que ver con la comprobación de si un suceso es aleatorio. Pondré un ejemplo.

    Supongamos que dispongo de una moneda con la posibilidad de elegir el lado que va a mostrar con un control remoto. Puedo hacer uso de ese control remoto o no a lo largo de una serie de secuencias. Pues bien, ¿podría Suminona, con su teoría ZIP, saber si estoy haciendo uso del control remoto?

    Según él, si no uso el control remoto, es decir, si es realmente aleatorio, mis secuencias pesarán más que si lo uso. Pues bien, supongamos que en la primera serie de secuencias decido no usar el control remoto. Cuando termine las secuencias que Suminona demande, sabré cuánto pesan estas secuencias.
    En la segunda parte usaré el control remoto para convertirlo en no-aleatorio. Como ya sé lo que pesan las aleatorias, sólo tendré que elegir las secuencias adecuadas para que pesen más, logrando así engañar a Suminona, que pensará que la segunda tanda es la aleatoria.

    Resumiendo...que me quedo con lo de "secuencias bonitas". Visto lo visto.



    38
    De: ElPez Fecha: 2007-02-21 23:56

    Hay un intereés de Suminona en defender este tipo de cosas: parte de la marsfaciología se basaba en estadísticas post hoc que intentaban hacer ver que "aleatoriamente" no se podrían haber dado esas configuraciones...



    39
    De: Gorgorito Fecha: 2007-02-22 01:43

    Suminona, como siempre, demuestras que eres un gran científico. Y además, buen divulgador.

    Pero deja que éste de letras te ponga alguna pega a lo que dices: Sugieres que un buen enfoque para abordar las secuencias aleatorias es elegir alguna variable que les afecte todas. Y escoges el ZIP. Y a mí me parece una variable tan genial como la ciencia misma.

    Es decir, propones una hipótesis que pueden cumplir todas estas secuencias 'bonitas', y es que se comprimen mejor. Y explicas el algoritmo de compresión de forma geométrica 3x0,5x01...

    Hasta aquí, impecable. Peeero, cuando pongo un 'pero' a la hipótesis, cambias la fórmula (aunque todavía dentro de lo geométrico): 5XCN.

    La pregunta es: ¿por qué no seguir cambiando la fórmula? Tal vez, alguna de las secuencias pueda comprimirse con un logaritmo (cortísimo), o con una derivada, o con una ecuación de tercer grado, o con... Pero, ¿no estaremos perdiendo la esencia de la hipótesis, es decir, el mismo (y único) algoritmo de compresión capaz de mostrarnos lo que a simple vista no se ve?

    Por último, gracias por hacernos discutir sobre esto. Como siempre, el debate contigo es un placer.



    40
    De: Suminona Fecha: 2007-02-22 09:13

    Gorgorito, muchas gracias por tus comentarios, lo mismo sobre el placer de debatir estos temas.

    Bueno, respecto a la objeción que haces, si lees el artículo al que enlaza, puedes ver que el primer tipo de compresión es parecido a uno de los formatos más básicos, llamado RLE (Run Length Encoding). Existen incontables más, basados en detectar la redundancia e indicarla de la manera más efectiva.

    El formato ZIP, en realidad, comprime tan efectivamente porque examina el fichero o secuencia de datos a comprimir, y va buscando ese tipo de fórmulas que mencionas.
    Lo hace para secuencias relativamente grandes, y, no sólo comprime los datos siguiendo esas fórmulas sino que, y esto es crucial para que luego los datos puedan ser descomprimidos, anota en un lugar del fichero, en una especie de índice de libro, aquellas fórmulas que ha ido usando, que cambian para cada fichero distinto.
    Los ejemplos anteriores no son más que esos, ejemplos didácticos.

    Te propongo este experimento, con dos ficheros que he subido a la web. Uno de ellos es de un simpático amigo con el que me desayuné algún que otro día (quiero decir, que desayunábamos juntos, no se asusten).
    Otro es ese simpático amigo, lleno de ruido hasta el pico.

    Sin ruido: http://allyoucanupload.webshots.com/v/2002688858308522234

    Con ruido:
    http://allyoucanupload.webshots.com/v/2002605038500991461

    Las dos fotos están comprimidas JPG, pero observen el peso de las mismas, que pongo a continuación: 91 Kbytes frente a 411 KBytes, con el mismo nivel de "calidad JPEG" (variando la calidad, en la página web consiguen comprimirla aún más).

    Es decir, los datos con mucho ruido son más difíciles de comprimir.

    Contestando a ElBesugo y Velaza, insistir en que el hecho de que una secuencia de datos no comprima bien no es sinónimo de aleatoriedad. Por ejemplo, usando la teoría del millón de chimpancés usando el Paint, es posible que alguno de ellos, en algún momento, dibuje una foto idéntica a la del pajarraco en cuestión (sin ruido), por puro azar. Y comprimiría perfectamente.

    Lo único que caracteriza la compresión sería, como he insistido varias veces, en dar un número de "belleza, elegancia, simplicidad" o lo que ustedes quieran, lo cual explica por qué, en el ejemplo que puse del informático, cualquiera con dos dedos de frente (excepto ElBesugo y Velaza), revisarían inmediatamente el código si, en la primera o primeras secuencias (nótese el énfasis) aparece una de estas "bonitas" secuencias.
    Y lo del "ZIP" no pretendía más que categorizar, de un modo más matemático, esa extrañeza que sentiríamos al ver la primera de las secuencias, 10 caras y 10 cruces seguidas. Algo que, si como en la hipótesis del chimpancé, tenemos a millones de programadores creando un programa similar, ocurrirá por puro azar en alguna ocasión, pero sigue siendo cierto que el infortunado programador hará muy bien en volver a leer las líneas del código para cerciorarse de que tal "bonita" secuencia ha sido una inmensa casualidad, un golpe de suerte, y no un fallo en el código.



    41
    De: Suminona Fecha: 2007-02-22 09:19

    Suminona, sin embargo no ha comentado a Gorgorito algo que dijo muy acertadamente. Usted presentó esas dos secuencias como obtenidas en dos tiradas diferentes al azar. Comprimidas, una ocupa menos que la otra, pero... ¿y?


    Independientemente de que la primera secuencia, la "bonita", haya sido fruto del azar o por un error del código informático de generación, el programador hará muy bien en revisar su programa si sale la primera secuencia, mientras que en el segundo caso puede estar bastante más tranquilo.
    ¿Coincide Vd. en esto?

    ¿Revisaría usted el programa?

    Si es afirmativa su contestación, ¿en base a qué criterio? Si las dos secuencias son igualmente probables, ¿qué le impulsaría a ello?

    Creo que los comentarios anteriores proporcionan la solución de un modo matemático.

    Si contesta que no, que no revisaría la secuencia, entonces es que las tonterías post-hoc han hecho más estragos en su cerebro de lo que pensaba.



    42
    De: Suminona Fecha: 2007-02-22 09:30

    He insisto, nuevamente, remarco, para que no quepa la menor duda: la secuencia "extraña" se obtiene en las primeras tiradas que ve el informático.
    En las primeras, no después de estar varias horas con los ojos enrojecidos mirando los datos en plan Matrix.
    Y vuelvo a repetir, con i=1;1000000, para que Velaza, ElBesugo u otros manipuladores profesionales no puedan verter sus intentos de intoxicación informativa tan impunemente.



    43
    De: Yabba Fecha: 2007-02-22 09:35

    El ruido es un fenómeno molesto en muchos campos. No sólo molesta a los algoritmos de compresión : incluso la mente odia el ruido y trata (a veces sin éxito) de filtrarlo para así quedarse con los datos limpios y puros.

    Así, en una argumentación y discusión entre seres inteligentes con un tema interesante, el intercambio de opiniones es un dato puro que la mente agradece. En cambio, expresiones como "ElBesugo", "las tonterías post-hoc han hecho más estragos en su cerebro de lo que pensaba" o "cualquiera con dos dedos de frente (excepto ElBesugo y Velaza)" son simple RUIDO, que estropea la belleza de un argumento y dificulta la comunicación.

    La mente es poderosa y ya por costumbre tiende a filtrar cierto ruido, sobre todo cuando no es precisamente aleatorio y se da en casi cualquier circunstancia. A todo se acostumbra uno. Pero no deja de tocar las pelotas.

    Suminona, dado que el ruido de ciertas declaraciones parece provenir de zonas más bien bajas de la personalidad, insistiría en lo imprescindible de que te instales un buen filtro pasa-altos. Dejaría pasar lo mejor de ti filtrando bajezas innecesarias. Todos lo agradeceríamos, a la larga tú el primero. Relee el debate, y verás que lo "bajo" no aporta más que crispación.



    44
    De: Suminona Fecha: 2007-02-22 10:11

    Tienes razón, Yabba, pero te pongo más perlas ruidosas:

    Hay un intereés de Suminona en defender este tipo de cosas: parte de la marsfaciología se basaba en estadísticas post hoc que intentaban hacer ver que "aleatoriamente" no se podrían haber dado esas configuraciones...

    A pesar de que no se entere

    Que se lo mire, y el código también. Y usted, de paso, también.

    No hay peor cosa que alguien dándoselas de que domina algo con semejante empanada mental.



    45
    De: Anónima Fecha: 2007-02-22 10:28

    Otra manera de ver lo que dice Suminona sería suponer que tenemos un generador de secuencias no aleatorio que siempre genera el número uno.

    Lógicamente las primeras, pongamos tres secuencias, que obtengamos serán siempre unos.

    Se puede entonces calcular la probabilidad de que esas tres secuencias provengan de:

    A- un generador de secuencias aleatorio
    B- nuestro generador de secuencias que solo genera el número 1

    Es evidente que la probabilidad de A no es nula: se _pueden_ producir al azar muchas secuencias de todo unos seguidas, pero será muyyyyyyyyy baja.

    La probabilidad de B será mucho mayor, prácticamente igual a uno cuantas más secuencias vayamos obteniendo que tengan todo unos.

    Pero sigo insistiendo en que aunque Suminona tiene razón, el artículo del Pez no lo niega.

    Lo que se dice en el artículo del Pez es justamente que si se obtiene una secuencia "rara" (como por ejemplo la correlación entre signo del zodiaco y enfermedades) el científico haría bien en revisar sus hipótesis de partida.

    En el caso del artículo, lo que se revisa es la muestra.

    Es como si tras tres tiradas de todo unos, empezáramos a obtener tiradas con algunos (pocos) ceros: ya no podríamos asumir que el generador genera solo unos, habría que suponer que es un generadaor que produce unos, en un 60% de las veces, quizá. La manera de averiguarlo es efectivamente aumentando la muestra o tomando submuestras a ver si las proporciones de unos y ceros se mantienen o no.

    Con un núemro razonable de muestras bien tomadas podemos asumir que nuestras hipótesis sobre el tipo de generador de secuencias que ha generado las secuencias que hemos estudiado es de uno u otro tipo con un grado de confianza elevado y que también se puede cuantificar matemáticamente. Es lo que se hace en las encuestas de opinión por ejemplo.



    46
    De: Anónima Fecha: 2007-02-22 10:37

    Suminona,

    En cuanto a las caras de Marte, son una secuencia "rara" y por lo tanto habría que poner en duda las hipótesis de partida, la toma de muestras, en fin, todo.

    No he seguido de cerca el tema, pero algo me dice que lo de las caras de Marte es como si en el estudio del post se hubieran creido los resultados de las correlaciones entre horóscopo y enfermedades.



    47
    De: Anónima Fecha: 2007-02-22 10:45

    En cuanto a lo que cuentas de Feynmann, me gustaría conocer el contexto completo.

    Tiene perfecto sentido, dado un universo de N vehículos plantearse cual es al probabilidad de encontrarse con uno que tenga el número i siendo i



    48
    De: Anónima Fecha: 2007-02-22 11:00

    Vaya se cortó :(

    Tiene perfecto sentido, dado un universo de N vehículos plantearse cual es al probabilidad de encontrarse con uno que tenga el número i siendo i inferior a N.

    Incluso se puede estimar el número N si no lo conocemos de manera razonable tomando taxis las suficientes veces y fijandónos en sus número de licencia.

    Creo que fue en la primera guerra mundial cuando se dieron cuenta de que no era buena idea numerar los carros de combate correlatuvamente porque el enemigo podía estimar su número sin mayor dificultad.



    49
    De: velaza Fecha: 2007-02-22 11:12

    A pesar de todo el ruido de fondo que intentas meter, ahora parece que reculas y ya no sostienes eso de:

    "las secuencias aleatorias pesan más"

    que dijiste al principio, ¿o sí? Si la respuesta es afirmativa, yerras doblemente, como te he demostrado con la moneda y el control remoto. Si la respuesta es negativa, lo mejor que puedes hacer es reconocer tu error (tranqui que no se lo diremos a nadie)

    Deja de hacer ruido y si tienes alguna queja de manipulación de tus datos deberías exponerla y no lloriquear por los rincones.

    Ya sabemos que los marsfaciólogos teneis una espinita clavada (como los conspiranoicos del 11M)...pero no hagamos de esto barricadas.

    Yabba, se agradece la defensa sobre sus insultos pero "no problem", debe ser todo de buen rollo. Y ya nos vamos conociendo. A mí, personalmente, no me afecta. Defiendo mis argumentos con pasión y, por lo que veo, con mayor rigor que otros.

    Reitero; "todas las secuencias que anotemos en el lanzamiento de esa moneda ideal son aleatorias"

    Partiendo de esa premisa...¿decías algo Suminona?



    50
    De: Suminona Fecha: 2007-02-22 11:20

    "A pesar de todo el ruido de fondo que intentas meter, ahora parece que reculas y ya no sostienes eso de:

    "las secuencias aleatorias pesan más"

    que dijiste al principio, ¿o sí? Si la respuesta es afirmativa, yerras doblemente, como te he demostrado con la moneda y el control remoto. Si la respuesta es negativa, lo mejor que puedes hacer es reconocer tu error (tranqui que no se lo diremos a nadie) "

    No has demostrado nada. Te copio la frase que dije, a ver si leyendo todas las palabras, comprendes de una vez:

    "Puede probar con secuencias mucho mayores, generando aleatoriamente los números, o introduciendo ciertas correlaciones.
    Observará cómo, de manera casi indefectible, las secuencias aleatorias pesan más."

    Palabras clave: "mucho más grandes", "casi indefectible".

    Comprenderá Vd. que una secuencia de mil cruces, seguida de otra secuencia de mil caras, es una secuencia aleatoria. Incluso si espera toda la eternidad para conseguirla, habrá muchísimas más, totalmente aleatorias, que pesarán mucho más.
    En el caso de secuencias cortas, aquellas que son generadas aleatoriamente y aquellas que no lo son, tendremos que "casi" indefectiblemente pesan más las aleatorias. ¿Entiende lo que es "casi"?



    51
    De: Suminona Fecha: 2007-02-22 11:22

    "Comprenderá Vd. que una secuencia de mil cruces, seguida de otra secuencia de mil caras, es una secuencia aleatoria."

    Quise decir, no aleatoria.
    En ese caso, la "firma ZIP", sí define si es aleatoria o no, con casi absoluta certeza. A efectos prácticos, con absoluta certeza.



    52
    De: Anónima Fecha: 2007-02-22 11:37

    velaza 49.

    Me he perdido. Dices "Reitero; "todas las secuencias que anotemos en el lanzamiento de esa moneda ideal son aleatorias" Partiendo de esa premisa...¿decías algo Suminona? "

    El problema del que estamos discutiendo o, eso creía yo, es determinar si una secuencia "rara" es realmente aleatoria y por lo tanto no significa nada (las enfermedades no están relacionadas con el signo del zodiáco aunque en una muestra determinada "rara" así lo parezca) o si una secuencia "rara" es realmente indicativa de que existe una correlación/fenómeno/lo que sea interesante.

    Si partimos de premisa de que todas las secuencias son aleatorias ya no tenemos problema del que hablar efectivamente :(



    53
    De: Suminona Fecha: 2007-02-22 11:54

    Tranquila, Anónima. Es que cuando velaza se pone nervioso, sus neuronas empiezan a desintegrarse, al igual que su capacidad de raciocinio.



    54
    De: Anónima Fecha: 2007-02-22 12:20

    Suminona,

    Yo estoy tranquila :-)

    Tú en cambio deberías estar repasando bien esos datos sobre las caras de Marte a ver si no les pasa como a los datos del post que podrían haberse usado para correlacionar signo del zodiáco y enfermedades si no se hubieran analizado bien.

    Vamos que lo de las caras de Marte es posible, incluso muy probable y yo diría que prácticamente seguro, que efectivamente sea "raro" y no por eso tenga significado alguno como pareces defender...



    55
    De: Suminona Fecha: 2007-02-22 12:27

    Para terminar de volver loco a velaza.
    En esta página, se pueden encontrar los nombres "velaza", "yabba", "sumi", escondidos entre los dígitos del número PI.

    http://pi.nersc.gov/

    Y ahora, para que finalmente me comprenda ese genio de las matemáticas:

    1) Lo anterior no tiene nada de especial.
    2) Lo asombroso no es encontrar nuestros nicks ahí, sino que, por ejemplo, estuvieran en posiciones equidistantes.

    Y ahora es cuando recuerda lo del código de la Biblia, y empieza a echar espumarajos por la boca, sin comprender que el tema no era académicamente baladí ni obvio, y que por eso pasó el proceso de arbitraje en Statistical Science, y tardó 3 años en ser refutado (muy correctamente) en la misma revista, que es donde hay que hacer esas refutaciones, y no en páginas pseudóticas al uso, utilizando latinajos intimidatorios.



    56
    De: Suminona Fecha: 2007-02-22 12:30

    "Vamos que lo de las caras de Marte es posible, incluso muy probable y yo diría que prácticamente seguro, que efectivamente sea "raro" y no por eso tenga significado alguno como pareces defender..."

    Dijo que no sabía de que iba el tema.
    Le recomiendo esta lectura, después si quiere, profundizamos en la discusión:

    http://web.archive.org/web/20010221033325/http://www.math.washington.edu/~greenber/moundillustrations.html



    57
    De: velaza Fecha: 2007-02-22 13:04

    "Si partimos de premisa de que todas las secuencias son aleatorias ya no tenemos problema del que hablar efectivamente"

    Anónima, en el lanzamiento de esa moneda ideal siempre hablaremos de sucesos aleatorios, por lo tanto, sus secuencias son aleatorias, no por ser secuencias sino porque el suceso lo es.

    Eso es lo que, por mucho que lo intente rebozar con indefectibles varios, he demostrado a Suminona, que su afirmación-premisa es falsa.

    Te remito a mi comentario 37, donde pongo un ejemplo (que por cierto pasa por alto Suminona porque le pone en entredicho)

    Sigue habiendo gente que confunde la velocidad con el tocino, sucesos con probabilidad, aleatoriedad con desorden...

    Un saludo anónima. Espero haberme explicado bien. Ya ves como algunos quieren meter ruido de fondo para no entrar al fondo del asunto, códigos de la Biblia, montículos marcianos y demás asuntos conspiranoicos que tanto gustan a los pseudocientíficos.

    Y para mi querido Suminona, mejor que sigas con lo de los insultos, las matizaciones te han quedado...como diría yo "indefectiblemente" vagas

    Indefectible. Que no puede faltar o dejar de ser.



    58
    De: Suminona Fecha: 2007-02-22 13:20

    "Pues bien, ¿podría Suminona, con su teoría ZIP, saber si estoy haciendo uso del control remoto? "

    Te contesté ya. Con lo de tu primo... digo, con lo de los monos. Un mono puede dibujar a nuestro querido amigo emplumado, por simple azar. Y nada en el mundo permitirá saber si se llegó a tal obra de arte por puro azar o deliberadamente, con un pintor humano.

    Sigues sin entender el quid de la cuestión, que tan magistralmente ha resumido Anónima en su comentario #45.

    Es decir, de una secuencia de tiradas, y una de ellas "bonita", saber con qué grado de confianza es o no aleatoria. Y lo del "ZIP" proporciona un índice más o menos objetivo de "belleza". Simplemente. Lo demás, insultos tuyos incluidos, son intentos de desviar la atención, y que no nos demos cuenta de que vuelves a hacer el ridículo.

    Es lo que se conoce como desviar la atención, algo muy habitual en estos días aciagos que nos ha tocado vivir, y que pretender impedir la muerte del Régimen.



    59
    De: Suminona Fecha: 2007-02-22 13:24

    "aleatoriedad con desorden... "

    Sí, probablemente tú ordenas la casa de una forma muy cómoda e ingeniosa: lanzas la ropa, enseres y demás al aire, al azar, y es probable que puedan quedar ordenados.

    Pues no, Velaza, lo más probable es que no caigan de forma "ordenada", y si ocurriera esto último, tú mismo te cagarías en los pantalones, a pesar de que el hecho de que hayan caído justo en las posiciones en que lo hicieron tenía la misma probabilidad que el de que cayeran a revoltijo.



    60
    De: Anónima Fecha: 2007-02-22 13:25

    Velaza,

    El lanzamiento de monedas ideales y de secuencias de las que se sabe a priori que son aleatorias no tiene nada que ver con el problema que se plantea en el post.

    El post habla de la cruda realidad en que no sabemos a priori si una secuencia que hemos observado es aleatoria o no y jusstamente eso es lo que querríamos averiguar.

    más concretamente, queremos saber si las personas enferman de forma aleatoria, todas con la misma probabilidad de contraer una enfermedad, o si existen variables correlacionadas con la probabilidad de enfermar que nos permitiran saber que una persona tiene mayor probabilidad de enfermar que otra. Ese conocimiento es potencialmente muy útil en medicina preventiva, por ejemplo.

    Así que tomamos una muestra de personas y observamos para cada variable de estudio si han enfermado o no.

    Con esos datos, tratamos de saber si la variable influye, en la probabilidad de enfermar de las personas o si no influye. La cuestión es que no lo sabemos a priori.

    La enseñanza del artículo es que tenemos que tener mucho cuidado en no dejarnos engañar por los resultados: aunque parezca que una variable tienen una gran influencia, no por eso debemos aceptarlo sin más. Debemos comprobar si las muestras son realmente representativas, por ejemplo.


    Suminona,

    Lo siento, pero no tengo especial interés en estudiarme los datos sobre las caras de Marte para ver donde fallan y se me ocurren muchos usoso alternativos apra mi tiempo libre. Además, si tuviera tiempo, no sé si mis oxidados conocimientos estadísticos estarían a la altura.

    Lo que si tengo claro es que de lo que se dice en este post, más bien se deduce lo que comentaba antes: que resultados aparentemente extraordinarios pueden deberse simplemente a una casualidad en la toma de la muestra, como en el caso del post.



    61
    De: velaza Fecha: 2007-02-22 17:24

    Vayamos por partes.

    Anónima, que yo haya hecho incapié en lo de la moneda no es por el post, si relees los comentarios del principio, verás que lo que quiero es hacer ver que la teoría que presentó Suminona, es decir, que cuando se tiene una serie de secuencias aleatorias "en el lanzamiento de una moneda ideal" él decía que-"las secuencias aleatorias pesan más" - Después yo le dejaba con el culo al aire demostrándole, primero que todas esas secuencias son, por definición, aleatorias y que podía poner en entredicho su desubicada teoría ZIPiana con un supuesto, el del comentario 37.
    Con respecto a lo que se comenta en el post, estoy totalmente de acuerdo contigo, Anónima. Pero es que, yo sólo he hablado del caso cuasi-off topic (menudo trabalenguas me ha salido) no me había pronunciado hasta ahora sobre lo del post, que repito, estoy de acuerdo contigo.

    El caso de Suminona es muy distinto, amiga Anónima. Este personaje es un conocido pseudocientífico llamado César Sirvent, que, entre reportajes de avistamientos ovni, nos hacía un "concienzuda himbestigacion" sobre las pupilas de la cara de Marte y sus montículos no-aleatorios.

    Con la misma desfachatez con la que ahora afirma que si lanzo al aire mi ropa, hay la misma probabilidad que toda ella caiga cada una en su sitio que desordenada, desconociendo, al parecer, que el caso favorable es sólo uno y los desfavorables son un montonazo más.
    Como ya he dicho, algunos confunden aleatoriedad con desorden, a las pruebas me remito.

    Tan absurdo, como hacerme creer que me contestó a la prueba de la moneda con control remoto con lo del mono.

    Es tan sencillo como esto:
    Él afirma: "las secuencias aleatorias pesan más"..."que las no-aleatorias, debemos suponer"
    Y yo le planteo un juego para demostrarle que esa premisa es falsa, primero, porque el ejemplo que pone es siempre un suceso aleatorio y porque en el propio juego no puede ganar si yo manipulo la moneda.
    Nada tiene esto que ver con que, tomando infinitos monos es posible que alguno de ellos pinte un cuadro similar a "Las meninas".

    Anónima, al margen de que no tenga que ver con el post sino con un comentario, ¿estás de acuerdo con lo de la moneda?, ¿estás de acuerdo con la frase ""las secuencias aleatorias pesan más"? Lo digo porque, con esos mismos argumentos, Suminona dice que los montículos en Marte están colocados de forma no-aleatoria, ¡vamos, como los Pirineos!
    Ah no, que no se refiere a eso ;-)

    Sumi, ya se te van notando las clases que recibes del "Club de la comedia". El chascarrillo de los monos y mis primos te ha quedado chachilependi.
    Progresa adecuadamente.
    xD




    62
    De: Suminona Fecha: 2007-02-22 17:28

    Velaza, no te lo tomes a mal, pero sólo discuto con personas inteligentes. La vida es demasiado corta para malgastarla en imbecilidades.



    63
    De: velaza Fecha: 2007-02-22 17:31

    Se me olvidaba Anónima. Por muy oxidados que tengas tus conocimientos de Probabilidad, supongo que ves la metida de pata de la afirmación del final del comentario 59, ¿no?

    Pues así todo...ya ves.



    64
    De: velaza Fecha: 2007-02-22 17:32

    El comentario 62 es la prueba empírica del comportamiento habitual del que acaba de meter la pata y no sabe como salir de ahí.

    ;-)



    65
    De: Suminona Fecha: 2007-02-22 17:34

    Observen los queridos contertulios que, entre manipulación y manipulación, ataques ad hominem a tuttiplen, parece que los nervios se apoderan del ínclito Velaza:

    "Este personaje es un conocido pseudocientífico llamado César Sirvent, que, entre reportajes de avistamientos ovni, nos hacía un "concienzuda himbestigacion" sobre las pupilas de la cara de Marte y sus montículos no-aleatorios."

    De momento, les dejo con un pequeño problemilla:

    Espero una llamada importantísima de 6 a 8 de la tarde. La probabilidad de que la persona que tiene que llamar lo haga es del 50%. Determinar la hora que es más indicada para que me ausente durante 15 minutos y no pierda la llamada.



    66
    De: velaza Fecha: 2007-02-22 17:34

    ¡Vamos Sumi, que un mal día lo tiene cualquiera! Será que no te has dado cuenta...veeeeenga.



    67
    De: Suminona Fecha: 2007-02-22 17:37

    "Por muy oxidados que tengas tus conocimientos de Probabilidad, supongo que ves la metida de pata de la afirmación del final del comentario 59, ¿no? "

    Querido Velaza, hasta ElBesugo admite que la misma probabilidad tiene 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 que 1 0 0 1 1 1 0 0 1 1 1 0 1 0 0 1 1 0 0 0 1.

    Deja de manipular. Y a ver si resuelves el problemilla que he puesto, pedazo de cenutrio.



    68
    De: Suminona Fecha: 2007-02-22 17:41

    Vamos a ver, pedazo de simio: si digo

    Pues no, Velaza, lo más probable es que no caigan de forma "ordenada",

    ¿cómo puedes afirmar que eso NO implica:

    "desconociendo, al parecer, que el caso favorable es sólo uno y los desfavorables son un montonazo más."

    Ahora resulta que una secuencia cualquiera tiene más probabilidad de salir con otra, siendo la probabilidad de cada elemento individual la misma y los sucesos estocásticamente independientes. Claro, claro...

    Te recomiendo un buen libro de Estadística, y que intentes asimilar lo que comenté. Yabba, Diego y Anónima lo comprendieron, tú te estás poniendo en evidencia. Y nada, al problema, a ver si lo resuelves solito o te lo "soplan".



    69
    De: velaza Fecha: 2007-02-22 17:43

    "Querido Velaza, hasta ElBesugo admite que la misma probabilidad tiene 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 que 1 0 0 1 1 1 0 0 1 1 1 0 1 0 0 1 1 0 0 0 1."

    ¿y quién dice lo contrario?

    Lo que tú has dicho es que existe la misma probabilidad de que lanzando mi ropa al aire cada prenda quede colgada en su percha que quede a revoltijo.
    Y eso, hasta los de Secundaria lo saben.
    Casos favorables=1
    Casos desfavorables=un mogollón, porque en la sección de "a revoltijo" caben muchas caidas de ropa y, ¡qué casualidad! todas pertenecen a este grupo.

    Despierta, que te van a llamar por teléfono.



    70
    De: Suminona Fecha: 2007-02-22 18:02

    "Lo que tú has dicho es que existe la misma probabilidad de que lanzando mi ropa al aire cada prenda quede colgada en su percha que quede a revoltijo.
    "

    No he dicho nada de perchas. He dicho que caigan ordenadas en esa exacta posición o caigan a revoltijo, por supuesto también en esa otra exacta posición. La probabilidad en ambos casos es la misma, y sin embargo, lo más probable es que ocurra lo segundo.

    Lo he repetido 80 veces ya, así que deja de tergiversar los comentarios.

    Ya veo que no quieres resolver el problema. Te aviso de que un estudiante de 3º de ESO sería capaz de resolverlo.



    71
    De: Suminona Fecha: 2007-02-22 18:08

    Aparte de que todo el asunto del ZIP y demás es una soberana gilipollez.

    Espero que cuando la TGR se hunda, tú desaparezcas de Internet, o por lo menos te cambies el nick, porque va a ser muy humillante tener que aparecer con el rabo entre las piernas.

    Y dejo ya el tema, que desgastas a cualquiera. Vete a adular a ElBesugo alias pixelescuadrados



    72
    De: velaza Fecha: 2007-02-22 18:14

    Ahora resulta que "a revoltijo" tiene una posición exacta.
    ¡otia, eres la risión chaval!

    Entonces, a qué viene eso de:

    " lo más probable es que no caigan de forma "ordenada",

    si para tí " a revoltijo" y "ordenada" tienen las dos "una posición exacta". ¿Dónde está la sorpresa que me llevaría?

    No sé si lo has hecho por error o si es una salida por la tangente pero creo que la frase:

    "Lo que tú has dicho es que existe la misma probabilidad de que lanzando mi ropa al aire cada prenda quede ordenada (quito lo de las perchas, a saber como ordenas tú la ropa) que quede a revoltijo"

    es muy clara.

    Vamos, que si tu te referías a la probabilidad de que la ropa quede "exactamente" como en una fotografía que tienes en la mano, es una obviedad que la probabilidad es la misma que si esta queda ordenada. Pero entonces.... ¿cuál es el misterio que querías desvelarnos?

    No sé, no sé, mishterio de la shiensia.




    73
    De: Yabba Fecha: 2007-02-22 18:20

    "Tienes razón, Yabba, pero te pongo más perlas ruidosas"

    Vale, pero recuerda que las perlas surgen como respuesta a otras perlas. Alguien tiene que tener la generosidad de parar para que lo otro también pare. En general creo que vivimos otros tiempos entre nosotros todos, pero aún podemos mejorar. Un buen punto de partida sería intentar no hacer ingeniosidades con los nicks. Así, para ir calentando motores.

    "probablemente tú ordenas la casa de una forma muy cómoda e ingeniosa: lanzas la ropa, enseres y demás al aire, al azar, y es probable que puedan quedar ordenados. "

    No jodas, ¿no se hace así? Supongo que eso explica mi casa al completo :)

    "Yabba, Diego y Anónima lo comprendieron"

    Te agradezco la confianza en mi capacidad, pero me temo que es infundada. Yo sólo he tenido la sabiduría relativa de reconocer que me mareo con estas cosas y dedicarme sólo a leer :)

    Y por cierto, te diré que si esperas una llamada de 6 a 8 y hay una probabilidad del 50% de que se produzca la llamada, las horas más adecuadas para ausentarte 15 minutos sin perder la llamada son todas aquellas que no estén comprendidas entre las 6 y las 8. Ahora bien, si te refieres a horas comprendidas en ese intervalo (la redacción del problema no lo especifica) ... ah, que me vuelve el mareo :)



    74
    De: Suminona Fecha: 2007-02-22 18:20

    "Vamos, que si tu te referías a la probabilidad de que la ropa quede "exactamente" como en una fotografía que tienes en la mano, es una obviedad que la probabilidad es la misma que si esta queda ordenada. Pero entonces.... ¿cuál es el misterio que querías desvelarnos?"

    Ningún misterio, es todo una perogrullada. Y eres tú el que no quieres verlo, empezando con lo de que estaba fumado.
    Lee el enlace que te di, que queda muy clarito.
    Y no insultes la inteligencia de los lectores que sí entendieron perfectamente los argumentos y explicaciones que di, y que llevo repitiendo hasta la saciedad.

    Para empezar, intentando, como ElBesugo, asignar lo de la compresión ZIP con la probabilidad, cuando dije que eran la misma, y que se trataba de un marcador o "firma" digital. Y desde ahí sigues tergiversando, haciendo ataques ad hominem, sacando a colación supuestos avistamientos OVNI y demás zarandajas.
    Si tanto te molestaron las felicitaciones que recibí por parte de algunos contertulios después de haber dicho que estaba fumado, te das con una piedra en los coj****, y cuando se te pase el dolor, puedes serenarte y reconocer que no me entendiste al principio.



    75
    De: Suminona Fecha: 2007-02-22 18:23

    " 50% de que se produzca la llamada, las horas más adecuadas para ausentarte 15 minutos sin perder la llamada son todas aquellas que no estén comprendidas entre las 6 y las 8"

    Está puntilloso el nené :)

    Bueno una llamada entre las 6 y las 8, no de 6 a 8.

    Ánimo y mójate.



    76