Accions

Recurs

Piatelli-Palmarini: el teorema de Bayes

De Wikisofia

La versió per a impressora ja no és compatible i pot tenir errors de representació. Actualitzeu les adreces d'interès del navegador i utilitzeu la funció d'impressió per defecte del navegador.

Com que l'hem esmentat ja massa vegades, no podem deixar d'explicar, encara que sigui breument, en què consisteix aquesta famosa llei de Bayes. Feia ja molts segles que l'home havia descobert com explicar, com calcular exactament les superfícies i pesar exactament les mercaderies, però no va ser fins a mitjan segle XVIII quan va aconseguir acabar amb un enigma que, no obstant això, havia d'haver-li turmentat des de sempre: com calcular una probabilitat desconeguda a partir de dades conegudes. Com calcular el futur, basant-se en dades precises que es refereixen al passat? [...]

En l'experiència de la vida diària ens trobem que contínuament hem de prendre decisions sobre la base d'informacions incompletes i hem de buscar després més dades a fi de corregir, o confirmar, les nostres decisions. Un cas típic és aquell en què cal preveure raonablement cert desenvolupament d'esdeveniments que es produirà en el futur i s'intenta obtenir la màxima informació sobre els desenvolupaments més probables. El model més estudiat és el del científic que avança una hipòtesi, realitza els experiments i després decideix fins a quin punt els resultats d'aquests experiments confirmen o desmenteixen la seva teoria. Es tracta de calcular exactament, no de fer una estimació a ull, fins a quin punt és probable que una teoria, o una hipòtesi, sigui veritable, tenint en compte tot el que sabem. Una aplicació immediata, i socialment molt important, és la del metge que realitza proves per a arribar a emetre un diagnòstic. També és bastant senzill estendre aquest model al cas del directiu que ha de prendre certes decisions i que rep posteriors informacions (prospeccions de mercat, inspeccions en les oficines, indiscrecions de borsa, etc.) sobre les quals ha de basar la seva decisió final. Com hem vist abans, aquest tipus de càlcul racional hauria de penetrar també en les sales dels tribunals. Els ingredients essencials del procés bayesià de decisió racional són:


  • a) Una sèrie d'alternatives possibles (el que els estadístics anomenen «estats de naturalesa»), que precedeixen a l'aplicació de la decisió i a la recollida de les dades suplementàries;


  • b) Les probabilitats assignades a priori, és a dir, abans de les comprovacions i dels tests, a cadascuna de les alternatives possibles;


  • c) El grau de fiabilitat i de capacitat predictiva dels diferents tests;


  • d) Els resultats dels tests (o enquestes, o controls);


  • i) Les probabilitats que cal assignar a cadascuna de les alternatives possibles a posteriori, és a dir, després d'haver sabut el resultat dels tests, després d'haver recollit dades suplementàries.


El teorema clàssic de Bayes [...] afirma que les probabilitats que apareixen en i) es poden calcular exactament sobre la base de dades continguts en a), b), c) i d). L'individu racional ideal és un individu, doncs, definit avui dia com a «bayesià». Això significa, dit amb paraules planes, que l'única manera racional possible de minimitzar els riscos i maximitzar les expectatives de guanys és adoptar l'estratègia descrita per Bayes. És com dir que hem de ser individus bayesians si volem aconseguir fer solament les eleccions que siguin racionalment més avantatjoses. Existeixen avui dia teoremes matemàtics que demostren com i per què la fórmula de Bayes és (almenys en abstracte i en condicions ideals) l'única capaç de fer que determinades eleccions probabilístiques siguin enterament racionals.

Una manera intuïtiva per a entendre en què consisteix l'estratègia bayesiana, la que haurem d'adoptar, està expressat pel següent raonament (aproximatiu, però intuïtivament correcte):

Per a cada estat de naturalesa, es comença a obtenir la probabilitat que es produeixi tenint en compte el resultat del test (és a dir, la seva probabilitat a posteriori) multiplicandola probabilitat que es produeixi en qualsevol cas (per tant, amb el test o sense -les que havíem denominat probabilitats a priori) per la fiabilitat intrínseca del test (o sigui, per la probabilitat que el test atorga a l'estat de naturalesa que ens interessa, respecte a tots els altres estats de naturalesa possibles).

Evidentment, existeix una fórmula: la fórmula (o llei, o teorema) de Bayes. Per no espantar massa al lector que sent escassa simpatia per les fórmules matemàtiques, oferiré una versió semicol·loquial.

La formulilla del canonge Thomas Bayes

La probabilitat que una hipòtesi (concretament, un diagnòstic) sigui correcta, una vegada efectuat el test, és igual a:

La probabilitat del resultat del test, donada la hipòtesi [...], multiplicada per la probabilitat de la hipòtesi «en absolut» (és a dir, independentment del test), i dividida per la probabilitat del resultat del test «en absolut» (és a dir, independentment de la hipòtesi -o diagnòstic).

Ni més ni menys.

He utilitzat l'expressió «en absolut» per a donar un toc de sensacionalisme a la formulilla, per a alleugerir la serietat de la frase. Concretament, aquestes probabilitats «en absolut» són les que estem disposats a assignar racionalment al resultat del test en si mateix i per si mateix, sense parar esment a la nostra hipòtesi (o diagnòstic) i, respectivament, a la nostra hipòtesi (o diagnòstic), sense parar esment al resultat del test.

Los túneles de la mente, Crítica, Grijalbo Mondadori, Barcelona 1995, p. 107-110.

Original en castellà

Puesto que la hemos mencionado ya demasiadas veces, no podemos dejar de explicar, aunque sea brevemente, en qué consiste esa famosa ley de Bayes. Hacía ya muchos siglos que el hombre había descubierto cómo contar, cómo calcular exactamente las superficies y pesar exactamente las mercancías, pero no fue hasta mediados del siglo XVIII cuando consiguió acabar con un enigma que, no obstante, debía haberle atormentado desde siempre: cómo calcular una probabilidad desconocida a partir de datos conocidos. ¿Cómo calcular el futuro, basándose en datos precisos que se refieren al pasado? [...]

En la experiencia de la vida diaria nos encontramos con que continuamente tenemos que tomar decisiones sobre la base de informaciones incompletas y tenemos que buscar después más datos a fin de corregir, o confirmar, nuestras decisiones. Un caso típico es aquel en que hay que prever razonablemente cierto desarrollo de acontecimientos que se producirá en el futuro y se intenta obtener la máxima información sobre los desarrollos más probables. El modelo más estudiado es el del científico que adelanta una hipótesis, realiza los experimentos y después decide hasta qué punto los resultados de estos experimentos confirman o desmienten su teoría. Se trata de calcular exactamente, no de hacer una estimación a ojo, hasta qué punto es probable que una teoría, o una hipótesis, sea verdadera, teniendo en cuenta todo lo que sabemos.Una aplicación inmediata, y socialmente muy importante, es la del médico que realiza pruebas para llegar a emitir un diagnóstico. También es bastante sencillo extender este modelo al caso del directivo que tiene que tomar ciertas decisiones y que recibe posteriores informaciones (prospecciones de mercado, inspecciones en las oficinas, indiscreciones de bolsa, etc.) sobre las que debe basar su decisión final. Como hemos visto antes, este tipo de cálculo racional debería penetrar también en la salas de los tribunales. Los ingredientes esenciales del proceso bayesiano de decisión racional son:


  • a) Una serie de alternativas posibles (lo que los estadísticos llaman «estados de naturaleza»), que preceden a la aplicación de la decisión y a la recogida de los datos suplementarios;


  • b) Las probabilidades asignadas a priori, es decir, antes de las comprobaciones y de los tests, a cada una de las alternativas posibles;


  • c) El grado de fiabilidad y de capacidad predictiva de los distintos tests;


  • d) Los resultados de los tests (o encuestas, o controles);


  • e) Las probabilidades que hay que asignar a cada una de las alternativas posibles a posteriori, es decir, después de haber sabido el resultado de los tests, después de haber recogido datos suplementarios.


El teorema clásico de Bayes [...] afirma que las probabilidades que aparecen en e) se pueden calcular exactamente sobre la base de datos contenidos en a), b), c) y d). El individuo racional ideal es un individuo, pues, definido hoy en día como «bayesiano». Esto significa, dicho con palabras llanas, que el único modo racional posible de minimizar los riesgos y maximizar las expectativas de ganancias es adoptar la estrategia descrita por Bayes. Es como decir que debemos ser individuos bayesianos si queremos conseguir hacer solamente las elecciones que sean racionalmente más ventajosas. Existen hoy en día teoremas matemáticos que demuestran cómo y por qué la fórmula de Bayes es (por lo menos en abstracto y en condiciones ideales) la única capaz de hacer que determinadas elecciones probabilísticas sean enteramente racionales.

Un modo intuitivo para entender en qué consiste la estrategia bayesiana, la que deberemos adoptar, está expresado por el siguiente razonamiento (aproximativo, pero intuitivamente correcto):

Para cada estado de naturaleza, se empieza a obtener la probabilidad de que se produzca teniendo en cuenta el resultado del test (es decir, su probabilidad a posteriori) multiplicandola probabilidad de que se produzca en cualquier caso (por tanto, con o sin el test -las que habíamos denominado probabilidades a priori) por la fiabilidad intrínseca del test (o sea, por la probabilidad que el test otorga al estado de naturaleza que nos interesa, respecto a todos los otros estados de naturaleza posibles).

Evidentemente, existe una fórmula: la fórmula (o ley, o teorema) de Bayes. Para no asustar demasiado al lector que siente escasa simpatía por las fórmulas matemáticas, voy a ofrecer una versión semicoloquial.

La formulilla del canónigo Thomas Bayes

La probabilidad de que una hipótesis (concretamente, un diagnóstico) sea correcta, una vez efectuado el test, es igual a:

La probabilidad del resultado del test, dada la hipótesis [...], multiplicada por la probabilidad de la hipótesis «en absoluto» (es decir, independientemente del test), y dividida por la probabilidad del resultado del test «en absoluto» (es decir, independientemente de la hipótesis -o diagnóstico).

Nada más y nada menos.

He utilizado la expresión «en absoluto» para dar un toque de sensacionalismo a la formulilla, para aligerar la seriedad de la frase. Concretamente, estas probabilidades «en absoluto» son las que estamos dispuestos a asignar racionalmente al resultado del test en sí mismo y por sí mismo, sin prestar atención a nuestra hipótesis (o diagnóstico) y, respectivamente, a nuestra hipótesis (o diagnóstico), sin prestar atención al resultado del test.