Tres señalamientos al bayesianismo… y una puntualización

Publicado: 19 julio, 2011 en Ciencia

No, por delicioso que sea el pasatiempo de medir, es de todas las ocupaciones la más inútil, y someterse a los decretos de las mensores la más servil de las actitudes.

Virginia Woolf (Woolf, 1929: 94)

Prefiguración

El presente texto buscó seguir hasta sus últimas consecuencias una idea.

Generalmente, se ha sostenido que utilizar el lenguaje de la probabilidad es, cuando no natural, útil para tomar decisiones y evaluar nuestras creencias en la cotidianidad. Esto representa un gran inconveniente cuando uno se pone a pensar seriamente si las personas comunes y corrientes andan haciendo multiplicaciones y divisiones diariamente en su vida. Sin embargo, el modelo que se propone con el nombre de bayesianismo, y que dista un poco de aquél que propuso en su momento el reverendo Bayes, es uno que muestra una buena intuición de principio: tener en cuenta que existe en todas las personas un conocimiento previo desde donde se aborda el mundo. De ahí que decidiera probar si el problema anterior residía solamente en la asignación de números a nuestras creencias, o existe algo más que entorpece toda la ecuación. Por tanto, la propuesta que introduzco es pensar sobre la posibilidad de que las probabilidades utilizadas en las redes bayesianas sean unas no numéricas.

De los procesos bayesianos

Leonard J. Savage, en su texto intitulado The Foundation of Statistical Inference, sostiene que son tres los argumentos que se encuentran en la base del bayesianismo (Savage, 1962; citado en: Pearl, 2001: 19):

  1. It is plain silly to ignore what we know;
  2. it is natural and useful to cast what we know in the language of probabilities and;
  3. if our subjective probabilities are erroneous, their impact will be washed out in due to time, as the number of observations increases.

Es más que conocido el salto epistémico que implica aceptar (i), al menos cuando se le compara con las primeras versiones del positivismo lógico y sus enunciados observacionales (o protocolares, o elementales -dependiendo de a quién nos refiramos-); donde lo nuclear de la concepción gira en torno a la idea de una observación neutral transformada en un enunciado con significación. Sin embargo, cuando a partir de los treintas se empieza a gestar la tesis de que toda observación está cargada de teoría (o es dependiente de ella, o es esencialmente teórica), y surgen textos tan paradigmáticos como el de Norwood Russell Hanson (1958), o frases tan significativas como la que enuncia Thomas Samuel Kuhn en The Structure of Scientific Revolutions cuando cierra su más que conocido capítulo X; no sólo sería ingenuo no aceptar (i) sino que, incluso, sería pertinente reflexionar profundamente sobre las implicaciones que pudiese tener directamente en (iii).

Éste es el primer señalamiento que puedo hacer al bayesianismo; sin embargo, a pesar de que este punto es uno que considero esencial para el devenir de la reflexión filosófica sobre la ciencia, en el presente texto no lo abordaré más por cuestiones relativas al espacio.

Judea Pearl, en su artículo Bayesianism and Causality, or, Why Am I Only a Half-Bayesian, es quien hace el segundo y tercer señalamiento al bayesianismo. Uno de ellos implica afirmar rotundamente que (iii) es falso. El segundo, y es justamente en el que profundizaré a lo largo del presente texto, es el que busca desmentir la generalidad que se desprende de (ii).

Sin embargo, antes de dar ese paso que considero pertinente y necesario, cabría preguntarse más por ese lenguaje de la probabilidad puesto que, al parecer, no deja de rondar los pasillos del quehacer científico; pero, sobre todo, cabría reflexionar sobre qué se encuentra sosteniendo la afirmación de que “sería natural y útil” pensar lo que sabemos en los términos que emanan de la matemática y de la lógica de la probabilidad.

De las probabilidades

Mucho se ha escrito sobre la base de suponer que el lenguaje de la probabilidad no sólo es el lenguaje de la inducción sino que, también, es la herramienta que utiliza un sujeto racional para tomar decisiones (Teoría de la Elección Racional); incluso, que es el lenguaje mediante el cual los individuos ponderan sus creencias -sin la necesidad de hacer mención de la utilidad esperada. Éste último punto es sumamente controvertido, cuestionado de principio por la posibilidad de graduar las creencias de los sujetos y, en segundo lugar, puesto en duda en el punto mismo que afirma que el razonamiento de los sujetos se subsume a los axiomas de Kolmogorov. Sin embargo, pareciese existir cierto consenso en lo que respecta a sostener que la probabilidad es el lenguaje de la inducción. Aun así, un texto a mi parecer clave que desmiente esto último es el de John D. Norton (2006). En éste artículo, el autor sostiene que lo anterior no es siempre cierto y que, por tanto, los argumentos inductivos pueden sostenerse sin la necesidad de apelar a la probabilidad (en cualesquiera de sus múltiples interpretaciones). Norton sostiene, en vez, una noción material de la inducción que se basa en el principio principal David Lewis. La teoría material de la inducción nos dice, grosso modo, que el tipo de lógica que debemos de utilizar para sostener una inducción es dependiente de las propiedades físicas involucradas en el fenómeno a estudiar.

Sin embargo, continuar por el trecho que guía a Norton es desviarme de los objetivos del presente texto. Es más atinado, en cambio, detenerme un poco en el paréntesis que mencioné al paso en el párrafo anterior -el que saca a relucir la carencia de una sola interpretación de la probabilidad.

León Olivé resume muy atinadamente éste problema:

Habiendo revisado algunas de las más importantes interpretaciones de la noción de probabilidad, he llegado a la conclusión de que ninguna de ellas integra, por sí sola, una teoría adecuada de este concepto. No sólo es poco satisfactorio el significado que asignan, cuando lo hacen, al término ´probablidad´, sino que tampoco analizan apropiadamente a qué se refieren los enunciados probabilísticos -si es que se refieren a algo- ni dan cuenta del papel de los métodos de asignación de probabilidades numéricas o de los procesos racionales que se ponen en juego […] (Olivé, 1981: 29)

Es realmente de extrañar que, aun sabiendo todo el abismo que se encuentra el centro mismo de la concepción de probabilidad; se asuma que los sujetos la utilizan como lenguaje en su vida cotidiana o, dicho en sus palabras, que es natural para ellos tomar decisiones apegándose a Kolmogorov.

Resultaría sumamente extenso ponerme a relatar en estos momentos toda la historia de las distintas nociones de probabilidad; es más resultaría incluso vano puesto que existe mucha literatura al respecto. Me parece más viable relatar las conclusiones a las que llega Olivé en el texto antes citado; al cual gusto en remitir si se quiere profundizar más allá de las sencillas líneas que a continuación redactaré.

A grandes rasgos, Olivé encuentra dos sentidos en los que se utiliza el concepto de probabilidad: un enfoque informal, que llama modal, y que representaría una interpretación subjetiva de la probabilidad que nombraré aquí prob1; y un segundo enfoque que implica pensar a la probabilidad en términos epistémicos, prob2.

Prob1 surge del análisis que se hace de la probabilidad entendida en su uso cotidiano y, en este sentido, “se emplea para modificar la fuerza con la que decimos algo, pero no afecta aquello de lo cual estamos hablando” (Ibíd.: 30). Sumado a esto, continúa, es importante resaltar que existe en el mundo una forma en la cual la creencia expresada en términos probabilísticos puede ser afirmada o falseada. En ésta interpretación, existe una cuantificación en términos de la fuerza con la cual uno afirma cierto enunciado con base en la información adicional que se tiene. Sin embargo, ésta cuantificación es una que se escapara por completo al lenguaje numérico; es, por tanto, que Olivé llega a afirmar que la prob1 “al diluirse en el manejo de términos modales, es incuantificable. El problema de medirla carece de sentido (Ibíd.: 48).

La cuestión aquí, puedo suponer, es que para sostener el argumento que esgrime Olivé en el artículo citado, es necesario resaltar la incuantificación de la prob1; pero, a mi parecer, el autor maneja de forma muy estricta lo relativo a la cuantificación y la remite solamente a la atribución de un número, sea éste racional, real o imaginario. La propuesta que iré esbozando implica aceptar que existen ciertas cuantificaciones que no son numéricas y que, por tanto, no sólo no seguirían los axiomas de Kolmogorov, sino que se volvería necesario construir tanto otro lenguaje como otro espacio de existencia para ellas.

En lo que respecta a la prob2, se afirma en cambio que:

[…] es una propiedad de los modelos teóricos, racionalmente construidos, que representan sólo aspectos parciales de sistemas reales. La probabilidad es la medida de posibilidad de los estados finales de los modelos teóricos. La probabilidad mide qué tan posible es un evento teórico, o sea, una representación racional de un evento, o un tipo de eventos reales. El evento teórico es la representación racional del evento real; es un estado posible de un modelo teórico, el cual representa parcialmente al sistema real (Ibíd.: 39).

Lo anterior implica que la probabilidad “queda en función de los modelos teóricos” (Ibíd.: 40) y, por tanto, el cálculo que se haga dependerá de los presupuestos que sostengan a cada tipo de modelo; es decir, que un mismo evento podrá obtener distintos valores probabilísticos a la luz del sistema lógico matemático al cual se inscriba. De aquí que no exista un procedimiento único que pueda o no desmentir un enunciado probabilístico.

Hasta aquí ya se puede vislumbrar un gran problema. Todos los modelos lógico matemáticos de la probabilidad, es decir, todos los modelos formales, se apegan al sentido de la prob2 que es uno epistémico. Sin embargo, ejecutan malabares teóricos para poder estirar ésta interpretación de probabilidad y subsumir dentro de ella a la de la prob1 (cuando ya se argumentó que son sentidos sumamente distintos).

Podría pensar que la diferencia mayor se encuentra justamente en esa manía de la numeración. Lo cual no resulta ser una extrañeza cuando se analiza la historia y la cosmogonía que está detrás tanto de la probabilidad, como de la ciencia y los hombres que la estudian (y donde el bayesianismo pareciese hacer las veces de piedra angular).

Grosso modo, Giere (1995) expone que existieron dos grandes influencias en la base de la concepción contemporánea de la ciencia: la teología y la matemática. En la primera podemos encontrar los vestigios de las ideas que sostienen la existencia de algo así como unas leyes universales en la naturaleza -recordemos a Newton y su necesidad de introducir a Dios como explicación de sus ecuaciones. En lo que respecta a la matemática, son más bien las formas de pensamiento que encuentran su raíz en las sectas pitagóricas. Es de resaltar que toda la cosmogonía que se desprende de ésta última escuela, desestimaba todo lo que tuviese que ver con números (por aquello de las atrocidades que representan los números irracionales y demás). Sin embargo, con los desarrollos de Descartes, Galileo y Newton comienza una nueva era de matematización del mundo (Martínez, 1997) donde, partiendo del supuesto del mundo mecánico, la idea era encontrar las ecuaciones que pudiera reflejar ésta estructura. El paso siguiente que encontramos en ésta historia, es el de la probabilidad que, puedo pensar, representa el relajamiento, del relajamiento, del relajamiento del criterio de conocimiento por demostración de Aristóteles. O, dicho en otras palabras, al irse imponiendo el mundo a las formas válidas de conocimiento que el ser humano fue desarrollando, la probabilidad llega en última instancia como esa herramienta que, de alguna manera, puede sortear la imposibilidad del conocimiento absoluto. En este sentido, la probabilidad expresada en números fue la forma como el ser humano pudo enfrentarse con el mundo. De aquí que, actualmente, quiera pensarse que es la única forma válida de hacerlo.

Regresando a lo que me compete. Uno de los mayores inconvenientes que puedo observar en el argumento (ii) de Savage, es en lo que respecta a lo natural de expresar nuestras creencias en el lenguaje de la probabilidad. No es que él lo esté afirmando de forma explícita, pero pareciese que detrás de ese calificativo, más que una intención normativa, se esconde una sentencia descriptiva que está muy lejos de sostenerse. Es sumamente sencillo preguntar a cualquier persona si sus creencias están graduadas y, si esto el caso, verificar que éstas a su vez respondan a los axiomas de Kolmogorov; el resultado obvio es que no es así. Ahora, si el contrargumento implica afirmar que lo que acontece es que solamente una persona racional lo expresa de esa manera y bajo esas reglas, entonces lo que sucedería es que el grueso de la población o no es racional (lo que no quiere decir que sea irracional), o esa forma de caracterizar la racionalidad está errada.

El cuestionamiento de fondo apunta a la necedad de meter números en cualesquiera de los fenómenos que se quieran estudiar; reitero, como si esto asegurara su validez o cientificidad. Si en la actualidad tanto físicos como matemáticos están poniendo en duda la fuerza de la probabilidad para resolver problemas de fenómenos físicos imaginarios (ver el ejemplo del domo que analiza Norton, 2006); ¿por qué seguir insistiendo en la necesidad de colgarle números a las creencias de los sujetos?

De las probabilidades no numéricas

Como desarrollé anteriormente, el sentido de la prob1 es uno difuso que se escapa a la graduación numérica. En general, éste tipo de probabilidades son conocidas como subjetivas. Lo interesante es que, en el álgebra bayesiana, las probabilidades anteriores son subjetivas y sólo mediante sus artilugios se convierten en probabilidad epistémicas (posteriores). La cuestión de resaltar aquí es que, en el bayesianismo, las probabilidades anteriores son adornadas con números que las representan; ¿cómo hacen esto? Para mí sigue siendo un misterio, por eso existieron intentos como el de la probabilidad lógica de Carnap que pretendía convertir a las probabilidades (grado de confirmación en su modelo) en enunciados analíticos. Pero Rudolf Carnap no fue ni el primero ni el único en hacerlo; antes de él podemos nombrar al más que conocido Bruno de Finetti, a Toulmin o al no tan reconocido Cesáreo Villegas. Éste último, por ejemplo, tiene un texto que me llamó mucho la atención pues lo intituló: On Qualitative Probabilitiy σ-Algebras. La sola idea de pensar probabilidades cualitativas me pareció un excelente camino para confrontar la manía de cuantificación que he venido desarrollando. Sin embargo, la sorpresa me embargó cuando su artículo trataba sobre la formalización que convierte éstas probabilidades cualitativas en un número cuantificable, es decir, sobre el cómo asignarle una medida de probabilidad. Esto lo hace, en resumidas cuentas, siguiendo la siguiente línea de pensamiento: “[…] if a qualitative probability is atomless and monotonely continuous, then there is one and only one probability measure compatible with it, and this probability measure is countably additive” (Villegas, 1964: 1787). Lo cual no sólo hace que las probabilidades cualitativas sean numéricas, sino que mediante éste mecanismo, las probabilidades subjetivas se subsumen a su axiomatización:

We simply remark that a qualitative probability, as a numerical one, may be interpreted either as an objetive or as a subjetive probability, and therefore the followong axiomatic theory is compatible with both intepretations of probability (Ibíd.: 1787).

Sin embargo, la formalización que hace Villegas sirvió de base para posteriores desarrollos más acorde con el espíritu de éste texto. Dentro de ellos, puedo mencionar a Terrence Fine y su artículo A note on the existence of quantitative probability.

Lo destacado de Fine es que justamente introduce la noción de probabilidades no numéricas, sin embargo, cuantificables. La forma en la que lo hace es introduciendo una relación de probabilidades comparativas, donde tres teoremas y seis axiomas bastan para probar su existencia. No me detendré aquí a analizar la validez de sus pruebas; asumiré su corrección y, más bien, me centraré en analizar sus presupuestos (los postulados de Fine se encuentran en el Anexo1).

Cuando anteriormente destaqué que era necesario otro lenguaje y otro espacio desde donde se pudiera trabajar la cuantificación de las probabilidades subjetivas, Fine parece encontrarlo en la lógica de conjuntos y la topología.

El primer paso en falso que salta a la vista es en lo que respecta a C4, lo cual implica que el espacio muestral sea uno contable, es decir, que no sea infinito. Sin embargo, al pensar en utilizar éste modelo en el conjunto total de las creencias de un individuo; resulta obvio que no es un conjunto infinito, pero que sea posible contar y tener conciencia de todos los elementos de éste conjunto surge en primera instancia como una imposibilidad.

El resultado de esto implica aceptar que incluso un modelo de probabilidades no numéricas es inutilizable para proveer herramientas manejables para un sujeto. Sin embargo, esto solamente si se toma en cuenta la totalidad del conjunto de creencias de un sujeto en determinad tiempo t. Lo que podría ser es que funcionase cuando se tomara en cuenta como la totalidad del sistema de creencias a un subconjunto de ellas, que estén involucradas en cierto evento x y en determinado momento t. Si esto es el caso, entonces C4 no presentaría inconveniente alguno y, así, se podría cuantificar la fuerza de determinada creencia sin la necesidad de asignarle un número. Sin embargo, ésta salvedad de que el conjunto a cuantificar sea un subconjunto específico para cierta x en t del total de las creencias de un sujeto, suena a que no resulta ser ni natural, incluso que sería más bien inútil en la mayoría de los casos cotidianos (y aquí entrarían de lleno todas las críticas que se le hacen a la Teoría de la elección racional, sobre todo aquellas que mencionan que los individuos tienen cosas más importantes qué hacer que estar asignando probabilidades a sus creencias para tomar decisiones).

Sumando a esto, otro inconveniente que considero infranqueable es en lo que respecta a las creencias inconscientes de los sujetos (en el sentido común del término). Es decir, a todas aquellas creencias que no están presentes en la consciencia del sujeto en t y que, sin embargo, están relacionadas con x. Si tomamos en cuenta que la formulación bayesiana toma como base las creencias anteriores del sujeto y, a su vez, se acepta la existencia de creencias inconscientes en juego; habrá sin lugar a dudas un error siempre presente en las probabilidades posteriores puesto que no estarán computadas todas las variables anteriores en juego. De aquí que propuestas como la de Gadamer que llaman a volver conscientes nuestros prejuicios, sean del todo aplicables a este modelo.

De ciertas conclusiones

El hilo que me fue llevando a responder a ciertas críticas que se le hacen al bayesianismo proponiendo que, en vez de utilizar probabilidades numéricas (por lo no natural que representan para el grueso de la población), se utilizaran probabilidades no numéricas (por encontrarlas más acorde con la forma natural de pensamiento de los individuos); resultó ser un callejón sin salida. Puedo decir que existía cierta luz en la idea de que era la asignación de números la que tergiversaba un procedimiento que, a primera vista, me resultaba cabal. Sin embargo, la conclusión implica aceptar que no es la medición numérica sino cualquier tipo de cuantificación que se subsuma a un modelo formal la que se topa con la guillotina de la vida psíquica de los individuos. Esto no quiere decir que no exista cierta cuantificación de la fuerza con la cual uno pueda afirmar una cosa por sobre la otra; el problema reside, a mi parecer, en querer encontrar una fórmula precisa que abarque todos los casos.

Existen en la actualidad otros modelos que intentan formalizar todo este embrollo, uno de ellos son las redes neuronales que se utilizan en el estudio de los fenómenos complejos. Sin embargo, estos modelos responden más bien a una heurísitica que a la rigidez axiomática. Podría ser un camino a seguir el profundizar sobre las consecuencias de estos modelos. Otra herramienta que pudiera servir son las nuevas lógicas difusas; pero no tengo aun el conocimiento para poder afirmarlo con cierta fuerza.

Anexo 1

 

Referencias bibliográficas 

Fine, T. (1971) A note on the existence of quantitative probability. En: The Annals of Mathematical Statistics. Vol. 42, No. 4, 1182-1186.

Giere, R. (1955) The Skeptical perspective: Science without Laws of Nature. Texto electrónico.

Hanson, N. R. (1958) Patterns of Discovery: An Inquiry into the Conceptual Foundations of Science. Cambridge University Press.

Hájek, A. (2009) Fifteen Arguments Against Hypothetical Frequentism. En: Erkenn. 70: 211-235.

Kuhn, T.S. (1962) The Structure of Scientific Revolutions. Chicago: University of Chicago Press.

Martínez, S. (1997 – 2001) De los efectos a las causas. Sobre la historia de los patrones de explicación científica. México: IIFs, PAIDÓS y UNAM

Norton, J. (2006) Induction without Probabilities. Texto electrónico.

Olivé, L. (1981) El concepto de probabilidad. En: CRÌTICA: Revista Hispanoamericana de Filosofía. Vol. 13, No. 137.

Pearl, J. (2001) Bayesianism and Causality, or, Why I Am Only a Half-Bayesian. En: Corfield, D. y Williamson, J. (eds) Foundations of Bayesianism. Texto electrónico.

Savage, L. J. (1962) The Foundations of Statistical Inference. Londres: Methuen and Co. Ltd.

Villegas, C. (1964) On Qualitative Probabilitiy σ-Algebra. Texto electrónico.

Woolf, V. (1929 – 2004) Un cuarto propio. México: Colofón.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s