domingo, 14 de junio de 2009

La arítmetica de la ayuda mutua


EXPERIMENTOS NFORMÁTICOS DEMUESTRAN QUE ES LA COOPERACIÓN, Y NO LA EXPLOTACIÓN, EL FACTOR DOMINANTE EN LA LUCHA DARWINISTA POR LA SUPERVIVENCIA.
Martin A Nowak, Robert M. May y Karl Sigmund


El principio del toma y daca impregna toda nuestra sociedad. Es más antiguo que el comercio y el trueque. Quienes viven en una misma casa, por ejemplo, participan en un incesante, y casi inconsciente, intercambio de bienes y servicios. Estos intercambios les resultan cada vez más fascinantes a los economistas. Y lo mismo les ocurre a los biólogos, quienes han recogido multitud de ejemplos similares en grupos de chimpancés y otros primates. El propio Charles Darwin tenía plena conciencia del papel de la cooperación en la evolución humana. Así escribía en el origen del hombre: "La poca fuerza y velocidad del hombre, su carencia de armas naturales, etc., quedan holgadamente compensadas por sus... cualidades sociales, que le llevan a dar y recibir ayuda de sus congéneres."
Evidentemente, una gran distancia separa estas ideas se la salvaje existencia human que el filósofo Thomas Hobbes calificaba como "solitaria, pobre, detestable, brutal y breve." No obstante, buen número de primeros seguidores de Darwin cargaron las tintas en los aspectos feroces de "la lucha por la supervivencia", hasta el punto de que el príncipe ruso Kropotkin se sintió obligado a escribir un libro para refutarles. En el apoyo mutuo, un factor de la evolución, aclamada por el Times londinense como "posiblemente el libro más importante del año" (1902), Kropotkin trazó un vasto fresco donde mostraba a la cooperación actuando entre las hordas siberianas, entre los isleños polinesios en los gremios medievales. Kropotkin era un célebre ideólogo del anarquismo, pero su incursión en la historia natural, aunque superficial, no se debía a mera afición: para alguien como él, decidido a librarse del estado, resultaba esencial demostrar que la cooperación humana no estaba impuesta por la mano férrea de la autoridad, sino que sus orígenes arraigaban en condiciones naturales.
En cierto modo, sus argumentos han tenido mucho más éxito del que Kropotkin pudo llegar a prever. Profusión de estudios de antropología y primatología indican el aplastante papel de la ayuda mutua en las primitivas sociedades de homínidos. Los textos de comportamiento animal están llenos de ejemplos de mutualismo: en el aseo, la alimentación, la enseñanza, la advertencia, la ayuda en la lucha y caza en grupo. En ecología, se atribuye un papel fundamental creciente a las asociaciones. Los biólogos encuentran ejemplos de cooperación celular en los orgánulos e incluso en las moléculas prebióticas.
Pero al mismo tiempo , todavía más paradójica resulta la ubicuidad que la cooperación parece haber alcanzado. El anarquista ruso no había sabido ver hasta qué punto está la cooperación amenazada por la explotación.
¿Qué impide que los mutualistas se tornen en parásitos? ¿Por qué habría nadie de aportar su parte del esfuerzo común, en lugar de aprovecharse del de los demás? La selección natural prima el éxito reproductor del individuo. ¿Cómo puede este mecanismo moldear un comportamiento que sea altruista, en el sentido de que beneficia a otros a expensas de la progenie propia?
Hay dos métodos de abordar está cuestión, que llevan los encabezamientos se la selección de parentesco y de ayuda recíproca. Estas nociones no son mutuamente excluyentes, aunque sí distintas. La selección de parentesco hunde sus raíces en la genética. Si un gen contribuye a asentar el éxito reproductor de parientes cercanos a su portador, está contribuyendo a promover copias de sí mismo. En el seno familiar, las buenas acciones son su propia recompensa. Mas, para que las buenas acciones hacia los congéneres no emparentados resulten rentables han de tener contrapartida. La ayuda recíproca, esto es, el intercambio de acciones altruistas en las que el beneficio es mayor que el costo, constituye en esencia el intercambio económico. Opera de un modo menos directo que la selección de parentesco y es, por tanto, más vulnerable frente a los abusos.
Dos partes pueden dar con un acuerdo mutuamente ventajoso, pero cada una podría ganar todavía más quedándose en la parte que le correspondería aportar. En la sociedad moderna, un enorme aparato jurídico y policial hace posible resistir la tentación de defraudar. Pero ¿puede funcionar el altruismo recíproco en ausencia de esas instituciones autoritarias tan despreciadas por los anarquistas de Kropotkin? Para responder a esta difícil cuestión convendrá primero considerar sistemas sencillos e idealizados.


EL DILEMA DEL PRESO.

A fin de poner de manifiesto la paradoja, Robert L. Trivers, sociobiólogo (...) tomó prestado de la teoría de los juegos un símil conocido por el dilema del preso. En la versión en que inicialmente fue concebido, a principios de los años cincuenta, se les pregunta por separado a los detenidos si el otro a cometido un delito; la dureza del castigo dependerá de que uno, ambos o ninguno delate al otro. Esta situación puede traducirse a un juego sencillo. Los dos participantes tienen únicamente que decidir si desean o no cooperar. En un ejemplo concreto del dilema de preso, si ambos optan por cooperar, cada uno recibe una recompensa de tres puntos. Si uno delata al otro y éste a aquél (no cooperan), obtienen solamente un punto cada uno. Pero si uno delata y el otro coopera, el delator recibe cinco puntos mientras que el otro no recibe nada.
¿Cooperarán? Si el primer jugador delata, el segundo, que coopera, acabará sin nada. Salta a la vista que el segundo jugador debería haber delatado. La verdad es que, aunque el primer jugador cooperase, el segundo debería delataron porque está combinación le da cinco puntos, en lugar de tres. Haga lo que haga el primero, la mejor opción del segundo es delatar. Pero el primer jugador se encuentra exactamente en la misma situación. Por tanto, ambos jugadores elegirán traicionar y recibirán un punto cada uno. ¿Por qué no cooperarían?.
Las decisiones de los detenidos ponen de relieve la diferencia entre lo mejor desde un punto de vista individual y desde el punto de vista colectivo. Este conflicto pone en entredicho prácticamente todas las formas de cooperación, entre ellas, el intercambio y el mutualismo. La recompensa de la cooperación mutua es mayor que el castigo por delación recíproca, pero la traición unilateral suscita una tentación mayor que la recompensa, dejando al cooperador explotado con un pago, por dejarse timar, todavía peor que el castigo. Esta gradación- desde la tentación, pasando por la recompensa de la cooperación hasta el "pago del pardillo"- implica que la mejor jugada consiste en defraudar siempre, sin tener en cuenta la posible jugada del adversario. La lógica conduce inexorablemente a la mutua defección.
Casi todo el mundo sienta desazón ante semejante conclusión. La verdad es que la gente sí suele cooperar, movida quizá por sentimientos de solidaridad o de generosidad. En las transacciones comerciales, la defraudación también es relativamente rara, debido, tal vez, a la presión social. Sin embargo, las reservas de esta clase no habrían se afectar a un juego que capta la vida en un sentido puramente darwinista, en el cual cada posible ganancia (sea en calorías, en apareamientos on en seguridad frente a los depredadores) queda en última instancia convertida en una moneda única: descendencia.

TORNEOS VIRTUALES.

Cabe imaginar un experimento ideal en el cual toda la población esté formada por jugadores programados. Cada uno de estos autómatas se halla firmemente emparejado a una estrategia fija, y, o bien coopera siempre, o bien defrauda siempre. Los jugadores contienden, por el sistema de liga, en un campeonato de “dilema del preso”, donde cada uno se enfrenta a todos (incluido él mismo). El pago total de cada contendiente dependerá de los jugadores a los que se enfrente, y por tanto, de la composición de la población. De todas formas, un defraudador logrará siempre más de lo que en su lugar podría ganar un cooperador. Finalizado el imaginario campeonato, los jugadores se reproducen, engendrando descendencia de su misma especie). La generación siguiente vuelve a contender en una liga de iguales características, siendo pagada con progenie y así sucesivamente. En esta caricatura de la evolución biológica, en la cual el pago es el número de descendientes y en la que las estrategias son hereditarias, el resultado final es obvio: los depredadores irán aumentando sin cesar y podrán acabar invadiendo toda la población.

Hay diversos modos de escapar a esta suerte. En muchas sociedades, unos mismos dos individuos interactúan no una sola vez, sino frecuentemente. Ahora, cada participante se lo pensará dos veces antes de defraudar, si su jugada provoca que el otro jugador le pague en la misma moneda a la primera ocasión que pueda. Por consiguiente, la estrategia correspondiente al juego reiterado puede variar en respuesta a lo ocurrido en rondas anteriores.

En contraste con el caso “a una vuelta” del dilema del preso, donde siempre es preferible defraudar, existe para la versión reiterada un sinfín de estrategias, ninguna de las cuales constituye una respuesta universalmente óptima frente a todo posible oponente. Si el jugador contrario decidiera, supongamos, cooperar siempre, lo que más nos convendría sería defraudar siempre. Pero si nuestro socio decide cooperar hasta que nosotros defraudemos y no cooperar jamás a partir de ese momento, más nos valdrá no echar a perder esta asociación: la tentación de hacer trampa en un envite y apoderarnos de cinco puntos en lugar de tres estará más que anulada por la pérdida esperada en las rondas subsiguientes, en las que no podremos ganar más que un punto.

La inexistencia de estrategia óptima es crucial. No existe una receta pura y dura para jugar al dilema reiterado del preso. El éxito de una estrategia depende de la estrategia del otro jugador, que no es conocida de antemano. Una estrategia feliz en ciertos ambientes puede fracasar estrepitosamente en otros.

Hacia finales de los años setenta, Robert Axelrod, llevó a cabo en su ordenador una serie de torneos del “dilema iterado del preso”. Los contendientes programas propuestos por sus colegas, traducían elaboradas estrategias, pero resultó que la victoria final fue para la más sencilla de las estrategias presentadas. Esta se llama “toma y daca” (tit-for-tat). Comienza cooperando; después repite siempre la jugada anterior del otro.

Vale la pena señalar que el jugador que aplique “toma y daca” jamás irá de primero en ninguna fase del juego reiterado, pues es siempre el último en defraudar. A pesar de ello, el jugador “toma y daca” puede ganar el campeonato, porque “el dilema del preso” no es un juego de suma cero: siempre es posible obtener puntos sin tener que quitárselos a otros. Merced a la transparencia de su conducta, “toma y daca” logra muchas veces persuadir a sus oponentes se que la cooperación es rentable.(...)

Siendo ganadora del campeonato “toma y daca” obtuvo en la generación siguiente mayor número de representantes que otras estrategias. Además los jugadores que habían cooperado propendieron a recibir más descendencia que quienes no lo hicieron. “Toma y daca” fue moldeando a cada generación un ambiente más proclive. Las estrategias que expoliaban sin piedad a los cooperadores solamente tuvieron éxito hasta el agotamiento de sus propios recursos.


ADVERSARIOS IMPREDECTIBLES.


Hemos realizado recientemente simulaciones computarizadas con un sistema generalizado de estrategias que fundan su próxima jugada en los resultados de la ronda anterior, en vez de basarse solamente en la anterior jugada de su adversario (como hace “toma y daca”). Una estrategia dependiente de los resultados anteriores tiene que determinar qué respuesta dará en cuatro eventualidades: tentación, recompensa, castigo o pérdida. Como cada una de éstas admite dos respuestas posibles, hay 16 tipos de posibles jugadores.

Introdujimos, además, estrategias “estocásticas” que responden a los cuatro resultados posibles modificando solamente su propensión estadística a la cooperación. Tales estrategias no están obligadas a responder siempre de igual manera ante un resultado dado. Cierto tipo de jugador estocástico podría, por ejemplo, cooperar en el 90 por ciento de las veces tras recibir la recompensa. Tal incertidumbre remeda los inevitables errores que se producen en las interacciones reales.

La inclusión de respuestas aleatorias desembocó en una enorme variedad de posibilidades. Nuestro ordenador buscó el más afortunado de estos jugadores mediante simulación de las fuerzas de la selección natural, añadiendo a cada centésima generación una pequeña dosis de estrategia nueva, seleccionada al azar. Le seguimos la pista a muchas de tales rondas de selección por mutación, no a causa de que el seguimiento de la cooperación necesitase de tantas interacciones, sino porque se esta manera podíamos poner a prueba un grandísimo número de posibles estrategias.

A pesar de la rica diversidad que mostraban estas crónicas, nos vimos invariablemente conducidos hasta ciertos resultados sencillos y claros. El primero es que el pago medio de la población puede cambiar repentinamente. De hecho el comportamiento que descubrimos constituye un paradigma de las hipótesis de la evolución biológica por equilibrios puntuales. Ocurría que, durante la mayor parte del tiempo, o bien casi todos los miembros cooperaban, o bien casi todos explotaban. Las transiciones entre estos dos regímenes son por lo general raras y abruptas, y se producen en sólo unas cuantas generaciones. Descubrimos que, al ir avanzándola simulación, los períodos de estabilidad tendían a durar más. Y se apreciaba un sesgo decidido hacia la cooperación. Cuanto más tiempo se permitía que evolucionase el sistema, mayor era la probabilidad de florecimiento de un regímen cooperativo. Pero la amenaza de un desplome súbito persistía siempre.

Las poblaciones cooperativas quedan a veces dominadas por una estrategia denominada “toma y daca generosa”, variante que en ocasiones ofrece cooperación en respuesta a la defección del otro. Pero era mucho más frecuente que acabase por reinar una estrategia de “Pavlov”, debida a los matemáticos David P. Kraines y Vivian Kraines.

Tras disfrutar de la recompensa por cooperación mutua, el jugador “pavloviano” repite su jugada cooperativa anterior. Análogamente, si sale bien librado de una defección unilateral por su parte, vuelve a repetir esta última jugada. Pero una vez castigado con la defección del otro, Pavlov opta por no cooperar. Y cuando recibe el “pago del timado” por haber cooperado unilateralmente, reacciona con la defección. En breve, la regla de Pavlov manda atenerse a la jugada anterior si le reportó una ganancia elevada (la recompensa o la de la tentación) y cambiarla si la remuneración fue baja (el castigo o el pago por dejarse timar).

Este principio de “ganar-seguir-perder-cambiar” parece funcionar bien en muchas otras situaciones. Es tenida por fundamental en psicología animal: las ratas se muestran dispuestas a repetir acciones que les reportan recompensa, mientras que tienden a abandonar conductas de consecuencias dolorosas. Esta misma burda aplicación del método de “palo caramelo” está implícita en casi todos los métodos de educación infantil.

En el caso del dilema reiterado de preso, la represalia tras haber sido explotado suele ser tenida como prueba de comportamiento similar al “toma y daca”, pero es igualmente válida para jugadores que se atienen a Pavlov. Una sociedad de estrategas pavlovianos es muy estable frente a errores. Una defección cometida por error entre dos miembros conduce a una ronda de defección mutua y vuelve después a la cooperación. Pero enfrentando a un jugador que no devuelve el golpe, el jugador Pavlov proseguirá con la defección. Este comportamiento hace difícil que los cooperadores a ultranza lleguen a encontrar asidero en la comunidad. Por contra , una sociedad de “toma y daca” generoso no discriminar a los cooperadores incondicionales. Esta benevolencia resulta onerosa a la larga, porque los jugadores que no toman represalias pueden difundirse por la población y, al consentir que los explotadores medren, acaban socavando la cooperación.

Aunque Pavlov constituye una estrategia adecuada para impedir que los explotadores invadan una sociedad cooperativa, se desenvuelve mal entre no-cooperadores. Enfrentando a la defección permanente, por ejemplo, intenta reanudar a la cooperación en una de cada dos jugadas. En los torneos de Axelrod, Pavlov se hubiera clasificada hacia la cola de la tabla. Las ventajas de Pavlov solamente resultan visibles después de que otras estrategias menos tolerantes hayan abierto el camino y guiado a la cooperación lejos de la defección.


COOPERACIÓN INNATA.


Podemos concluir sin temor que la aparición y la persistencia del comportamiento cooperativo no son en modo alguno inverosímiles, siempre y cuando los participantes se encuentren repetidamente, se reconozcan unos a otros y recuerden los resultados de pasadas interacciones. Estas circunstancias se dan de forma obvia en la vida familiar o profesional, pero en el mundo de los seres vivos, mucho más amplio, dichos requisitos exigen elevado refinamiento. A pesar de ello, observamos la cooperación incluso entre organismos sencillos carentes de se tales facultades. Además, las estrategias mencionadas sólo funcionarán se las ventajas de futuros encuentros no sufren excesivo descuento al compararlos con las ganancias del presente. Lo mismo que antes, esta expectativa puede parecer razonable para muchas de las actividades que desarrollan los humanos; ahora bien, para la mayoría de los organismos más sencillos, los pagos aplazados en forma de ventaja reproductiva en el futuro pueden contar muy poco: si la vida es breve e imprevisible, la presión evolutiva para efectuar inversiones a largo plazo es escasa.

Mas, ¿que decir de criaturas, como es el caso de muchos invertebrados, que parecen exhibir formas de cooperación recíproca, a pesar incluso de que con frecuencia son incapaces se reconocer a jugadores individuales o recordar sus acciones? ¿Y qué sucede si los pagos futuros sufren fuertes descuentos? ¿Como es posible establecer y mantener en estas circunstancias relaciones altruistas?. Una posible solución es que estos jugadores encuentren una colección fija de congéneres participantes y se se aseguren se que el juego se desarrolle en gran medida con ellos. Esta selectividad será, en general difícil de alcazar. Pero existe una circunstancia en la que no sólo es fácil, sino automática: si los jugadores ocupan puestos fijos y solamente interactúan con los vecinos cercanos, no habrá necesidad de reconocer y recordar, porque los otros jugadores están determinados por su situación espacial. Aunque en muchas de nuestras simulaciones los jugadores encuentran siempre una muestra representativa de la población, también hemos examinado supuestos específicos en los que cada jugador interactúa sólo con unos cuantos vecinos de un cuadriculado bidimensional. Estos “juegos espaciales” son muy recientes y confieren al dilema del preso un giro totalmente nuevo.


ANCLADOS EN PLANILANDIA.


No debería causar sorpresa que la cooperación resulte más fácil de sostener en una población sedentaria: los defraudadores pueden medrar entre la multitud anónima; entre vecinos, en cambio, es frecuente la ayuda mutua. Esta idea está suficientemente clara. Pero en muchos casos, las interacciones estructuradas por el territorio promueven la cooperación, a pesar incluso se que no sean de esperar encuentros posteriores; favorece la cooperación incluso en partidas de una sola vuelta del “dilema del preso” donde en apariencia no hay tal esperanza.

Fijémonos en una versión del torneo especialmente estricta, en la que cada miembro de la población reside en una casilla de una especie de tablero de ajedrez de gran tamaño. Cada jugador es, ora cooperador puro, ora defraudador, y solamente interactúa con sus ocho vecinos inmediatos, jugando con cada uno una partida. En la generación siguiente, la casilla es heredada por quien haya totalizado máxima puntuación.

Un cooperador solitario será expoliado por los abusones que le rodean y sucumbirá. En cambio, es concebible que cuatro cooperadores, apiñados en formando un cuadrado, logran conservar sus posiciones, porque cada uno interactúa con tres cooperadores: un defraudador situado en la periferia: sólo puede alcanzar o abusar se dos como máximo. Si la bonificación por defraudar no es demasiado grande, los apiñamientos de cooperadores irán creciendo. Recíprocamente, los defraudadores solitaros también prosperarán, porque estarán rodeados por cooperadores a los que explotar. Pero al difundirse, los defraudadores son rodeados por sus congéneres y ven reducida su remuneración.

La evolución real de tales sistemas espaciales, depende del importe de los pagos. Ciertamente es posible que los cooperadores queden barridos del tablero. Pero es frecuente que encontremos una variedad de mosaicos que van evolucionando, en los que sobreviven ambas estructuras. Las mescolanzas de cooperadores y defraudadores puros pueden coexistir indefinidamente en proporciones fluctuantes, pero la composición media se la población a largo plazo es predecible. Esta conclusión es de una robustez notable. Subsiste en sus rasgos esenciales, tomando otras configuraciones e incluso para formaciones irregulares o aleatorias. Lo que importa es que ningun jugador haya de interactuar con excesivo número de vecinos.

Pese a su sencillez, las reglas de estos juegos espaciales definen dinámicas de mareante complejidad. Dan lugar a motivos erráticos por el tablero, que van recuperando periódicamente sus formas originales. Pueden también exhibir configuraciones que crezcan sin límite. Algunas de estas peculiaridades se asemejan a los resultados del juego “Vida”, de John Horton Conway, un sistema para construir mediante reglas sencillas motivos espaciales evolutivos que remedan organismos regenerativos. Puede muy bien ocurrir que los resultados generados por cualquiera de nuestras versiones espaciales del “dilema del preso”- trátese de configuraciones irregulares o simétricas alfombras persas- sean intrínsecamente impredecibles y caóticas, en el sentido de que ningún algoritmo puede predecir qué ocurrirá. Tal vez matemáticos más perspicaces alcancen a idear formas de determinar las configuraciones futuras. Nosotros nos conformamos con observar el despliegue de los arabescos.


ASÍ ES LA VIDA.


A lo largo de la vida, la cooperación entre pequeñas unidades desembocó en la aparición de estructuras más complejas, como, por ejemplo, la aparición de seres multicelulares a partir de organismos unicelulares. En este sentido la cooperación resulta tan esencial para la evolución como la competencia.

Las estructuras espaciales actúan, en particular, protegiendo la diversidad. Permiten que cooperadores y defraudadores coexistan unos al lado de otros. En un contexto diferente aunque relacionado, configuraciones espaciales similares permiten la supervivencia conjunta de poblaciones de huéspedes y parásitos, de presas y depredadores, a pesar de la inestabilidad intrínseca se sus interacciones.

Las estrategias cooperativas de este jaez pudieron haber sido cruciales para la evolución prebiótica, que en opinión de muchos imvestigadores tal vez aconteciera sobre superficies y no en disoluciones bien agitadas. La catálisis de la replicación de una molécula constituye una forma de ayuda mutua; en consecuencia, una cadena de catalizadores, en la que cada eslabón ejerce realimentación sobre sí mismo, hubiera constituido el más temprano ejemplo de mutualismo.

Las reacciones químicas cooperativas hubieran sido vulnerables ante mutantes moleculares “tramposos” que tomasen para sí más ayuda catalítica de la que dieran. Se pensaba que tales dificultades zanjaban muchas ideas sobre evolución prebiótica basadas en cadenas cooperativas, pero Maaten C. Boerlijst y Pauline Hoegeweg, de la universidad de Utrecht, han demostrado hace poco, meediante simulaciones informáticas, que estructuras espaciales auto generadas, afines a las que nosotros hemos ideado, pueden poner coto a la difusión de moléculas parásitas destructivas.

Nuestrod modelos por burdos que sean, ilustran el mecanismo verosímil en virtud del cual pudo surgir la cooperación y mantenerse en sistemas biológicos reales. Cabe diseñar refinadas criaturas que incentiven la cooperación por repetidas interacciones entre individuos capaces de reconocerse y recordarse unos a otros. En los organismos más sencillos, sin embargo la cooperación persiste, posiblemente merced a estructuras espaciales auto-organizadas y generadas a través de interacciones con vecinos inmediatos de una cierta disposición espacial fija. Parece que en curso de la evolución ha habido abundante ocasión para que la cooperación viniera en ayuda de todas las cosas, desde los humanos hasta las moléculas. En cierto sentido, la cooperación pudiera ser más antigua que la vida misma.


Investigación y ciencia, agosto, 1995.

No hay comentarios:

Publicar un comentario