Un interesante portal de estudios gratis en el que
participan distintas Universidades americanas, actualmente 214 cursos: www.coursera.org.
En el curso Game Theory [1]
se cita un experimento del que vamos a hablar aquí, Social Behavior in Pigs Studied by Means of Operant Conditions. Fue
realizado por B.A. Baldwin y G.B. Meese en 1979. Comportamiento social de
cerdos.
Se mete un par de cerdos en una gran caja. El par de cerdos
es tal que uno es grandote, el otro pequeño. La caja tiene un sistema que
libera pelets de apetitosa comida a través de un dispositivo situado en un
extremo de la caja, mientras que al otro extremo hay una palanca que hay que accionar para liberar comida, en dosis de 10
pelets.
De este modo, si un cerdo acciona la palanca para liberar comida, el otro cerdo
llegará antes a la comida.
Se encuentran las siguientes pautas:
-
Si el grande (G) llega a la comida antes que el
pequeño (P), se come 9 de los 10 pelets,
y el pequeño sólo se come uno. Eso lo expresamos como un par (P,G) como 1,9.
-
Si el pequeño llega primero quedan 4,6.
-
Si llegan a la vez quedan 3,7.
-
Accionar la palanca y correr al comedero
equivalen a un consumo de 2 pelets .
Descontando los dos pelets consumidos por el accionador de
su recompensa, queda la siguiente matriz de pagos:
P/G
|
Accionar
|
Esperar
|
Accionar
|
1,5
|
-1,9
|
Esperar
|
4,4
|
0,0
|
En teoría de juegos se dice que un agente tiene una
estrategia estrictamente dominante sobre otra posible cuando, haga lo que haga
el otro agente, la utilidad que le reporta la primera estrategia es mayor que
la de la segunda. No le importa qué saca el otro agente, en este caso.
Uno de nuestros cerdos tiene una estrategia dominante sobre
la otra posible: el cerdo pequeño, cuando toma la estrategia “esperar” en vez
de “accionar”, gana en un caso 4 pelets frente a uno, mientras que en el otro
evita perder 1. Siempre gana. Si elige “accionar”, inversamente, siempre
pierde.
La teoría de juegos predice que ningún agente tomará una
estrategia contraria a su interés, que sería una estrategia dominada, así que
el cerdito se quedaría a la espera. Pero el cerdo grande, una vez que el
pequeño espere, se dará cuenta de que a él le trae más cuenta accionar la
palanca que esperar y pasar hambre. Así que se predice un equilibrio en el que
el cerdo pequeño espera y el grande acciona la palanca, con pago 4,4. ¿Hay algún despistado por aquí? Es indiferente que ambos cerdos tengan el mismo pago.
Los experimentadores dan un tiempo de aprendizaje de 15
minutos a cada pareja, luego hacen 10 tests. Como referencia, se han tenido
cerdos solos en las cajas. Veamos lo que observan en cuanto a los números de
veces que accionan la palanca:
|
Solos
|
Juntos
|
G
|
75
|
105
|
P
|
70
|
5
|
Vaya, cuando están solos, los cerdos pequeños accionan la palanca casi tanto como los
grandes, pero cuando están juntos el pequeño casi siempre espera.
Me gustan las notas que saca el profesor Jackson:
-
¿Son los cerdos racionales?, ¿conocen la teoría
de juegos?
-
Aprenden y responden a incentivos.
-
Aprenden a utilizar una estrategia no
estrictamente dominada.
[1] Game Theory Course, Stanford
University, Jackson, Leyton-Brown &Shoam
No hay comentarios:
Publicar un comentario