Portada » Dilema de los prisioneros

Dilema de los prisioneros

  • por
Dilema de los prisioneros

ética del dilema del prisionero

Escanear activamente las características del dispositivo para su identificación. Utilizar datos de geolocalización precisos. Almacenar y/o acceder a la información de un dispositivo. Seleccionar contenidos personalizados. Crear un perfil de contenido personalizado. Medir el rendimiento de los anuncios. Seleccionar anuncios básicos. Crear un perfil de anuncios personalizados. Seleccionar anuncios personalizados. Aplicar la investigación de mercado para generar información sobre la audiencia. Medir el rendimiento de los contenidos. Desarrollar y mejorar los productos.

El dilema del prisionero, una de las teorías de juego más famosas, fue conceptualizado por Merrill Flood y Melvin Dresher en la Rand Corporation en 1950. Posteriormente fue formalizado y bautizado por el matemático de Princeton, Albert William Tucker.

El escenario del dilema del prisionero funciona como sigue: Dos sospechosos han sido detenidos por un delito y se encuentran en habitaciones separadas en una comisaría de policía, sin medios para comunicarse entre sí. El fiscal les ha dicho por separado lo siguiente:

Empecemos por construir una matriz de pagos como la que se muestra en la tabla siguiente. La «recompensa» se muestra aquí en términos de la duración de la pena de prisión (simbolizada por el signo negativo; cuanto más alto sea el número, mejor). Los términos «cooperar» y «desertar» se refieren a los sospechosos que cooperan entre sí (como, por ejemplo, si ninguno de ellos confiesa) o que desertan (es decir, que no cooperan con el otro jugador, que es el caso en que uno de los sospechosos confiesa, pero el otro no). El primer número de las casillas (a) a (d) muestra la recompensa para el sospechoso A, mientras que el segundo número la muestra para el sospechoso B.

el dilema del prisionero es un ejemplo de quizlet

Inicialmente, un jugador que utiliza el gatillo sombrío cooperará, pero tan pronto como el oponente deserta (satisfaciendo así la condición de gatillo), el jugador que utiliza el gatillo sombrío desertará durante el resto de la partida iterada. Dado que un solo defecto del oponente desencadena la deserción para siempre, el desencadenamiento sombrío es la estrategia más estrictamente implacable en un juego iterado.

Si un jugador deserta, será castigado durante el resto de la partida. De hecho, a ambos jugadores les conviene más permanecer en silencio (cooperar) que traicionar al otro, por lo que jugar (C, C) es el perfil cooperativo mientras que jugar (D, D), también el único equilibrio de Nash en este juego, es el perfil de castigo.

En la estrategia de activación sombría, un jugador coopera en la primera ronda y en las siguientes siempre que su oponente no deserte del acuerdo. Una vez que el jugador descubre que el oponente ha traicionado en la partida anterior, entonces desertará para siempre.

En las competiciones de estrategia de dilema del prisionero iterado, el gatillo lúgubre funciona mal incluso sin ruido, y añadir errores de señal lo hace aún peor. Su capacidad de amenazar con la deserción permanente le da una forma teóricamente eficaz de mantener la confianza, pero debido a su naturaleza implacable y a la incapacidad de comunicar esta amenaza por adelantado, su rendimiento es pobre[5].

solución del dilema del prisionero

Escanear activamente las características del dispositivo para su identificación. Utilizar datos de geolocalización precisos. Almacenar y/o acceder a la información de un dispositivo. Seleccionar contenidos personalizados. Crear un perfil de contenido personalizado. Medir el rendimiento de los anuncios. Seleccionar anuncios básicos. Crear un perfil de anuncios personalizados. Seleccionar anuncios personalizados. Aplicar la investigación de mercado para generar información sobre la audiencia. Medir el rendimiento de los contenidos. Desarrollar y mejorar los productos.

El dilema del prisionero, una de las teorías de juego más famosas, fue conceptualizado por Merrill Flood y Melvin Dresher en la Rand Corporation en 1950. Posteriormente fue formalizado y bautizado por el matemático de Princeton, Albert William Tucker.

El escenario del dilema del prisionero funciona como sigue: Dos sospechosos han sido detenidos por un delito y se encuentran en habitaciones separadas en una comisaría de policía, sin medios para comunicarse entre sí. El fiscal les ha dicho por separado lo siguiente:

Empecemos por construir una matriz de pagos como la que se muestra en la tabla siguiente. La «recompensa» se muestra aquí en términos de la duración de la pena de prisión (simbolizada por el signo negativo; cuanto más alto sea el número, mejor). Los términos «cooperar» y «desertar» se refieren a los sospechosos que cooperan entre sí (como, por ejemplo, si ninguno de ellos confiesa) o que desertan (es decir, que no cooperan con el otro jugador, que es el caso en que uno de los sospechosos confiesa, pero el otro no). El primer número de las casillas (a) a (d) muestra la recompensa para el sospechoso A, mientras que el segundo número la muestra para el sospechoso B.

el juego del ciempiés

El dilema del prisionero es un ejemplo estándar de un juego analizado en la teoría de juegos que muestra por qué dos individuos completamente racionales pueden no cooperar, incluso si parece que les conviene hacerlo. Fue planteado originalmente por Merrill Flood y Melvin Dresher mientras trabajaban en RAND en 1950. Albert W. Tucker formalizó el juego con recompensas de penas de prisión y lo denominó «dilema del prisionero»,[1] presentándolo de la siguiente manera:

Dos miembros de una organización criminal son detenidos y encarcelados. Cada uno de los presos está en régimen de aislamiento sin poder comunicarse con el otro. Los fiscales carecen de pruebas suficientes para condenar a la pareja por el cargo principal, pero tienen las suficientes para condenar a ambos por un cargo menor. Al mismo tiempo, los fiscales ofrecen a cada preso un acuerdo. Cada preso tiene la oportunidad de traicionar al otro testificando que el otro cometió el delito, o de cooperar con el otro guardando silencio. Los resultados posibles son:

Se da a entender que los presos no tendrán ninguna oportunidad de recompensar o castigar a su compañero más allá de las penas de prisión que reciban y que su decisión no afectará a su reputación en el futuro. Como traicionar a un compañero ofrece una recompensa mayor que cooperar con él, todos los presos con interés propio puramente racional traicionarán al otro, lo que significa que el único resultado posible para dos presos puramente racionales es que se traicionen mutuamente, aunque la cooperación mutua produzca una recompensa mayor y la cooperación sea la estrategia dominante. [2] [3] En realidad, este sesgo sistémico hacia el comportamiento cooperativo se produce a pesar de lo que predicen los modelos simples de acción «racional» interesada[4] [5] [6] [7] Este sesgo hacia la cooperación se conoce desde que se realizó la prueba por primera vez en la RAND; los secretarios implicados confiaban el uno en el otro y trabajaban juntos para obtener el mejor resultado común[8] El dilema del prisionero se convirtió en el centro de una amplia investigación experimental[9] [10].