Skip to main content

Colunas

Arquivos

Desfavor Explica: Teoria dos Jogos.

| Somir | | 27 comentários em Desfavor Explica: Teoria dos Jogos.

Lichia disse:
23/11/2012 às 19:26

Teoria dos Jogos

Pedido de Miss passa na frente. Sem contar que Sally também tinha me pedido esse tema há… alguns anos. Hoje o desfavor explica a Teoria dos Jogos e alguns temas paralelos. E se você tem medo de matemática, pode ficar tranquilo(a), prometo não escrever uma fórmula sequer. Teoria dos jogos é muito mais do isso, é praticamente uma teoria da sociedade humana. Eu disse que não teríamos fórmulas, mas não que seria simples.

Teoria dos Jogos. Formalmente, é o estudo de modelos matemáticos de cooperação e conflito entre tomadores de decisão racionais. Pode até parecer algo muito específico, mas na verdade é uma das Teorias mais abrangentes sobre a sociedade humana. De uma certa forma, estamos sempre tomando decisões tentando prever o que outras pessoas vão fazer, e ganharmos alguma coisa por isso. A vida não deixa de ser um jogo. E sabendo “fazer as contas”, pode-se aumentar as suas chances de sucesso.

Mas por aqui vamos dar um olé na matemática e buscar o lado mais… humano… dessa teoria. Mas alguns conceitos básicos são interessantes.

ZERO

Os jogos, pela definição dessa Teoria, são a aplicação da Teoria das Decisões num ambiente onde se disputa com outras pessoas, com ganhos ou penalidades de acordo com os resultados. Xadrez e futebol são jogos, por exemplo. Mas também o são representações matemáticas e dilemas lógicos, até mesmo dirigir de casa para o trabalho é um jogo. Se você prestar atenção, tudo é um jogo.

Mas jogos se dividem em algumas categorias (exclui as muito teóricas):

Por cooperação: Se os jogadores podem formar equipes e tomar decisões conjuntas ou se é cada um por si. A maioria dos jogos de tabuleiro são não cooperativos. Ah, futebol é um híbrido, existe o grupo, mas não existe nenhuma obrigação de agir em prol do grupo (vide os fominhas).

Por simetria: Se as condições de pontuação de um jogo dependem apenas das estratégias escolhidas, e não de quem as escolhe, o jogo é simétrico. O dilema do prisioneiro, do qual vou falar com mais cuidado depois, é um jogo simétrico.

Se sua estratégia só paga alguma coisa de acordo com a reação de outro jogador, o jogo é assimétrico. O jogo do ultimato é um jogo assimétrico: Um jogador tem uma quantia de dinheiro para dividir com outra pessoa, quantia que pode dividir na proporção que quiser, mas com uma “pegadinha”… se a outra pessoa não aceitar a divisão, ninguém ganha nada.

Por soma: São duas categorias, jogos com soma zero e jogos com soma diferente de zero. Um jogo de pôquer é um jogo de soma zero: O seu pagamento vem diretamente do prejuízo do adversário. Jogos com soma diferente de zero não precisam necessariamente subtrair nada de outros jogadores para conferir pontuação.

Por ordem: Jogos podem ser simultâneos, onde os movimentos acontecem ao mesmo tempo, ou sequenciais, onde cada um espera a ação alheia para fazer a sua. Esportes coletivos como futebol, basquete e vôlei são simultâneos, jogos de tabuleiro como xadrez, damas e war são sequenciais.

Por informação: Se um jogador sabe ou não o que os outros estão fazendo. Um jogo de informação perfeita é aquele onde você pode ver tudo o que os adversários estão fazendo (xadrez), os de informação imperfeita são os que você tem que “adivinhar” o que os outros estão fazendo (pôquer).

Por sequência: Jogos onde um ação abre um leque de opções único a cada jogada são chamados de sequenciais. A maioria dos jogos que não são de azar se encaixam nessa categoria. E falando nisso, deixa eu dar uma desviada rápida aqui…

Vamos voltar um pouco para o Desfavor Explica: Falácias. Faltou mencionar uma que vai ser muito útil neste texto… A falácia do jogador. Essa falácia acontece quando uma pessoa tenta argumentar sobre algo baseado em probabilidades sem respeitá-las.

De uma forma simplificada: Quando você joga uma moeda para cima, existe 50% de chance de cair Cara e 50% de chance de cair Coroa. Você pode jogar essa moeda uma ou um bilhão de vezes e a probabilidade NUNCA muda. Quem quer te diga que essa probabilidade muda de acordo com resultados anteriores está usando lógica furada. Sabe o apostador (normalmente viciado) que acha que “dessa vez a sorte está ao seu lado”?

Diferenciar aposta pura de estratégia racional é ESSENCIAL na teoria dos jogos. “Chutar” não é uma opção, afinal, pra que uma Teoria inteira se vamos rezar para Santo Aleatório, não?

Agora, sem chutar, vamos ver dois jogos famosos e a forma nerd como eles podem ser analisados (bacana!).

O DILEMA DO PRISIONEIRO

Aposto que muitos de vocês já conhecem, mas aqui vai: A polícia prende dois suspeitos de um crime, o Zé Ruela e o Jão Ruela. Os policiais separam os dois e oferecem a ambos um mesmo acordo. Se um denunciar o outro, fica livre para sair, mas o outro pega 10 anos de cana.

Tanto Zé como Jão sabem que se ficarem calados, a polícia só consegue prendê-los por seis meses. E se um denunciar o outro, cada um fica 5 anos vendo o sol nascer quadrado. Os prisioneiros estão incomunicáveis e não tem a menor ideia do que o outro vai escolher. O que vai acontecer?

Existem quatro possibilidades distintas aqui:

  1. Zé denuncia Jão, Zé é libertado e Jão pega 10 anos de cadeia;
  2. Jão denuncia Zé, Jão é libertado e Zé pega 10 anos de cadeia;
  3. Os dois se denunciam e cada um pega 5 anos de cadeia;
  4. Os dois ficam calados e cada um pega 6 meses de cadeia.

Ética à parte, a decisão mais vantajosa (em relação a tempo de prisão) para cada um dos dois é denunciar o outro e não ser denunciado em troca. A segunda melhor é que ambos fiquem quietos, a terceira que ambos se denunciem, e a pior de todas é a de ficar calado e ser denunciado pelo outro.

Como eles não podem se comunicar, restam apenas duas opções: Denunciar ou ficar quieto. Um não sabe o que o outro vai fazer, e partindo desse princípio, denunciar é a escolha mais vantajosa. Sempre. Tanto Zé como Jão tem a chance de conseguir o melhor resultado se derem sorte, ou o terceiro melhor se derem azar. Já a decisão de ficar calado rende a segunda melhor opção com a cooperação do outro, mas pode criar o pior cenário possível se for traído pelo outro.

Tem outra pessoa tomando uma decisão racional do outro lado também. Pode-se considerar que ambos sabendo que a melhor decisão é denunciar e que o resultado disso é uma prisão de 5 anos, pode ser razoável escolher a pior decisão para que ambos se beneficiem de uma pena bem mais branda. Mas e se isso for explorado? A lógica faz um loop de volta para a decisão de denunciar.

Vamos entender que os presos são representações de matemática aqui. Seres tão previsíveis quanto uma moeda jogada para cima. Podem ser egoístas ou altruístas. E egoísmo é a melhor solução. Mas existe uma modalidade desse dilema que começa a demonstrar como nada é tão simples assim.

Nerds ainda mais nerds do que eu fazem verdadeiros campeonatos de dilema do prisioneiro: Ganha quem acumular menos anos na cadeia depois de inúmeras iterações do dilema contra vários adversários diferentes. Eles escrevem códigos (não deixam de ser equações) no computador que vão tomar essas decisões, esses códigos são colocados para disputar contra outros em simulações.

O dilema de prisioneiro repetido inúmeras vezes demonstra que existe uma tática superior a de sempre denunciar quando se carregam as experiências anteriores para um novo round: Retribuição. Na primeira vez, você sempre fica calado. Se o outro ficar calado, você o recompensa ficado calado na vez seguinte. Se ele te denunciar, você denuncia na próxima.

Apesar de sempre perder para quem sempre denuncia, essa estratégia funciona muito bem contra todas as outras. E a tática de denunciar sempre falha quando você tem de lidar contra oponentes que conseguem a opção de cooperação mútua mais vezes. A pena para uma dupla que fica quieta é BEM menor do que a de uma dupla que sempre denuncia. Isso ajuda no placar geral. Quem usa a tática da retribuição ganha muito mais cooperação e só se fode inteira uma vez contra quem só denuncia.

E aqui, uma lição de vida: No placar geral, sempre vencem as estratégias que não tentam ganhar mais pontos que seus adversários. Ou, como diria Romário: “Quem é ruim se destrói sozinho”.

P.S.: Se TODO mundo sempre escolher a estratégia de denunciar, TODO mundo acaba empatado.

O dilema do prisioneiro é uma representação de inúmeras situações presentes na sociedade humana: Onde existe uma ou mais soluções mutuamente benéficas, mas todas passíveis de exploração. A corrida armamentista, por exemplo: Aumentar meu exército para poder enfrentar o meu inimigo ou reduzi-lo na expectativa de que ele faça o mesmo? A Guerra Fria TODA foi um dilema do prisioneiro. Aniquilação nuclear é um resultado terrível para qualquer parte, mas sem conseguir confiar na decisão do outro lado do muro, é arriscado reduzir o arsenal nuclear. Todos estão mais seguros sem as bombas, mas se livrar delas pode ser explorado. E esse é um ótimo gancho para o próximo “jogo” desta coluna.

GALINHA

E quando perder o jogo não é a pior hipótese? “Galinha” é o nome de um jogo onde dois carros correm um em direção ao outro em alta velocidade. O primeiro que desviar, perde. Se os dois desviarem, os dois perdem. Se os dois não desviarem, os dois ganham, mas provavelmente morrem.

Estruturando os resultados possíveis, do melhor para o pior:

  1. Ganhar o jogo sem bater no outro carro;
  2. Perder o jogo sem bater no outro carro;
  3. Ganhar o jogo batendo no outro carro.

Claro, considerando que você não tem merda na cabeça e acha que bater o carro é melhor do que perder. O jogo Galinha tem uma lógica inversa ao do dilema do prisioneiro: É razoável imaginar que a outra pessoa vai desviar, que ela vai tomar a atitude que vai fazê-la PERDER o jogo, considerando que desviar o carro é uma penalidade muito menor do que beijar o para-choque do carro em alta velocidade no sentido inverso.

Um dos malucos vai ter que ficar são para não alcançarem ambos o pior resultado possível. Perder o jogo SEMPRE vai te garantir escapar desse resultado. Considerando puramente os resultados, a melhor estratégia é seguir em frente, a pior é desviar. Já no campo da auto-preservação, desviar é sempre melhor.

Se os dois participantes usarem a mesma estratégias, ambos vão perder, em algum aspecto. O melhor resultado só é possível se um dos dois escolher o segundo melhor.

Vemos o jogo de galinha frequentemente em discussões falaciosas… Como os argumentos são ruins e/ou repetitivos, nenhuma das partes tem nada a ganhar além de um troféu argumentativo imaginário, mas ambas tem a perder continuando com esse exercício fútil indefinidamente.

CONCLUSÃO… MAS JÁ?

Cacete, quinta página. E eu juro que nem ARRANHEI o assunto. Mas podemos tirar algumas conclusões com essa análise parcial: Conceitos como altruísmo e cooperação NÃO SÃO aberrações lógicas. Gente que quer empurrar modelo pré-formatado de ética e moralidade baseado em palavras de seres imaginários adora dizer que a sociedade humana só funciona por causa de MEDO de punição.

Balela. A Teoria dos Jogos pode nos mostrar uma faceta bem mais racional da nossa organização social. Essa ideia de sobrevivência do mais egoísta pode até funcionar em escalas menores, mas quando as probabilidades vão se empilhando, percebe-se que ideias de justiça, nobreza e moralidade muitas vezes são formas de evitar “empates eternos” entre as pessoas. De fazer o jogo seguir em frente e aumentar o placar geral. Não seja um capacho, mas não seja um filho-da-puta egoísta. Não é conversinha politicamente correta, é matemática. Tudo é um jogo.

E sim, eu ainda vou escrever mais sobre isso, mas puxando abordagens diferentes e temas relacionados. Esse jogo não acabou hoje.

Para reclamar que agora que estava quase conseguindo dormir eu terminei o texto, para dizer que só não entendeu do primeiro parágrafo para baixo, ou mesmo para ser útil e ajudar a destrinchar mais o assunto nos comentários (ha): somir@desfavor.com

Comentários (27)

Deixe um comentário para pixoquinha Cancelar resposta

O seu endereço de e-mail não será publicado.