O jogo da Racionalidade


Na hora de tomar decisões, muitas pessoas rejeitam a opção lógica e acabam recebendo uma recompensa maior - mas para obter esse resultado é preciso descobrir formas menos convencionais de pensar, para entender como o cérebro faz essas escolhas, cientistas usam uma atividade lúdica.

Revista Super Interessante por Kaushik Basu.

Conceitos-chave

- No jogo do Dilema do Viajante, duas pessoas escolhem individualmente um número inteiro entre 2 e 100, e o jogador que escolhe o menor número é recompensado com uma soma maior em dinheiro. Os especialistas na técnica insistem que a racionalidade deve levar os participantes a escolher 2, mas a maioria das pessoas escolhe um número inteiro perto de 100.

- É necessário um novo raciocínio para a compreensão de que essa escolha supostamente racional de fato não o é. Assim, os resultados do DV contradizem os pressupostos dos economistas de que a teoria-padrão dos jogos pode prever como pessoas calculistas e egoístas se comportarão. Eles também mostraram como os “espertos” nem sempre fazem economia.

Ao voltar de uma viagem de férias, José e Maria perceberam que a empresa aérea havia danificado objetos de arte idênticos que os dois tinham comprado. O gerente da empresa garante que ficará muito feliz em compensá-los pelos danos mas ele está em apuros, pois não faz a menor ideia de quanto esses objetos raros podem ter custado. Se perguntar o preço aos viajantes, pensa ele, certamente irão inflacioná-lo.

Então o funcionário resolve ser mais ardiloso. Pede que cada um dos viajantes, separadamente, anote num papel o preço das peças quebradas atribuindo um valor inteiro, em dólares, entre 2 e 100. Se os dois marcarem o mesmo número, ele aceitará o valor e pagará a cada um deles a quantia mencionada. Mas se escreverem números diferentes, ele considerará o valor mais baixo como o preço correto e desconsiderará o valor maior. Pagará então aos dois o valor mais baixo incluindo um bônus e uma penalidade — a pessoa que tiver anotado o número mais baixo receberá 2 dólares a mais como prêmio por sua honestidade, e a que marcar o valor mais alto receberá 2 dólares a menos do que o valor mais baixo, como punição pela desonestidade.

Cenários como esse, nos quais as pessoas fazem escolhas e são recompensadas de acordo com a decisão que tomam, são conhecidos como jogos. Chamei esse de “O Dilema do Viajante”. O objetivo era confrontar a visão estreita entre o comportamento racional e os processos cognitivos apresentados por economistas e cientistas políticos, desafiando os pressupostos liberais da economia tradicional, e destacar o paradoxo lógico da racionalidade. Em suma, a proposta era estudar o funcionamento mental diante de opções complexas, que envolviam perdas e ganhos. O Dilema do Viajante (DV) atinge esses objetivos porque a lógica do jogo estabelece que 2 é a melhor opção, ainda que muitas pessoas prefiram um número próximo  de 100. Os jogadores amealham uma grande recompensa por não obedecerem à razão. Pode parecer contraditório, mas ao jogar o DV, é preciso usar certa racionalidade ao optar por não ser racional.

Outros pesquisadores que usaram o DV e tentavam expandi-lo relatavam descobertas resultantes de experiências em laboratório, com insights sobre a tomada de decisão. Apesar disso, permanecem abertas as questões sobre como a lógica e a razão podem ser aplicadas ao DV.

Por que 2 é a escolha lógica, pense em uma linha de raciocínio que Maria deverá seguir: a primeira ideia que lhe vem à cabeça é que deve escrever o maior número possível, 100, pois assim receberá 100 dólares, se José for igualmente ambicioso. (Se o objeto custou muito menos de 100 dólares, ela estaria tentando tirar proveito da proposta feita pelo gerente.)

No entanto, logo lhe ocorre que se em vez de 100 ela marcar 99, vai conseguir um pouco mais de dinheiro, porque receberá 101. Mas certamente José também teria essa ideia, e se os dois marcarem 99, Maria ganhará 99. Então seria melhor ela marcar 98, pois nesse caso receberia 100. A mesma lógica também levaria José a escolher 98. E nesse caso, ela marcaria 97 e receberia 99. Seguindo esse raciocínio, os dois diminuiriam sucessivamente suas escolhas até chegar ao menor valor permitido: 2. É muito pouco provável que Maria realmente desenvolvesse esse raciocínio sequencial até chegar ao resultado 2. Na verdade é exatamente este o ponto que interessa aos cientistas: para onde a lógica nos leva.

Especialistas em jogos utilizam esse tipo de análise, chamada de retroindução, que prevê que cada jogador vai escrever 2 e eles vão acabar recebendo 2 dólares cada. Virtualmente, todos os modelos usados chegam a esse resultado para o DV — os dois jogadores ganham 98 dólares menos do que deveriam se cada um, inadvertidamente, escolhesse 100.

O Dilema do Viajante está relacionado com outro mais popular, o Dilema do Prisioneiro, no qual dois presos, suspeitos de terem cometido um crime grave, são interrogados separadamente e cada um pode escolher entre incriminar o outro (e ter a pena abrandada por colaborar) ou permanecer em silêncio (o que deixará a polícia sem evidências claras do crime se o outro acusado também permanecer em silêncio). Essa história tem conotação bem diferente, mas a matemática da recompensa para cada opção do Dilema do Prisioneiro é idêntica àquela de uma variante do DV.

Os cientistas analisam os jogos sem qualquer artimanha que as narrativas possam conter estudando a chamada matriz de compensação (ganho ou perda do jogador em função de sua jogada) de cada um — uma grade que contém todas as informações sobre as potenciais opç& ões e compensações de cada jogador. As opções de Maria correspondem a uma linha da grade e as opções de José, a uma coluna, os dois números no quadrado selecionado especificam suas recompensas.

Apesar dos nomes, o Dilema do Prisioneiro e a versão de duas opções do DV não podem ser considerados realmente um dilema. Cada participante vê uma opção correta unívoca, o que quer dizer 2. Essa opção é chamada de escolha dominante porque é a melhor a fazer, não importando o que o outro faça. Se escolher 2 em vez de 3, Maria vai receber 4 dólares em vez de 3 dólares se José escolher 3, e ela recebe 2 dólares, em vez de nada, se josé escolher 2.

No caso da versão completa do DV, não há opção dominante. Se José escolher 2 ou 3, o melhor para Maria é optar pelo 2. Mas se ele escolher qualquer número de 4 a 100, ela será beneficiada se escolher um número maior que 2.

Ao estudar uma matriz de compensação, os especialistas se baseiam com muita frequência no “Equilíbrio de Nash”, do matemático John F. Nash Jr., da Universidade de Princeton (interpretado por Russell Crowe no filme Uma mente brilhante). O equilíbrio de Nash é o melhor resultado que um jogador pode obter desviando-se unilateralmente na grade. Considere o resultado (100,100) no DV (o primeiro número representa a escolha de Maria e o segundo, a de José). Se Maria muda sua opção para 99, o resultado será (99,100) e ela vai ganhar 101 dólares. Como Maria é beneficiada por essa escolha, o resultado (100, 100) não representa o equilíbrio de Nash.

O DV tem apenas um equilíbrio de Nash — o resultado (2,2) em que Maria e José optam por 2. A principal razão que faz com que tantas análises formais cheguem a esse resultado para o DV é que elas incorporam sempre o equilíbrio de Nash.

Mas a maioria de nós sente que deveria escolher um número muito maior e ganhar, em média, muito mais que 2 dólares.

• Implicações econômicas

O jogo e nossa capacidade de prever intuitivamente os resultados contradizem as ideias dos economistas. Inicialmente a economia estava fortemente presa ao pressuposto do livre-arbítrio, de que as pessoas deveriam agir livremente, porque, segundo as ideias vigentes, suas opções egoísticas resultariam em eficiência. A escalada dos métodos teóricos para jogos mudou esse pressuposto. No entanto, durante muito tempo esses métodos se basearam no axioma de que as pessoas farão escolhas racionais egoísticas que a teoria dos jogos pode prever. O DV enfraquece tanto a ideia do livre-arbítrio e de que o egoísmo incontrolado é bom para a economia quanto o princípio da teoria dos jogos de que as pessoas serão egoístas e racionais.

No DV, o resultado “eficiente” é aquele em que os dois viajantes escolhem 100, pois isso significa ganho máximo para ambos. O egoísmo do livre-arbítrio faria com que as pessoas passassem de 100 para um número mais baixo com menos eficiência, na expectativa de obter sempre maiores ganhos individuais. Se as pessoas não optarem pelo equilíbrio de Nash (2), as ideias dos economistas sobre o comportamento racional precisam ser revistas.

Na última década, os pesquisadores realizaram várias experiências com o DV. Uma experiência com dinheiro vivo e tendo como voluntários estudantes de economia foi realizada em laboratório na Universidade da Virgínia, por Monica C. Capra, Jacob K. Coeree, Rosario Gómez e Charles A. Holt. Os estudantes receberam 6 dólares pela participação e podiam guardar qualquer soma adicional que ganhassem durante o jogo. Para administrar os recursos, as escolhas eram feitas em centavos e não em dólares. A faixa de opções era de 80 a 200, e os valores da penalidade e da recompensa variavam em diferentes rodadas do jogo, indo de 5 centavos até 80 centavos. Os pesquisadores queriam verificar se o valor das penalidades e recompensas influía na forma como as pessoas jogavam. Mudar o valor das recompensas e das penalidades não alterava nenhuma das análises formais: uma retroindução sempre levava ao resultado (80,80), o equilíbrio de Nash, em todos os casos. A experiência confirmou a expectativa intuitiva de que o jogador médio não apostaria na estratégia do equilíbrio de Nash, de 80. Com uma recompensa de 5 centavos, a escolha média dos jogadores foi de 180, caindo para 120 quando a recompensa foi de 80 centavos.

Capra e seus colaboradores também estudaram as mudanças no comportamento das pessoas ao jogarem o DV continuadamente. Será que eles aprenderiam a encontrar o equilíbrio de Nash, mesmo que essa não fosse sua primeira escolha instintiva? Com certeza, quando a recompensa era grande, com o passar do tempo as jogadas convergiam na direção do resultado de Nash. Mas para recompensas menores, as jogadas aumentavam na direção do extremo oposto, 200.

Uma experiência feita pela internet sem nenhum pagamento envolvido, realizada por Anel Rubinstein, das universidades de Tel Aviv e de Nova York, entre 2002 e 2004, confirmou claramente que a maioria das pessoas não escolhe o equilíbrio de Nash. O jogo pedia aos jogadores (que iriam assistir a uma das palestras de Rubinstein sobre a teoria dos jogos e Nash) que escolhessem um valor inteiro entre 180 e 300. Os números representavam quantias em dinheiro, e a recompensa/penalidade foi fixada em 5 dólares.

Cerca de 2.500 pessoas de sete países responderam, proporcionando um cruzamento de opções e uma quantidade de amostra inviáveis em laboratório. Menos de um, em sete jogadores, escolheu o valor dado pelo equilibrio de Nash, 180. A maioria (55%) escolheu o valor máximo 300. Surpreendentemente, os dados foram semelhantes para subgrupos, com pessoas de países variados. Os processos mentais que resultaram nesse padrão de escolhas permanecem um mistério.

Talvez o altruísmo esteja tão enraizado em nossa psique quanto o egoísmo, e nosso comportamento resulte de um conflito íntimo entre ambos. Sabemos que o gerente da empresa aérea pagaria a maior quantia de dinheiro se José e Maria escolhessem 100. Muitos de nós não pensariam em passar por cima do companheiro de viagem para tentar ganhar somente 1 dólar a mais, e por isso escolhemos 100, mesmo compreendendo que racionalmente 99 possa ser uma escolha melhor.

• Sem solução

Para continuar avançando nessas experiências e explicar melhor os comportamentos, alguns neuroeconomistas fizeram suposições firmes e não muito realistas que acabaram por desvirtuar o observado pelo uso de modelos complicados. Quanto mais intrincados forem esses modelos e hipóteses pa rmanecem um mistério.

Talvez o altruísmo esteja tão enraizado em nossa psique quanto o egoísmo, e nosso comportamento resulte de um conflito íntimo entre ambos. Sabemos que o gerente da empresa aérea pagaria a maior quantia de dinheiro se José e Maria escolhessem 100. Muitos de nós não pensariam em passar por cima do companheiro de viagem para tentar ganhar somente 1 dólar a mais, e por isso escolhemos 100, mesmo compreendendo que racionalmente 99 possa ser uma escolha melhor.

• Sem solução

Para continuar avançando nessas experiências e explicar melhor os comportamentos, alguns neuroeconomistas fizeram suposições firmes e não muito realistas que acabaram por desvirtuar o observado pelo uso de modelos complicados. Quanto mais intrincados forem esses modelos e hipóteses para ajustar os dados, menos insights fornecerão.

O desafio que ainda permanece, no entanto, não é explicar o comportamento real de pessoas comuns diante do DV. Graças em parte às experiências, parece provável que altruísmo, socialização e falhas de raciocínio orientem as escolhas da maioria das pessoas. No entanto, se esses três fatores tivessem sido eliminados do cenário, eu não esperaria que muitos tivessem escolhido 2. Como podemos explicar o fato de a maioria das pessoas continuar a escolher números grandes, perto de 90, mesmo sem ter uma capacidade dedutiva forte, e deixar de lado o altruísmo e o comportamento social normais para jogar duro, na tentativa de ganhar a maior boIada possível? Ao contrário do que prevê a teoria moderna dos jogos, que pode envolver muita matemática, mas tem solução imediata quando se conhecem as técnicas, essa questão é difícil de ser respondida e requer pensamento criativo.

Vamos supor que você e eu somos dois desses jogadores espertos e inflexíveis. O que passa pela nossa cabeça? Eu espero que você jogue um número alto — digamos, na faixa dos 90 a 99. Mas eu não devo jogar 99, porque se você jogar qualquer desses números, escolher 98 para mim seria uma escolha tão boa, ou melhor. Mas se você parte do mesmo princípio do comportamento humano inflexível que eu e está seguindo a mesma lógica, você também não vai escolher 99 — e pelo tipo de raciocínio que teria levado Maria e José a escolher 2, imediatamente eliminamos qualquer número entre 90 e 99. Dessa forma, deixamos de considerar o conjunto bem definido de “números altos que as pessoas inflexíveis devem escolher logicamente” e entramos em terreno filosoficamente complicado ao tentar explicar premissas intrinsecamente mal definidas.

Se eu fosse jogar esse jogo, diria a mim mesmo: “Esqueça a lógica dos teóricos. Eu jogaria um número alto (talvez 95) e sei que meu adversário faria uma escolha semelhante e ambos ignoraríamos o argumento racional de que o número anterior seria uma escolha melhor do que qualquer outra”. O interessante é que essa rejeição da racionalidade e da lógica formal está ligada a uma espécie de metarracionalidade. Se os dois jogadores seguirem o caminho da metarracionalidade, ambos vão se sair bem. Mas nessa ideia de que o pensamento racional pode implicar a rejeição da própria racionalidade está implícito o passo a ser dado no futuro, para resolver os paradoxos que continuam minando a teoria dos jogos e estão codificados no Dilema do Viajante.

• Eu sei que você sabe que eu sei...

Ouvi este conto na Índia. Um vendedor de chapéus, ao despertar de uma soneca, percebeu que um grupo de macacos tinha levado toda sua mercadoria para o topo de uma árvore. Desesperado, tirou seu próprio chapéu e o atirou ao chão. Os macacos, conhecidos pelo seu espírito de imitação, fizeram a mesma coisa, e o homem rapidamente os recolheu.

Meio século depois, seu neto, que tinha a mesma profissão, colocou-os no chão, para tirar uma soneca. Ao despertar, descobriu que os macacos tinham levado todos os chapéus para o topo da árvore. Então ele se lembrou da história de seu avô e logo atirou seu próprio chapéu no chão. Mas, misteriosamente, nenhum dos macacos o imitou e somente um dos animais desceu, pegou o chapéu que estava no chão e disse: “Pensa que só você tem avô?”.

A história ilustra uma diferença importante entre a teoria da decisão comum e a teoria dos jogos. Na última, o que é racional para um jogador pode depender do que é racional para o outro. Para que Maria tomasse uma decisão correta, precisaria ter se colocado no lugar de José e imaginado o que ele estaria pensando. Mas ele estaria pensando no que ela estaria pensando, levando a uma regressão infinita. Os especialistas em jogos descrevem essa situação da seguinte forma: “A racionalidade é o senso comum entre jogadores”. Em outras palavras, Maria e José são racionais, cada um deles sabe que o outro é racional, cada um deles sabe que o outro sabe, e assim por diante.

O pressuposto de que a racionalidade é o senso comum está tão presente na teoria dos jogos que raramente é explicitado. No entanto, ela pode nos trazer problemas. Em alguns jogos praticados repetidamente, como rodadas do Dilema do Prisioneiro, os participantes costumam tomar decisões incompatíveis. O pressuposto de que a racionalidade é o senso comum causa conflito entre lógica e intuição e, no caso do Dilema do Viajante, a intuição está correta e espera ser validada por uma lógica melhor.

    Leitura Dinâmica e Memorização

    Preencha aqui seus dados

© Copyright 2020 - Todos os direitos reservados à Methodus