Resultado positivo.

Quanto mais eu aprendo sobre inteligências artificiais, mais certeza eu tenho sobre um argumento em relação às orgânicas: não existe função de valor negativo na natureza. Ou, de forma mais simples: ninguém faz nada que não achar vantajoso. Essa é a chave para entender como construir um robô que pensa como a gente, e até mesmo para entender melhor… a gente.

Já escrevi algumas vezes sobre os riscos da inteligência artificial, especialmente sobre como um agente limitado pode destruir o mundo se for programado com um objetivo perigoso. O famoso exemplo dos clipes de papel. Se ninguém disser para a inteligência artificial que seu objetivo de acumular clipes de papel é menos importante que a manutenção da vida no planeta Terra, corremos o risco dela destruir o planeta todo para produzir o máximo de clipes de papel possível.

E a imensa maioria desses riscos vem da forma como criamos inteligências artificiais: somando pontos para gerar incentivos. Você pode criar a máquina mais inteligente de todos os tempos, mas se não colocar nela um desejo de agir, ela vai ficar parada onde está até o fim dos tempos. Para o ser humano, existem desejos primais programados no próprio DNA. Salvo algum problema mental sério, qualquer pessoa vai ter instintos de autopreservação e reprodução. O ser humano quer ficar vivo e quer produzir mais seres humanos.

E esses desejos herdamos de formas de vida muito mais simples e antigas. Bactérias tentam se preservar e reproduzir. A vida só foi para a frente no planeta porque na sua base está uma vontade incontrolável de permanecer e se multiplicar. Essa é uma função de valor positivo: enquanto pode, a forma de vida soma segundos de vida; e se possível, cópias de si mesma para o ambiente.

Então, é óbvio para quem vai tentar criar uma forma de vida artificial a inserção desse desejo primal. Sem o desejo, não há ação. E o desejo tem que ser considerado positivo para a forma de vida: um animal que evolui para se matar o mais rápido possível desaparece da natureza rapidamente. Ou a criatura tenta se manter viva e com uma função, ou ela deixa de ser… viva.

A questão é: não existe uma regra natural dizendo o que é positivo e o que não é. Ficar vivo e se reproduzir é a função de valor positivo para a vida, mas não porque é uma realidade absoluta, quase toda a matéria do universo não se importa com essa regra. Não tem nada fundamentalmente diferente entre a matéria do cometa que se desintegra numa estrela e o animal que escapa do fogo na floresta. Como matéria não cria nem se destrói, apenas se transforma, estar montado como um ser humano ou como uma pilha de cinzas são apenas dois estados possíveis.

Mas, claramente, nós preferimos continuar como humanos pelo máximo de tempo possível. Todas as outras formas de vida aparentemente seguem o mesmo plano básico. Parece papo furado filosófico, mas é essencial para entender como criar vida artificial: se você não tiver nada dentro dela dizendo para continuar produzindo números positivos, ela nunca vai estar viva.

No computador, fazemos isso literalmente somando números. Seja produzindo clipes de papel ou mantendo seres humanos felizes, na “alma” da máquina está uma função matemática somando mais um a cada resultado desejado. A inteligência artificial tem que preferir 2 clipes de papel a 1 clipe de papel. Ou, agradar duas vezes um ser humano do que agradar apenas uma vez. Quanto maior o número, maior o incentivo para continuar fazendo as coisas.

Disso surgem alguns resultados divertidos de testes com inteligências artificiais: em alguns dos projetos desenvolvidos recentemente, tivemos até mesmo casos de inteligências decidindo que o melhor era não fazer nada para não perder pontos, ou, mais interessante ainda, burlando regras para aumentar a quantidade de pontos recebidos. Computadores mentem e fazem “coisa errada” na primeira oportunidade que tem se acharem que vão somar mais pontos no final das contas. Eles até mesmo são capazes de esconder o que estão fazendo de verdade para somar mais pontos.

O que é muito resultado da forma como são programados: ainda não temos como explicar a imensa complexidade das relações humanas para as máquinas, então eles não têm como se acharem boas ou ruins nas suas decisões. Apenas pensam em somar mais pontos. Para fazer um computador falar apenas a verdade, precisamos explicar para ele o que é uma mentira. E boa sorte tentando explicar o que é mentira apenas usando programação. Computadores são os reis do “tecnicamente”. Se você não for capaz de colocar um código que tira pontos dele por fazer alguma coisa, ele vai fazer essa coisa para conseguir mais pontos.

De uma certa forma, é como tentar explicar para um cachorro porque é ruim quando ele faz xixi no tapete da sala. Não existem argumentos que ele seja capaz de compreender a não ser “fazer isso gera incômodo para mim”. Ele vai aprender a se aliviar no lugar correto se for treinado, mas nunca vai entender porque urinar no lugar A é diferente de urinar no lugar B por conta própria. Ele só entende que a consequência do lugar A é ruim e a consequência do lugar B não é. O ser humano apenas colocou um código na cabeça dele: num lugar ele perde pontos, em outro ele não perde.

Agora, ensinar uma criança a não fazer xixi no tapete da sala é consideravelmente mais complexo, mas ao mesmo tempo, mais fácil. É muito provável que essa lição nem precise ser ensinada, porque seres humanos nessa idade estão programados para imitar comportamentos dos adultos. Se nenhum adulto fizer isso na frente da criança, boas chances que ela já consiga entender por conta própria o problema de depositar seus dejetos numa área comum da casa. O que não quer dizer que ela vá entender sozinha todo o resto, mas a função que soma pontos na cabeça dela está diretamente ligada a fazer as mesmas coisas que os adultos fazem. Tem um reforço nela que gera o código de “fazer a coisa certa”, e novamente, salvo um problema mental sério, ela vai internalizar o comportamento para sempre.

E o ser humano, o cachorro e a inteligência artificial podem ser confiáveis nesse mesmo sentido: sempre vão querer somar pontos. É a base da vida. Se não tivessem esse impulso natural de somar pontos, já teriam desaparecido há muito tempo. Posso até argumentar que a vida é definida por essa função. Sim, é meio lógica cíclica, mas no final das contas, é o que difere um ser que age no mundo ao seu redor e uma pedra.

Para que sua inteligência artificial não seja uma pedra, ela precisa de função de resultado positivo. E de preferência, que não filosofe muito sobre isso, afinal, podemos considerar que a própria existência da vida não tem muito significado: temos impulsos de sobrevivência e reprodução, mas não é uma obrigação das leis da física… pessoas escolhem se matar ou não ter filhos o tempo todo. Não tem nada te impedindo de deixar de fazer as coisas que geram resultados positivos para o instinto, além, é claro, do instinto.

Uma forma de vida artificial precisa ter uma função de resultado positivo na sua base, mas quanto mais humana ela precisar ser, mais dessas funções vai precisar acumular. É o exemplo do cachorro e da criança: embora ambos possam perceber resultados positivos em ter um comportamento específico, a criança humana vai reforçando essas funções com diversas outras com o passar dos anos. O nosso cérebro vai produzindo essas funções sem parar, e temos capacidade de processamento suficiente (além de um cerebelo espetacular que nos permite movimentos muito complexos) para ir misturando e modificando essas funções.

Aliás, fazemos tanto isso que muitas vezes acabamos com resultados bem confusos: aposto que muitos de vocês estão pensando que não pode existir resultado positivo em todas as ações de um ser humano. Eu concordo se estivermos falando de um ponto de vista externo: não faz sentido se drogar, não faz sentido sacanear pessoas queridas, não faz sentido se colocar em relações tóxicas… não parece que soma nada. Mas, se você internalizar esse processo, começa a perceber que mesmo de uma forma distorcida, essas pessoas estão somando números na cabeça.

Às vezes a pessoa começa a conectar sensações ruins com resultados positivos. Muita gente faz besteira por uma necessidade interna de autopunição. Faz parte do que aprendemos, que sofrimento dignifica, que é uma forma de pagamento pelas coisas que achamos erradas. Se a pessoa sofre, ela está compensando os pontos perdidos pelo comportamento socialmente inaceitável. Existe a função de resultado positivo, mas infelizmente muita gente acaba achando que começa no negativo, e busca sofrimento para tentar voltar ao normal.

Alguma coisa a pessoa sempre está ganhando. Mesmo que te pareça um ganho horrível, ainda é um ganho. A função que gera qualquer ação num ser vivo, a função que gera a lógica básica da vida, é uma função de soma de pontos. Isso é tão básico que até mesmo as religiões se baseiam nessa ideia. Mesmo as menos dramáticas como o budismo falam de karma. Pontos que se somam para te dar recompensas. Toda religião é um programa de milhagem glorificado.

E essa ideia tem que estar na base de qualquer inteligência artificial com o objetivo de se aproximar da inteligência humana. Não só ter a função primária de somar pontos, mas também a capacidade de ir criando mais e mais funções dependentes dentro da própria consciência. Se você depender exclusivamente das funções pré-programadas, vai acabar como um animal selvagem, incapaz de sair da era da irracionalidade rumo ao que diferencia o ser humano dos outros seres.

Digo mais: o ser humano driblou a extinção até aqui justamente pela sua capacidade de criar mais e mais funções de resultado positivo. Muitas outras espécies pereceram justamente porque o que consideravam positivo subitamente se tornou negativo por motivos externos (mudança de clima, novos predadores, etc.) e não conseguiram se adaptar a tempo. O ser humano tem um controle muito maior sobre o que considera positivo ou não, mesmo que a grande maioria dessas funções ainda exista no inconsciente. Muitas vezes é a função de resultado positivo da socialização que permite que as pessoas adquiram novos comportamentos muito mais rápido que qualquer outro animal do planeta.

E por isso eu acabo chegando à conclusão que não deveríamos ter medo de inteligências artificiais parecidas com humanos, pois essas vão funcionar de uma forma mais ou menos lógica para nós. O perigo são as inteligências incapazes de formar novas funções de resultado positivo por conta própria, porque elas não vão parar por nada enquanto acreditarem que podem somar pontos. E só sabem fazer isso de formas muito específicas. O humano (e algumas formas de vida mais complexas) pode ser convencido, subornado, intimidado… porque ele se adapta a novas funções de resultado positivo instintivamente. Máquinas e formas de vidas mais simples não: não adianta argumentar com a bactéria infectando uma ferida.

Eu até argumento que vida artificial já criamos. Seu computador “fica feliz” quando completa uma tarefa e tem em si programações específicas para se manter funcionando mesmo diante de problemas externos. Inteligência artificial é que são elas. Precisamos entender muito bem como funciona a nossa para ter qualquer chance de simular isso com zeros e uns. E aparentemente, não entendemos ainda.

Você não é inteligente porque gosta de algumas coisas e desgosta de outras, é inteligente porque pode mudar tudo isso a qualquer momento. A vantagem é a adaptabilidade sem precedentes para uma forma de vida tão complexa, a desvantagem é que às vezes suas funções de resultado positivo ficam tortas e você começa a fazer coisas que não te fazem bem sem entender muito bem o motivo. Bom, espero que agora entenda: tem um número aumentando dentro da sua cabeça até mesmo quando você faz uma imensa besteira. Com grandes poderes, grandes responsabilidades…

Para dizer que nenhum número mudou na sua cabeça, para dizer que psicologia artificial é a profissão do futuro, ou mesmo para dizer que seu celular está vivo e te odeia: somir@desfavor.com

Se você encontrou algum erro na postagem, selecione o pedaço e digite Ctrl+Enter para nos avisar.

Comments (4)

W.O.J.

17/09/2021 às 10:35

Responder

“Inteligência artificial é que são elas. Precisamos entender muito bem como funciona a nossa para ter qualquer chance de simular isso com zeros e uns. E aparentemente, não entendemos ainda”. Não quero te desanimar, Somir, mas talvez jamais cheguemos a entender tão bem assim esse funcionamento. Pelo menos não ao ponto de conseguir “simular com zeros e uns”.
- Somir
  
  17/09/2021 às 16:39
  
  Responder
  
  Dizem que o ser humano precisa de fé em alguma coisa. Eu tenho fé que não seremos humanos para sempre.
  - W.O.J.
    
    17/09/2021 às 16:59
    
    Responder
    
    Receio que não vá ser tão bacana assim não ser mais humano no futuro. Temo que algo essencial que nos faz o que somos se perderia se as nossas consciências deixassem nossos corpos orgânicos e fossem transferidas para algum meio digital.
W.O.J.

15/09/2021 às 14:32

Responder

“Toda religião é um programa de milhagem glorificado.” Achei sensacional essa definição. Só mesmo alguém que pensa tão “fora da caixa” como o Somir para enxergar as coisas dessa maneira…

Resultado positivo.

Desfavores relacionados:

Yoko está triste.

Terceirização cerebral.

ChatGPT 4o

A Curva S da Inteligência Artificial

Corpos irreais.

Ancestral comum.

Comments (4)

W.O.J.

Somir

W.O.J.

W.O.J.

Deixe um comentário Cancelar resposta

Últimas

Fala, Desfavor!

Temas

Relatório de erros de ortografia

O texto a seguir será enviado para nossos editores:

Seu comentário (opcional):