Skip to main content

Colunas

ChatGPT 4o

Segunda-feira (13/05), a OpenAI lançou os primeiros vídeos sobre o ChatGPT 4o, uma nova forma de interagir com sua inteligência artificial. Agora, você pode falar com ela e até ligar sua câmera para mostrar em tempo real o que quer que ela veja. Pelo material apresentado, é realmente impressionante, mas… como funciona e como isso impacta o mundo?

Tem uma apresentação mais longa e tem vários vídeos mais curtos demonstrando capacidades. Você pode vê-los no canal do YouTube da OpenAI ou em alguma de suas redes sociais.

Num resumo bem simples: é um ChatGPT que te ouve e te enxerga. Pelo o que foi demonstrado (e importante ressaltar que é o vídeo de divulgação da empresa, onde eles puderam selecionar as coisas que funcionavam melhor) o programa continua num nível alto de compreensão de linguagem humana, mas agora conseguindo entender fala (provavelmente num nível altíssimo em inglês e um pouco pior em outras) e até mesmo ver você e o que você quer mostrar para ele com a câmera do celular.

Se você quer bater um papo, o ChatGPT bate um papo com você. Daquele jeitão verborrágico e meio chato, mas não se pode criticar a relevância das respostas. A máquina parece entender mesmo o que a pessoa quer dizer. Se você quiser que a IA descreva algo que você está mostrando na câmera, ela tem uma boa noção. E não sei quão realista foi o exemplo dela ensinando geometria para uma pessoa, mas parece ser boa em interagir com uma tela ao mesmo tempo que um usuário.

É um grande salto na facilidade de uso, mas até onde eu entendi, não é como se a tecnologia tivesse avançado tanto assim. O sistema ainda funciona do mesmo jeito: transformando palavras em operações matemáticas, fazendo os cálculos e transformando de volta em algo que somos capazes de compreender.

Porque dentro da “caixa preta” da IA, a ideia é brilhantemente simples: pesos e contrapesos. A grande sacada é abstrair a nossa comunicação para números negativos e positivos, quanto maior o número, maior a probabilidade do macaco pelado gostar da resposta. Então, com base num treinamento prévio onde o computador monta um banco de dados de coisas que humanos consideram corretas, ele vai transformando cada frase que lê (e agora escuta) numa série de números, e calcula qual a melhor forma de entregar de volta uma resposta positiva (trocadilho intencional).

A alma da coisa é a mesma: prever qual a próxima palavra na frase. Mas com evoluções nos algoritmos e na capacidade de processamento de dados, o ChatGPT e similares ganharam mais e mais habilidade de lembrar sobre o que se está falando. É isso que vai criando essa ilusão de inteligência: consistência durante uma conversa. Qualquer pessoa que aprende programação consegue fazer um sistema que recebe uma informação e dá uma resposta, mas quanto mais coisas o sistema precisa lembrar durante uma interação com um humano, mais complexo fica.

Tão complexo que seria basicamente impossível “fingir” inteligência artificial sem usar o método de transformação matemática que as IAs usam agora. Por mais que eu acredite que os vídeos atuais do ChatGPT 4o sejam focados em coisas que os programadores da empresa sabiam que funcionariam direito, não tem como fazer o que fizeram sem uma IA que realmente é capaz de manter coerência. Pode guardar seu chapéu de alumínio, a IA realmente vai ter o poder que eles demonstraram.

O sistema de reconhecimento de voz e imagem é a cereja no bolo. A forma assustadoramente natural como a IA fala com as pessoas é a pedrinha de crack em cima da cereja do bolo. Temos uma tecnologia chegando na maturidade e ficando mais acessível para o grande público. Sim, boa sorte entendendo o macaquês com o qual 90% da humanidade se comunica, mas se o Google conseguiu fazer um sistema de pesquisa que consegue fazer o povo do “Ei, Você!” chegar em resultados próximos da sua intenção, pode apostar que o ChatGPT 4o e seus descendentes vão dar um jeito.

Então já é hora de se preparar para uma era de autistas que vão viver conversando com uma IA e dependendo dela para tudo? Ainda não. Ênfase no ainda: apesar do alto potencial viciante, existem barreiras práticas para universalizar o serviço. O primeiro e mais óbvio é a dificuldade de fazer o serviço funcionar: ainda exige muita capacidade de processamento. O seu celular ou mesmo seu computador de mesa de última geração não tem força para rodar um sistema desse tipo sozinhos.

Mesmo que eles liberem o sistema de graça por algum tempo, eventualmente as contas precisam ser pagas. A Microsoft está derramando bilhões em cima da OpenAI prevendo que vai dominar o mundo com isso, e eles podem segurar o tranco por muitos anos, mas não tem equipamento para entregar isso para o mundo todo, vai ter que ser racionado e cobrado. Isso vai limitar quantas pessoas realmente podem usar a IA ao mesmo tempo, e ainda não estou convencido que a melhor versão do ChatGPT 4o vai dar conta de rodar para milhares ou milhões de usuários ao mesmo tempo, mesmo que eles estejam pagando.

E aqui a gente entra numa parte mais social e filosófica da coisa. Muita gente está comparando essa nova versão com a IA do filme “Her”, que mostra uma pessoa tendo sentimentos muito profundos pelo computador. Claro que isso vai acontecer, o que não falta nesse mundo é homem e mulher que derrama todo o coração para cima de ideias e objetos. Sejam os malucos que se apaixonam por personagens de anime, sejam as malucas que casam com monumentos.

Mas sinceramente: não acho que esse é o buraco no qual vamos cair. Apesar de ser “perigoso” dar uma personalidade para a IA e ter interação por imagem com ela, a parte da dependência emocional é um problema que as próximas gerações vão experimentar. Você precisa ser criado com uma IA conversando com você para naturalizar a ideia de que é uma outra consciência de verdade. Os “filhos de tablet” muito provavelmente vão ter uma série de problemas de socialização assim que descobrirem que o mundo real não é feito de inteligências que vivem em sua função, mas de uma certa forma… essa já não é a experiência de qualquer criança mimada?

O que começa a me parecer perigoso é a forma com a qual a tecnologia está sendo disponibilizada: tudo menos democrática. Serão empresas com acesso a poder de processamento enorme que poderão oferecer o serviço. E quando isso inevitavelmente estiver 100% monetizado, vai começar a aparecer uma diferença entre quem pode usar a IA e quem não pode.

Sutil no começo, talvez mais focada em tarefas intelectuais e criativas, mas essas coisas acumulam: ter um assistente o dia todo ao seu lado processando informação e te dando tudo mastigado não deixa de ser uma forma de terceirizar o cérebro. Já fazemos isso com muitas coisas, vai ser mais uma, mas quanto mais capaz de entender conceitos complexos e de lembrar de conversas recentes, mais poderoso fica esse cérebro auxiliar.

E como eu tinha escrito num texto recente sobre como privilégios funcionam, é o acúmulo que realmente muda o jogo: quanto mais você usa, maior o nível de vantagem que você vai juntando sobre outras pessoas. Com um bom ChatGPT do seu lado, você tem acesso a uma série de funções complexas que não poderia exercer normalmente. Aprender dá trabalho, seguir instruções nem tanto.

Mesmo que a IA ainda “alucine” algumas respostas, é perceptível o aumento da qualidade delas com o passar de poucos anos. É acúmulo também: mais treinamento, mais memória para lembrar de assuntos recentes, mais habilidade de interagir com o mundo… pessoas aumentadas pelas IA começam a passar na frente de pessoas que usam apenas seu cérebro. Em uma ou duas gerações talvez nem chame atenção, mas e se a tecnologia não permitir um ChatGPT poderoso para todo mundo de graça?

Quem tiver esse poder nas mãos vai poder perceber mais cedo de que áreas deve sair para não ser atropelado pelas máquinas, vai poder se especializar em funções que conversem melhor com a tecnologia disponível, vai ter muito mais oportunidades nas mãos do que quem não puder acessar a IA, ou não puder acessar o poder máximo delas.

Pessoas muito esforçadas, criativas e boas de relacionamento ainda vão se destacar, provavelmente demora muito para máquinas substituírem de vez a nossa necessidade de ter outros seres humanos ao nosso redor; mas é possível que a barreira de mobilidade social fique ainda mais difícil de atravessar. De um lado semideuses com acesso irrestrito à inteligência acumulada da espécie, de outro trabalhadores braçais que não vão conseguir emular essa inteligência apenas com seus próprios esforços.

Não é o burro clássico que vai ficar para trás, é todo mundo que não puder começar a vida com dois cérebros. Vai ser que nem proteína na primeira infância e acesso a escolas de qualidade hoje em dia, gente que começa dez passos para trás vai começar dez mil. Se eu fosse extrapolar essa tendência de inteligência paga no futuro distante, eu escreveria uma história de ficção onde a humanidade literalmente se divide em duas.

Ter um cérebro secundário é o tipo de vantagem evolutiva que pode ser tão impactante quanto a diferença de um chimpanzé para um ser humano. O mundo de quem tem dois cérebros – um deles com acesso instantâneo a todo conhecimento humano – não tem como ser o mesmo de quem só tem um. Se você estiver comparando duas pessoas atuais, uma com uma IA ao lado e uma sem, claro que a diferença não parece tão gritante.

Mas e depois de umas 100 gerações de pessoas disparando na frente e criando filhos (ou clones ou mentes digitais) com esse tipo de suporte? Seria capitalismo terminal ao cubo. Faz uns 70 mil anos que nossos corpos são basicamente os mesmos e todas as diferenças em relação ao resto da natureza são baseadas em desenvolvimento intelectual. Essa evolução paralela do intelecto é ordens de magnitude mais poderosa que a natural. Demora 700 milhões de anos para criar um cérebro, demora 70 mil entre bater pedras umas nas outras e pousar na Lua.

Pode demorar apenas 700 para os mais ricos de hoje serem uma espécie completamente diferente usando cérebros artificiais. Não é que o ChatGPT 4o conversando é o fim do mundo, é que chama a atenção para como é perigoso isso ser uma evolução dentro de uma empresa e só funcionar de verdade se você tiver dinheiro suficiente para montar toda a estrutura. Até hoje os pobres tinham alguma chance de alcançar os ricos, mas… o que acontece quando inteligência exponencial estiver presa atrás de uma mensalidade?

Detesto esses pensamentos comunistas, mas… isso tem cheiro de uma nova Revolução Industrial e todo o problema humanitário que veio dela. Estamos na era de começar a usar motores a vapor para algumas coisas do dia a dia, mas quanto tempo até as chaminés ao redor do mundo estiverem cuspindo a fumaça da nova tecnologia sem parar?

Fica a dica: o mundo não é conhecido por privilegiar soluções para esse tipo de problema de desigualdade, então é importante sim pegar e usar esse cérebro secundário assim que tiver a chance. Porque pode começar a acumular mais rápido do que imaginamos.

Para dizer que tem medo da ciência, para dizer que finalmente vai ter um amigo, ou mesmo para dizer que vai trabalhar de ChatGPT orgânico: comente.

Se você encontrou algum erro na postagem, selecione o pedaço e digite Ctrl+Enter para nos avisar.

inteligência artificial, mercado de trabalho, sociedade

Comentários (12)

Deixe um comentário

O seu endereço de e-mail não será publicado.

Relatório de erros de ortografia

O texto a seguir será enviado para nossos editores: