Skip to main content

Colunas

Arquivos

Pesquisa fundamental.

Pesquisa fundamental.

| Somir | | 2 comentários em Pesquisa fundamental.

Que computadores e depois smartphones são máquinas importantíssimas para a revolução da comunicação humana não se discute. A internet então, vivo dizendo que vai ser o ponto onde historiadores futuros vão determinar o começo de uma nova era humana. Mas eu quero falar sobre algo que você usa o tempo todo e que talvez seja o grande definidor do avanço humano dos últimos tempos: a pesquisa automatizada.

É algo que você, com toda razão, pensa ser diretamente relacionado com o Google, a gigante de tecnologia que se construiu em cima de pesquisas na internet. E embora o Google tenha desenvolvido o sistema mais popular de todos, ele não é o começo dessa história.

Quem é dos velhos tempos da internet se lembra que havia uma guerra por acessos entre sites de pesquisa. Tecnologias competiam pela maior eficiência, a do Google nem foi a primeira da sua categoria. Ironicamente, o site ganhou muita relevância logo depois de ser lançado por ser menos infestado de propagandas e resultados confusos.

O robô do Google saia visitando todos os sites que podia e começava a guardar informações sobre cada um deles, especialmente relações entre links. Isso garantia que seus primeiros resultados não só tivessem as palavras que você pesquisava, mas também que fossem pontos de informação referenciados por muitos outros sites. Relevância por popularidade naquele tema.

E depois que o povo da internet pegou o hábito do Google, os próprios sites começaram a se organizar para serem mais legíveis para a ferramenta. Uma coisa reforça a outra e acabamos com aquele ponto central da informação online. Hoje o Google já começa a mudar sua forma de funcionar, implementando inteligência artificial para ler e resumir os principais resultados, pulando até mesmo a etapa de clicar num link depois da pesquisa.

Mas na base de tudo isso, a ideia mais poderosa da era da informação: indexação. Seja no sistema clássico de procurar palavras no site e contar quantos outros sites acham aquele resultado relevante, seja no novo paradigma de colocar uma IA para ler e resumir esses resultados, existe algo em comum. Alguém não humano leu o que estava escrito antes de um humano precisar daquela informação.

O nosso mundo da informação na ponta dos dedos é baseado em computadores que analisam tudo antes da gente precisar. Não tem atalho: alguém (ou algo) precisa seguir todos aqueles parágrafos dos sites ou livros até achar a palavra que você pediu. A economia de tempo de ter basicamente toda nossa produção intelectual pré-lida por nós é o que permite a humanidade ser como é agora.

Mesmo que tivéssemos grandes bibliotecas por boa parte dos últimos séculos, no máximo elas tinham alguns livros com códigos e temas para acelerar um pouco sua pesquisa. Se você não conhecesse alguém que já tivesse lido o livro antes, tinha que fazer todo o processo do zero. Basicamente, na parte de buscar conhecimento, cada pesquisador precisava inventar a roda para usar a carroça. Aprender e usar conhecimento de livros, manuais e similares era muito demorado. E com o risco recorrente de simplesmente não achar o que você queria. Seja por azar de ler o livro errado, seja por simplesmente não ter aquele conteúdo onde você estava.

A revolução começa com sistemas computadorizados de pesquisa através de palavras-chave criadas por humanos. A velocidade com a qual uma máquina consegue passar por uma lista de livros e devolver apenas os registrados com o tema que você quer bate virtualmente todos os bibliotecários do mundo. Talvez um ou outro especialmente experiente com memória acima da média conseguisse equilibrar o jogo, mas é óbvio que na média a máquina seria melhor.

Só que fica mais poderoso: com mais computadores, mais poderosos, começam a surgir algoritmos ainda mais rápidos que guardam ainda mais informações criadas por humanos. Não só os livros são encontrados por temas, como pessoas que leram o livro podem colocar mais informações sobre eles no banco de dados e deixar que a máquina ache relações entre elas para colocar na frente livros com mais palavras certas, mais palavras relacionadas, e melhor ainda: mais utilizações por pessoas pesquisando a mesma coisa. Sim, a alma do Google estava aí.

E quando livros começam a ser digitalizados por impressionantes tecnologias que transformam fotos das páginas em texto digital, já temos as sementes da internet plantadas. Computadores começam a se conversar à distância, e pesquisas feitas num lugar começam a mostrar livros que estão em outros.

Quando a internet ganha popularidade, todo esse conhecimento sobre indexação de conteúdos e algoritmos de relevância começa a ser utilizado na produção de novos materiais e na digitalização de antigos. Não só você encontra o livro ou site onde está a informação, mas como o conteúdo foi lido e transformado numa versão resumida (para máquinas), umas das coisas mais difíceis da nossa história fica fácil.

E pode parecer que eu estou falando só de pesquisas acadêmicas, mas como sabemos, essa ideia se espalhou de tal forma que virou como consumimos a maioria da informação hoje. Você pesquisa qualquer dúvida numa ferramenta automatizada, e versões adaptadas desses algoritmos de pesquisa movem as redes sociais, ditando o conteúdo que você consome.

Tudo funciona como funciona porque nossa tecnologia de pesquisa é muito rápida e muito eficiente. Pode parecer algo comum hoje, mas a ideia de ter uma caixa onde você digita algo ou um sistema que entende o que você diz e acha a agulha no palheiro em frações imperceptíveis de tempo é o que faz o mundo de hoje ser o mundo de hoje.

E o próximo passo, que é a IA, tem muito dessa lógica de pesquisar conteúdo. Ela ainda pesquisa no seu treinamento o que queremos e devolve um resultado. É que na sua programação existe a capacidade de montar um argumento compreensível para humanos. Não deixa de ser uma otimização de banco de dados em cima da primeira otimização de banco de dados que deu início à Era da Informação.

O ser humano é diferente antes de depois da caixa de pesquisa. O jeito como nos comunicamos, as ideias que temos, as opiniões e atitudes das pessoas… tudo extremamente influenciado pela informação que chega até a gente, e de como ela chega. Pronta, filtrada, específica. Quanta gente não tem ideias ou desiste delas em segundos por causa da facilidade de ser impactado pelo que outros humanos estão fazendo?

O quanto da sua visão de mundo não é influenciada pelos algoritmos que pesquisam por você? E nem é uma crítica ludita, reclamando de tecnologia, é uma constatação: a nossa realidade é diferente por causa desses sistemas. O que você sabe acaba influenciado pelo que é mais fácil de pesquisar pelas máquinas, as redes sociais e até mesmo jornalistas empurram conteúdo para nós por causa da forma como a informação é indexada. O que é mais popular é mais popular por interesse genuíno ou porque é mais eficiente para máquinas pesquisarem?

Explico: dá trabalho pegar um texto como este e usar como resposta para uma pesquisa. Trabalho para o sistema de pesquisa, para a IA e até mesmo para a pessoa que vai ler. Como disse antes, essas coisas acumulam: quanto mais simples de entender e transformar em linguagem de máquina, mais vai ser visto e mais vai ser indexado como relevante.

Não é só questão de quantidade de caracteres, é a facilidade de transformar uma ideia em palavras-chaves ou vetores numéricos para a IA. Quanto mais polarizada e simplificada a ideia, maior o potencial de marcar mais pontos no ranque de relevância, porque as palavras são mais direcionadas e as reações humanas são mais potentes. Os sistemas de pesquisa sempre entendem melhor quem é mais direto e mais focado, e isso pode estar poluindo os resultados que as pessoas encontram, criando um reforço de relevância.

Sim, existe uma corrida por cliques e atenção na internet, mas será que não tem um elemento “mecânico” na base de tudo isso mexendo com nossas prioridades? Meio como se a informação estivesse numa linha de produção industrial: o que é mais fácil de ser feito pelos robôs tem a maior tendência de acabar no produto final. O que até pode ser agradável para o consumidor final, mas que não funciona bem nessa linha de produção… acaba cortado por eficiência e lucratividade.

Muito se fala sobre como algoritmos acabam definido conteúdos mais apelativos porque o ser humano só quer isso. Mas não podemos ignorar a questão técnica, porque a forma como lidamos com informação hoje é definida por elementos técnicos de indexação e apresentação de informação. Produzimos coisa demais, era impossível saber tudo na antiguidade, é ainda mais impossível hoje.

Informação eficiente para ser pesquisada é a informação que a maioria de nós temos acesso. Influenciamos o que é mais popular ou tornamos popular o que funciona melhor para sistemas de pesquisa automatizada?

Não sei. Talvez a verdade esteja num meio termo. Nossos interesses ainda são muito primais, sexo e medo vendem. Mas eles podem ser manipulados por outro interesse primal: facilidade. Ainda bem que a tecnologia existe, porque o mundo era bem mais chato para pessoas sedentas por informação, mas eu duvido que ela venha de graça.

Comentários (2)

Deixe um comentário

O seu endereço de e-mail não será publicado.