top of page
Buscar
Foto do escritorD.r Maiko Rafael Spiess

“Sobre as Inteligências Artificiais / com as Inteligências Artificiais: um experimento sobre novas formas para o artigo científico”

Atualizado: há 4 dias


Prof. Dr. Maiko R. Spiess



Introdução

Nos últimos anos, as Inteligências Artificiais (IAs) têm desempenhado um papel crescente em diversas áreas do conhecimento, transformando não apenas a forma como vivemos, mas também como produzimos e compartilhamos conhecimento científico. Entre os avanços mais notáveis, destacam-se os grandes modelos de linguagem (Large Language Models, LLMs), como o ChatGPT, que têm gerado debates intensos sobre sua aplicação em atividades como análise de dados, escrita científica e consumo de literatura especializada. Este artigo explora as múltiplas dimensões dessa transformação, investigando como as IAs impactam a produção e a comunicação científica, ao mesmo tempo em que propõe um experimento prático para refletir sobre novas formas de interação com o conhecimento científico. Com isso, buscamos compreender não apenas os potenciais, mas também os desafios éticos e epistemológicos impostos por essas tecnologias emergentes. 


Sobre as IAs

A explosão no uso e popularidade das Inteligências Artificiais (IAs) e, em particular, dos grandes modelos de linguagem (Large Language Models, LLMs), como o popular ChatGPT, modificou diferentes aspectos de nossas vidas. Obviamente, essa onda de mudanças atingiu também a atividade científica, com implicações ainda não completamente exploradas ou compreendidas. Em nosso artigo “Do laboratório ao data center: reconfigurando a atividade científica por meio da inteligência artificial” (Spiess & Mattedi, 2024), propomos duas dimensões da atividade científica que estão sendo impactadas pelas IAs: a produção de dados e a redação da comunicação científica. Isto é, do ponto de vista dos cientistas-pesquisadores, a Inteligência Artificial possui impactos tanto na entrada (obtenção, produção de dados e análise de dados) quanto na saída (redação de artigos, processos editoriais, publicação). 

 

Assim, por um lado, o uso das IAs (e dos chatbots) na geração textual tem, por exemplo, levantado questões interessantes sobre a noção de autoria. Se utilizo o ChatGPT para escrever um texto, passo a ser “menos autor”? Os modelos de linguagem possuem algum tipo de inteligência ou criatividade, ou geram apenas associações estatísticas de palavras, para os quais nós, humanos, atribuímos significado? Como uma comunidade, os cientistas devem resistir a essas mudanças, por exemplo, por meio da proibição do uso de chatbots na produção textual, como alguns periódicos importantes já fizeram? Ou devemos adotá-la, aumentando a produtividade dos cientistas e assim liberando tempo para outras atividades, como a reflexão, elaboração de hipóteses, condução de pesquisa e – por que não? – para atividades extraprofissionais? 


Por outro lado, do ponto de vista da pesquisa e produção de dados, a aplicação de IAs vem aumentando significativamente. Aqui, o caso exemplar é o programa de IA chamado AlphaFold, produzido pela Google DeepMind. Esta tecnologia possibilitou uma aceleração sem precedentes na pesquisa sobre as estruturas de proteínas e, por isso, rendeu aos seus criadores o Prêmio Nobel de Química de 2024. A exemplo desse marco, inúmeras outras áreas de conhecimento e técnicas de pesquisa poderão ser drasticamente modificadas pelas IAs, seja em aspectos operacionais ou epistêmicos. Nesse sentido, um prognóstico possível é o da aceleração das descobertas científicas e, possivelmente, uma reorganização normativa e prática da profissão científica. Talvez ainda não tenhamos plena percepção do alcance e dos impactos (positivos e negativos) dessas mudanças, mas é fato que elas parecem cada vez mais certas. 

 


Síntese das principais implicações da IA na pesquisa

Produção

Circulação

  • Obtenção de dados

  • Automação da escrita

  • Geração de hipóteses

  • Produtivismo

  • Produção de dados sintéticos e simulações

  • Ressignificação das formas atuais de publicação

Elaboração própria 


Todavia, nosso artigo não aborda outra dimensão possível do impacto das IAs na atividade de pesquisa científica: o consumo de literatura especializada. Vejamos, então, algumas implicações neste sentido. Primeiramente, no nível macro, o processamento computacional e por IA da absurdamente crescente literatura científica ficou muitíssimo facilitado. Revisões bibliográficas e do “estado da arte” que, anteriormente, eram demoradas e custosas, além de, em muitos casos, se tornarem uma convenção coletiva mais acessória e desacoplada de sua função original, estão sendo rapidamente modificadas. Softwares e serviços como os chatbots mais convencionais (Perplexity.ai) têm trazido agilidade ao processo. Além deles, surgem soluções mais específicas, como Research Rabbit, Jenni, Connected Papers e VOSviewer, que também contribuem para tornar as revisões mais eficientes e acessíveis. Aqui, existe uma grande potencialidade de ganhos de rapidez e escala significativos. 


Nosso interesse, no entanto, é explorar o nível micro, onde as tecnologias de IA e dos modelos de linguagem permitem consumir o conteúdo de artigos científicos de uma forma relativamente nova. Até há pouco, o leitor de artigos científicos deveria ser socializado em uma cultura específica para compreender a estrutura e modos de exposição dos textos; além disso, a leitura quase sempre era feita de maneira linear e restrita, e o processo de reflexão e conexões conceituais era guiado pelo texto (leitor passivo). Agora, com o auxílio de novas tecnologias, o consumo de literatura científica pode ser potencialmente mais dinâmico e objetivo, podendo ser conduzido em linguagem natural comum, ao invés de depender do jargão “nativo” de cada campo científico. Em outras palavras, os meios técnicos atuais potencialmente permitem que o leitor se torne mais ativo, “dialogando” com o texto e obtendo informações de forma mais rápida e contextualizada. 


É verdade que esse tipo de interação já pode ser obtido atualmente por meio de recursos como o próprio ChatGPT ou o ChatPDF. No entanto, esses serviços normalmente demandam que o usuário faça um login ou entre em um ambiente dedicado, o que funcionaria para uso individual, mas que, do ponto de vista da acessibilidade mais ampla, pode alienar usuários menos familiarizados com essas tecnologias. Para que a experiência seja mais imersiva, o chatbot dedicado poderia ser disponibilizado juntamente do HTML ou PDF na página do periódico. Para o leitor, isso consolidaria a ideia de um assistente de IA específico para o texto. Para os autores e editores, o histórico de interações com o assistente (guardadas as devidas precauções com segurança de dados) possibilitaria obter uma variedade de dados interessante do ponto de vista do consumo de texto (Quais são as dúvidas mais frequentes? Em quais pontos o texto poderia ser mais claro?) 


Com as IAs

Para explorar essa proposição, propomos um experimento simples. Abaixo, você encontrará duas formas de apropriação do conteúdo de um artigo científico: a) o texto em formato pdf, conforme disponibilizado no site do periódico científico; b) um chatbot customizado, preparado especialmente para localizar, resumir e explorar o conteúdo do mesmo artigo, por meio de interação dialógica em linguagem natural (ou seja, da mesma forma como são feitas as interações com o ChatGPT, por exemplo). O texto utilizado é o já mencionado “Do laboratório ao data center: reconfigurando a atividade científica por meio da inteligência artificial” (Spiess & Mattedi, 2024), publicado na revista Cadernos de Ciência e Tecnologia (CC&T), da Embrapa, como parte da chamada “CT&I no mundo em transformação: que atores, caminhos e motores se revelam?”.


Cadernos CC&T, V.41, Jan./Dec., 2024

Disponível aqui


A escolha do texto para o experimento não deixa de ter um componente reflexivo. Afinal, trata-se de um texto que fala de IAs na Ciência, sendo empregado para demonstrar como as IAs podem impactar o consumo de textos científicos. Cabe, portanto, explicitar claramente quais as tecnologias e os métodos empregados para isso. As principais ferramentas para o processamento do texto são os embeddings e os modelos de linguagem da OpenAI (criadora do ChatGPT). Um embedding é a representação de um conteúdo do texto em vetores, em um espaço de características contínuo. Assim, palavras com significados próximos (por exemplo "rei" e "rainha") terão vetores próximos, enquanto palavras com significados distintos estarão mais distantes. Em resumo, embeddings são o "vocabulário matemático" que os LLMs usam para processar e interpretar linguagem natural. 


A vetorização e a interação com o usuário do chatbot são configuradas e acionadas por meio da API (Application Programming Interface) chamada Assistants, da OpenAI, uma ferramenta que permite criar assistentes de IA personalizados dentro de aplicações (ex.: uma página web). Esses assistentes recebem instruções específicas e podem usar modelos de IA, ferramentas e arquivos para responder às perguntas dos usuários. Neste experimento, utilizamos a ferramenta Busca em Arquivos da API, para associar o texto do artigo com o modelo de linguagem e este, então, realizar a interação com o usuário. Para a integração do chatbot com o ambiente web do site, utilizamos a solução Predictable Dialogs, que cria a interface e disponibiliza o código para execução remota como um widget. Cabe notar que os recursos foram implementados com uma abordagem low code, isto é, com pouca necessidade de aplicação de linguagens de programação. 


Assim, chegamos finalmente a nosso pequeno experimento. Utilize o espaço abaixo para "dialogar" com o artigo, por meio de perguntas abertas. Alguns exemplos: “quem são os autores do texto?” ou “quais os argumentos centrais do artigo?”. Ou faça solicitações como “liste os cinco argumentos centrais” ... Enfim, a ideia é que você explore o conteúdo do artigo livremente com a assistência da IA. Para a avaliação da qualidade das respostas, verificação da veracidade e precisão, ou mesmo aprofundamento no tema, o texto original também está disponibilizado abaixo. Mas atenção: nosso objetivo aqui não é, necessariamente, debater as hipóteses e informações contidas no texto, mas sim analisar reflexivamente as implicações dos modelos de linguagem de IA para o consumo de artigos científicos. Em outras palavras, explorar a possibilidade de substituição dos textos estáticos por conteúdos acessíveis interativamente. 






E então? O quanto sua experiência foi distinta de uma interação com o ChatGPT padrão? E o quanto essa nova forma de “leitura” de um artigo difere da abordagem tradicional? Por um lado, talvez você tenha se dado conta de que essa metodologia permite aumentar não apenas a atualidade dos modelos de linguagem (por exemplo, o GPT-4 foi treinado com dados disponíveis apenas até outubro de 2023), mas também sua precisão (como apontamos e direcionamos o modelo para uma base textual específica, ele tende a “alucinar” menos). Essa técnica é chamada de RAG - Retrieval Augmented Generation (Geração Aumentada por Recuperação) e é frequentemente empregada para melhorar a performance dos modelos de linguagem e chatbots. Isso possibilitaria, no futuro, termos um “ChatGPT” específico e customizado para cada artigo científico, livro ou relatório, como um assistente para melhorar a rapidez e profundidade de nossa compreensão sobre o conteúdo. 


Por outro lado, talvez essa perspectiva lhe pareça alienígena ou errada. Afinal de contas, a habilidade de leitura e interpretação dos textos científicos é parte da socialização neste campo. Ou talvez isso apenas pareça um exercício supérfluo e banal, até mesmo uma irresponsabilidade, considerando que, no limite, toda essa operação implica gastos de energia e de recursos aplicados para o funcionamento dos data centers onde os LLMs estão operando. Sim, essas são ressalvas válidas. Porém, devemos também questionar se essa postura não seria uma espécie de conservadorismo, sustentado por uma superioridade moral dos cientistas de que suas atividades são diferentes daquelas de todo o resto da sociedade. Logo, cabe a pergunta: se as respostas da IA são internamente coerentes e factualmente verdadeiras, por qual razão elas seriam epistemologicamente inferiores? 

 

É certo que existe um grande hype em torno das capacidades das IAs e que algumas expectativas e previsões poderão se demonstrar incorretas. Todavia, os avanços recentes e as capacidades atuais das IAs seriam considerados impensáveis e fantasiosos há uma década. Mais do que isso, os resultados concretos dessas novas tecnologias cada vez mais parecem sinalizar para sua persistência e para uma influência mais profunda, em diferentes áreas da vida, incluindo a atividade científica. Por isso, talvez daqui a alguns anos, seja estranho que alguém não use algum tipo de IA para produzir dados, escrever artigos ou simplesmente para lê-los e interpretá-los. Hoje, temos naturalizados e “invisíveis” os corretores ortográficos e os recursos para autocompletar textos (a propósito, dois tipos de IA aplicado à textos). Amanhã, poderemos ter a mesma impressão em relação aos assistentes de IA. 

21 visualizações0 comentário

Comments


bottom of page