Nos últimos dois anos, o mundo se maravilhou com as capacidades e possibilidades trazidas pela IA Generativa. LLMs (Large Language Models) podem realizar feitos impressionantes, extraindo insights e gerando conteúdo em vários meios como texto, áudio, imagens e vídeo. Mas o próximo estágio da IA Generativa provavelmente será mais transformador.
Estamos começando uma evolução de ferramentas baseadas em conhecimento e alimentadas por IA Generativa para “agentes” habilitados por IA Generativa que usam LLMs para executar fluxos de trabalho complexos e de várias etapas em um mundo digital. Em suma, a tecnologia está passando do pensamento para a ação.
Em termos gerais, sistemas baseados em agentes referem-se a sistemas digitais que podem interagir independentemente em um mundo dinâmico. Embora versões desses sistemas de software existam há anos, os recursos de linguagem natural da IA Generativa revelam novas possibilidades, permitindo que sistemas planejem suas ações, usem ferramentas on-line para concluir essas tarefas, colaborem com outros agentes e pessoas e aprendam a melhorar seu desempenho.
Os agentes baseados em IA Generativa eventualmente poderiam atuar como colegas de trabalho virtuais qualificados, trabalhando com humanos de maneira natural e contínua. Um assistente virtual, por exemplo, poderia planejar e reservar um itinerário de viagem personalizado complexo, lidando com a logística em várias plataformas de viagem. Usando a linguagem cotidiana, um Engenheiro de IA poderia descrever um novo recurso de software para um agente programador, que então codificaria, testaria, iteraria e implantaria a ferramenta que ajudou a criar.
Os sistemas de agentes tradicionalmente têm sido difíceis de implementar, exigindo programação baseada em regras ou treinamento altamente específico de modelos de aprendizado de máquina. A IA Generativa muda isso. Quando os sistemas de agentes são construídos usando LLMs (que foram treinados em conjuntos de dados não estruturados extremamente grandes e variados) em vez de regras predefinidas, eles têm o potencial de se adaptar a diferentes cenários da mesma forma que os LLMs podem responder de forma inteligível a prompts nos quais não foram explicitamente treinados.
Além disso, usando linguagem natural em vez de código de programação, um usuário humano pode direcionar um sistema de agente habilitado para IA Generativa para realizar um fluxo de trabalho complexo. Um sistema multiagente pode então interpretar e organizar esse fluxo de trabalho em tarefas acionáveis, atribuir trabalho a agentes especializados, executar essas tarefas refinadas usando um ecossistema digital de ferramentas e colaborar com outros agentes e humanos para melhorar iterativamente a qualidade de suas ações.
Embora a tecnologia permaneça em sua fase inicial e exija mais desenvolvimento técnico antes de estar pronta para implantação comercial, ela está rapidamente atraindo atenção. Somente no ano passado, Google, Microsoft, OpenAI e outros investiram em bibliotecas de software e frameworks para dar suporte à funcionalidade baseada em agentes. Aplicativos com tecnologia LLM, como Microsoft Copilot, Amazon Q e o próximo Projeto Astra do Google, estão mudando de baseados em conhecimento para se tornarem mais baseados em ação. Empresas e laboratórios de pesquisa como Adept, crewAI e Imbue também estão desenvolvendo modelos baseados em agentes e sistemas multiagentes.
Dada a velocidade com que a IA Generativa está se desenvolvendo, os agentes podem se tornar tão comuns quanto os chatbots são hoje.
David Matos
Referências: