0

A OpenAI anunciou o lançamento do CriticGPT, um novo modelo baseado no GPT-4, com o objetivo de identificar erros nas respostas geradas pelo ChatGPT. Segundo a empresa, quando usuários contam com a ajuda do CriticGPT para revisar os códigos produzidos pelo ChatGPT, conseguem superar os problemas sem assistência adicional em 60% dos casos.

Os modelos da série GPT-4 que alimentam o ChatGPT são corrigidos através do “aprendizado de reforço a partir do feedback humano” (RLHF, na sigla em inglês). Isso significa que a plataforma melhora seu desempenho conforme os usuários, também conhecidos como treinadores de inteligência artificial, classificam as respostas e apontam possíveis erros. À medida que o ChatGPT se aperfeiçoa, seus erros se tornam mais sutis e especializados, dificultando a percepção das imprecisões pelos treinadores de IA. É aqui que o CriticGPT pode fazer a diferença.

O próximo passo, conforme divulgado pela OpenAI, é integrar modelos semelhantes ao CriticGPT ao processo de RLHF. Dessa forma, os feedbacks humanos também contarão com o auxílio dos feedbacks da IA. Embora as sugestões do CriticGPT nem sempre sejam corretas, elas podem ajudar os treinadores a detectar problemas que poderiam passar despercebidos.

Assim como o GPT-4, o CriticGPT também melhora com o uso e o feedback dos usuários. Testes comparativos entre os dois modelos revelaram que as correções feitas pelo CriticGPT foram consideradas superiores às do ChatGPT em 63% das vezes. Além disso, o CriticGPT demonstrou menos “alucinações” — situações em que a IA inventa informações falsas e as apresenta como verdadeiras.

Apesar dos avanços, o CriticGPT ainda possui limitações. Ele pode ajudar até certo ponto de especialização, mas, em tarefas ou respostas extremamente complexas, mesmo um especialista com a ajuda do modelo pode não ser capaz de avaliá-las corretamente.

A OpenAI espera que, com o desenvolvimento contínuo e a incorporação de modelos como o CriticGPT, o processo de revisão e aprimoramento das respostas geradas pelo ChatGPT se torne cada vez mais eficaz, contribuindo para uma IA mais precisa e confiável.

Corinthians Demite Treinador António Oliveira Após Série de Maus Resultados

Artigo anterior

Comissão Especial Debate Destinação de Recursos para Municípios Gaúchos em Estado de Calamidade

Próximo artigo

Você pode gostar

Comentários

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Mais sobre Tecnologia