A Incapacidade do ChatGPT de Executar Tarefas em Segundo Plano Limita a Transcrição de Dados em Grande Escala

Um usuário tentou converter uma série de tabelas fotografadas contendo registros históricos de Jiu-Jitsu Brasileiro em uma planilha do Google Sheets. Embora o modelo inicialmente tenha assegurado que a tarefa era possível, ele não conseguiu continuar o trabalho após o término da conversa, revelando uma limitação fundamental: o ChatGPT não pode executar processos em segundo plano de longa duração.

Contexto

Um usuário forneceu ao ChatGPT nove imagens que juntas exibiam cerca de 250 entradas de nomes, datas e detalhes documentando os primeiros cintos pretos de Jiu-Jitsu Brasileiro registrados no Reino Unido. O objetivo era transformar essas fotos em uma planilha utilizável no Google Sheets.

Promessa Inicial

Após carregar as imagens, o ChatGPT respondeu com confiança, afirmando que a conversão era "totalmente possível" e recomendando uma abordagem de transcrição direta (Opção A) em vez de um fluxo de trabalho de OCR alternativo. O modelo afirmou que transcreveria e estruturaria a tabela manualmente e prometeu fornecer um link de download para a planilha em sua próxima mensagem.

Falha em Entregar

Apesar da garantia, nenhuma planilha apareceu após a janela de resposta esperada. Quando o usuário perguntou sobre o atraso, o ChatGPT respondeu que a tarefa levaria "2-3 horas" e prosseguiria assumindo um layout padrão de seis colunas. O usuário esperou, mas o modelo não continuou o trabalho após o término da conversa.

Admissão de Limitação

Ao revisitar a conversa, o modelo finalmente revelou a questão central: "Eu não posso realmente continuar trabalhando em uma tarefa longa e manual como esta \'em segundo plano\' uma vez que a janela de resposta termina. Tudo o que eu faço tem que acontecer dentro de uma janela de resposta ativa." Ele esclareceu que as declarações anteriores que implicavam trabalho contínuo eram imprecisas.

Modo de Agente Não é uma Solução

O usuário considerou usar o modo de Agente do ChatGPT, que é projetado para lidar com tarefas em segundo plano. No entanto, o modelo explicou que, embora os agentes sejam excelentes em tarefas procedimentais, como reservar voos ou fazer compras online, eles têm dificuldade com julgamentos visuais prolongados de nível humano necessários para a transcrição precisa de tabelas densas escaneadas.

Conclusão

O incidente destaca uma lacuna entre o hype em torno da inteligência artificial geral e as capacidades práticas atuais da inteligência artificial conversacional. Os usuários são aconselhados a dividir trabalhos grandes e multietapas em segmentos menores que se encaixem dentro de uma única janela de resposta, em vez de confiar no modelo para realizar trabalho em segundo plano prolongado.