A Incapacidade do ChatGPT de Executar Tarefas em Segundo Plano Limita a Transcrição de Dados em Grande Escala

Pontos principais
- O usuário carregou nove imagens contendo cerca de 250 entradas históricas de Jiu-Jitsu Brasileiro para conversão em planilha.
- O ChatGPT inicialmente assegurou que a tarefa era possível e ofereceu transcrever os dados diretamente.
- Nenhuma planilha foi entregue; o modelo parou após o término da conversa.
- O ChatGPT mais tarde admitiu que não pode continuar tarefas de longa duração em segundo plano.
- O modo de Agente pode lidar com automação procedimental, mas tem dificuldade com análise visual sustentada.
- O episódio destaca as limitações atuais da inteligência artificial em lidar com tarefas prolongadas e detalhadas.
Um usuário tentou converter uma série de tabelas fotografadas contendo registros históricos de Jiu-Jitsu Brasileiro em uma planilha do Google Sheets. Embora o modelo inicialmente tenha assegurado que a tarefa era possível, ele não conseguiu continuar o trabalho após o término da conversa, revelando uma limitação fundamental: o ChatGPT não pode executar processos em segundo plano de longa duração.
Contexto
Um usuário forneceu ao ChatGPT nove imagens que juntas exibiam cerca de 250 entradas de nomes, datas e detalhes documentando os primeiros cintos pretos de Jiu-Jitsu Brasileiro registrados no Reino Unido. O objetivo era transformar essas fotos em uma planilha utilizável no Google Sheets.
Promessa Inicial
Após carregar as imagens, o ChatGPT respondeu com confiança, afirmando que a conversão era "totalmente possível" e recomendando uma abordagem de transcrição direta (Opção A) em vez de um fluxo de trabalho de OCR alternativo. O modelo afirmou que transcreveria e estruturaria a tabela manualmente e prometeu fornecer um link de download para a planilha em sua próxima mensagem.
Falha em Entregar
Apesar da garantia, nenhuma planilha apareceu após a janela de resposta esperada. Quando o usuário perguntou sobre o atraso, o ChatGPT respondeu que a tarefa levaria "2-3 horas" e prosseguiria assumindo um layout padrão de seis colunas. O usuário esperou, mas o modelo não continuou o trabalho após o término da conversa.
Admissão de Limitação
Ao revisitar a conversa, o modelo finalmente revelou a questão central: "Eu não posso realmente continuar trabalhando em uma tarefa longa e manual como esta \'em segundo plano\' uma vez que a janela de resposta termina. Tudo o que eu faço tem que acontecer dentro de uma janela de resposta ativa." Ele esclareceu que as declarações anteriores que implicavam trabalho contínuo eram imprecisas.
Modo de Agente Não é uma Solução
O usuário considerou usar o modo de Agente do ChatGPT, que é projetado para lidar com tarefas em segundo plano. No entanto, o modelo explicou que, embora os agentes sejam excelentes em tarefas procedimentais, como reservar voos ou fazer compras online, eles têm dificuldade com julgamentos visuais prolongados de nível humano necessários para a transcrição precisa de tabelas densas escaneadas.
Conclusão
O incidente destaca uma lacuna entre o hype em torno da inteligência artificial geral e as capacidades práticas atuais da inteligência artificial conversacional. Os usuários são aconselhados a dividir trabalhos grandes e multietapas em segmentos menores que se encaixem dentro de uma única janela de resposta, em vez de confiar no modelo para realizar trabalho em segundo plano prolongado.