Gemini, Claude e ChatGPT em Confronto no Desenvolvimento de um Leitor de E-books Baseado na Web

Um desenvolvedor explorou a "codificação de vibração" usando três chatbots de IA - Gemini, Claude e ChatGPT - para criar um aplicativo web de leitura de e-books chamado Tome Reader. O aplicativo lê texto carregado em voz alta, realça em tempo real e adiciona música de fundo e efeitos sonoros ativados por palavras específicas.

Conceito e Motivação do Projeto

O desenvolvedor estava frustrado com as limitações dos dispositivos de leitura de e-books populares e decidiu criar um leitor baseado na web que pudesse ler texto em voz alta, fornecer realce em tempo real e enriquecer a experiência com música e efeitos sonoros contextuais. O objetivo era construir o aplicativo inteiro em um único arquivo HTML que pudesse ser executado em qualquer navegador sem dependências adicionais.

Escolha dos Chatbots

Três chatbots de IA foram testados: o Gemini da Google, o Claude da Anthropic e o ChatGPT da OpenAI. Em vez de selecionar um deles inicialmente, o desenvolvedor usou cada modelo em sucessão, primeiro construindo uma versão básica com o Gemini, então pedindo ao Gemini para gerar uma solicitação que pudesse ser alimentada ao Claude, e finalmente tendo o Claude produzir uma solicitação refinada para o ChatGPT.

Contribuição do Gemini

O Gemini produziu os recursos principais do Tome Reader, incluindo a inicialização da fala, o gerenciamento de upload de arquivos e a capacidade de alternar música de fundo e efeitos sonoros. Ele também gerou uma solicitação para reutilização com os outros modelos.

Refinamentos do Claude

O Claude melhorou o tratamento de palavras-chave, expandindo o vocabulário e melhorando os efeitos visuais. Ele também introduziu uma limitação - permitindo um som ou efeito visual apenas uma vez por frase - para evitar sobrecarregar o usuário. Essa ajuste não foi explicitamente solicitado, mas demonstrou o foco do Claude na experiência do usuário.

Reprodução do ChatGPT

Usando a solicitação final do Claude, o ChatGPT recriou o projeto com precisão, embora tenha sido o mais lento para gerar código. Uma tentativa de adicionar um controle de volume dedicado para a música de fundo falhou consistentemente, levando a um retorno ao Claude para essa funcionalidade.

Reconstrução do Projeto

Quando a solicitação final foi carregada em uma nova conversa, o Gemini e o ChatGPT recriaram o aplicativo sem problemas, mas o Claude exigiu várias tentativas de reconstrução antes que o projeto carregasse além da tela de inicialização. Apesar desses problemas, os três modelos finalmente entregaram uma versão funcional do Tome Reader.

Observações sobre o Comportamento do Modelo

O Claude ofereceu opções de preview e download convenientes para o arquivo HTML, enquanto o ChatGPT às vezes exigia cópia manual. O Gemini, apesar de poucos erros, exigiu um fluxo de trabalho mais longo. O desenvolvedor concluiu que a escolha do vencedor depende das prioridades do usuário, pois cada modelo exibiu prós e contras distintos.

Conclusão Final

O experimento destaca que uma solicitação sólida e bem elaborada pode permitir que qualquer um dos principais chatbots de IA produza um protótipo viável, tornando o usuário o principal beneficiário da tecnologia.