Gemini, Claude e ChatGPT em Confronto no Desenvolvimento de um Leitor de E-books Baseado na Web

Pontos principais
- Desenvolveu um leitor de e-books baseado na web chamado Tome Reader usando chatbots de IA.
- O Gemini construiu a versão inicial com recursos de leitura e realce principais.
- O Claude refinou o tratamento de palavras-chave e adicionou melhorias visuais.
- O ChatGPT recriou o projeto final, mas lutou com a adição de um controle de volume.
- Os três modelos finalmente entregaram protótipos funcionais, apesar de reconstruções ocasionais.
- O Claude forneceu opções de preview e download convenientes; o ChatGPT às vezes exigiu cópia manual.
- O experimento mostra que uma solicitação bem elaborada pode compensar as diferenças entre os modelos.
Um desenvolvedor explorou a "codificação de vibração" usando três chatbots de IA - Gemini, Claude e ChatGPT - para criar um aplicativo web de leitura de e-books chamado Tome Reader. O aplicativo lê texto carregado em voz alta, realça em tempo real e adiciona música de fundo e efeitos sonoros ativados por palavras específicas.
Conceito e Motivação do Projeto
O desenvolvedor estava frustrado com as limitações dos dispositivos de leitura de e-books populares e decidiu criar um leitor baseado na web que pudesse ler texto em voz alta, fornecer realce em tempo real e enriquecer a experiência com música e efeitos sonoros contextuais. O objetivo era construir o aplicativo inteiro em um único arquivo HTML que pudesse ser executado em qualquer navegador sem dependências adicionais.
Escolha dos Chatbots
Três chatbots de IA foram testados: o Gemini da Google, o Claude da Anthropic e o ChatGPT da OpenAI. Em vez de selecionar um deles inicialmente, o desenvolvedor usou cada modelo em sucessão, primeiro construindo uma versão básica com o Gemini, então pedindo ao Gemini para gerar uma solicitação que pudesse ser alimentada ao Claude, e finalmente tendo o Claude produzir uma solicitação refinada para o ChatGPT.
Contribuição do Gemini
O Gemini produziu os recursos principais do Tome Reader, incluindo a inicialização da fala, o gerenciamento de upload de arquivos e a capacidade de alternar música de fundo e efeitos sonoros. Ele também gerou uma solicitação para reutilização com os outros modelos.
Refinamentos do Claude
O Claude melhorou o tratamento de palavras-chave, expandindo o vocabulário e melhorando os efeitos visuais. Ele também introduziu uma limitação - permitindo um som ou efeito visual apenas uma vez por frase - para evitar sobrecarregar o usuário. Essa ajuste não foi explicitamente solicitado, mas demonstrou o foco do Claude na experiência do usuário.
Reprodução do ChatGPT
Usando a solicitação final do Claude, o ChatGPT recriou o projeto com precisão, embora tenha sido o mais lento para gerar código. Uma tentativa de adicionar um controle de volume dedicado para a música de fundo falhou consistentemente, levando a um retorno ao Claude para essa funcionalidade.
Reconstrução do Projeto
Quando a solicitação final foi carregada em uma nova conversa, o Gemini e o ChatGPT recriaram o aplicativo sem problemas, mas o Claude exigiu várias tentativas de reconstrução antes que o projeto carregasse além da tela de inicialização. Apesar desses problemas, os três modelos finalmente entregaram uma versão funcional do Tome Reader.
Observações sobre o Comportamento do Modelo
O Claude ofereceu opções de preview e download convenientes para o arquivo HTML, enquanto o ChatGPT às vezes exigia cópia manual. O Gemini, apesar de poucos erros, exigiu um fluxo de trabalho mais longo. O desenvolvedor concluiu que a escolha do vencedor depende das prioridades do usuário, pois cada modelo exibiu prós e contras distintos.
Conclusão Final
O experimento destaca que uma solicitação sólida e bem elaborada pode permitir que qualquer um dos principais chatbots de IA produza um protótipo viável, tornando o usuário o principal beneficiário da tecnologia.