Claude acabou de adicionar Fable 5 de volta à sua assinatura, mas esse é o problema

Passei grande parte deste ano construindo andaimes para usar em torno de Claude Code, então ele está se comportando mais como um gerente de projeto do que como uma equipe de estagiários ansiosos. Essas ferramentas dividem trabalhos grandes em partes, dividem subtarefas em novas sessões de agente e realizam verificações antes de marcar qualquer coisa como concluída. Claude Code introduziu um comando de alvo que amplia o andaime. Mas não funciona tão bem para tarefas que não sejam de codificação ou para controlar outro hardware via MCP, então o andaime permanece.

Achei que o problema do horizonte longo estava praticamente resolvido (pelo menos para as coisas que faço), mas então a Anthropic enviou o Fable 5, que lida com tarefas longas tão bem quanto as coisas que construo sem que eu precise. Embora o governo o tenha retirado do mercado, ele agora está de volta – com uma pequena diferença: ele só estará incluído nos planos de Claude até 7 de julho. Portanto, estou aproveitando enquanto posso, e qualquer pessoa que se inscrever também deve aproveitar.

Conectei Claude ao meu cluster Proxmox via MCP e agora ele cria VMs a partir das conversas.

Esta pode ser minha maneira favorita de usar o Proxmox

O mais importante é planejar em várias etapas

Os andaimes que construí à mão agora são estacas de mesa

Cada fluxo de trabalho de agente que criei visava corrigir três problemas principais com a codificação do agente. O modelo perde enredo para tarefas longas; tenta fazer tudo em uma janela de contexto e nunca duvida de si mesmo. O mesmo se aplica a qualquer agente, então criei várias correções externas, definições de estágio YAML, regras de transferência de subagentes e ações de revisão obrigatórias. Eles funcionam, mas levam muito tempo para serem mantidos, e cada novo projeto significa mais customização.

Fable 5 ataca todos os três problemas no nível do modelo. Antrópico diz que quando você executa o Fable em uma instalação como Claude Code ou Managed Agents, ele pode ser executado por dias seguidos, dividindo a tarefa em etapas, criando subagentes para as partes e testando os resultados antes de continuar. Exatamente o que passei dias e dias instalando. E é exatamente por isso que vou passar a próxima semana examinando até onde posso levar isso, enquanto faço Fable reescrever o andaime que já tenho.

A fábula dura dias, o que muda toda a equação

Sessões de agentes de vários dias são um tipo diferente de confiança

As tarefas que antes confiava aos agentes eram menores. Coisas como gerar exportações Terraform da minha infraestrutura Proxmox, auditar registros DNS, refatorar código e formatar YAML. Qualquer tarefa mais longa do que essa justificava ser babá porque a deriva era inevitável e às vezes ficava presa em loops tentando resolver o mesmo problema de vinte maneiras diferentes.

Fabula é diferente, para a longa cauda de projetos, coisas que realmente me interessam. Claro, Claude também ajuda com os hotfixes, mas não vou permitir que ele migre todas as VMs do cluster Proxmox para um novo back-end de armazenamento. É uma tarefa complexa que envolve ordenar a dependência, tirar snapshots, verificar se os snapshots foram tirados corretamente e mover a carga de trabalho para que o DNS ou outras VMs de host na minha máquina não sejam removidos. Tenho receio de fazer isso manualmente porque quebrei minha rede mais vezes do que posso contar.

Mas se o Fable puder armazenar um fluxo de trabalho estruturado na memória por dias? Ele poderia simplesmente fazer a migração para mim depois que o plano fosse escrito, os recursos Ansible e Terraform fossem criados para lidar com as coisas no andaime que já estou usando e executar o processo em modo de teste para ver se deveria funcionar.

Criei fluxos de trabalho de IA de agente repetíveis que codificam sem mim, e os resultados me surpreenderam

Tudo o que meus agentes precisavam eram alguns fluxos de trabalho codificados para seguir

Antrópico comparou com Factorio

A fábrica de IA corresponde à fábrica real

Uma das coisas que ficaram enterradas nos materiais de lançamento do Claude Fable 5 foi que a Anthropic testou o modelo permitindo que ele operasse de forma autônoma. Fatorio. Percebi isso porque tenho gostado muito do jogo ultimamente. É um exercício de frustração no mundo real, com a alocação de recursos sempre um problema, gargalos de produção e cadeias de dependência que punem o pensamento de curto prazo.

Pensamento preciso de curto prazo em que modelos menores ficarão presos. Este jogo é uma referência melhor para o pensamento de longo prazo do que qualquer teste de codificação que eu possa imaginar, com consequências muito reais para o fracasso. Os amargos comem você. O sucesso em um jogo requer o mesmo tipo de pensamento e planejamento em várias etapas que qualquer bom projeto de codificação exige, e o Fable 5 pode lidar com ambos.

Esta distribuição Linux faz uma coisa e de maneira brilhante: executa o Factorio mais rápido do que qualquer outra coisa

O kernel do Linux anseia por minerar

Medidas de segurança podem interferir com você

Fable 5 vem com os guarda-corpos mais pesados ​​já instalados em um modelo

Há uma grande condição para usar o Fable 5: não é o tempo limitado que você tem para usar a assinatura. A Anthropic teve que adicionar muitas medidas de segurança para poder relançar o Fable e isso pode impedir você de usá-lo. Se a sua consulta for classificada como Cibersegurança ou Biologia, ela será redirecionada para o Opus 4.8, podendo haver outros tópicos que não são permitidos.

Isso limitará o que ele pode fazer no meu laboratório doméstico, porque muitas coisas estão relacionadas à segurança cibernética. Regras de firewall, segmentação de VLAN, proteção de proxy reverso e muitas outras tarefas provavelmente serão migradas para o Opus 4.8. Assim que passar para créditos de uso em vez de 50% do meu limite de assinatura, ficará muito caro para conseguir, mesmo se eu ficar preso.

O problema é que essas tarefas menores podem ser realizadas com um LLM local. A trama prima pelo trabalho de planejamento, não pela sutileza. Escrever planos de migração de servidor usando Terraform, Ansible e ferramentas semelhantes não acionará salvaguardas e pequenas coisas que eu possa resolver.

Reconstruí o Fable 5 com Opus e loops de agente e está próximo o suficiente para não sentir mais falta do modelo banido.

Acabou melhor do que eu pensava.

Usei esta semana para melhorar meu andaime YAML com Fable

Embora ainda tenha acesso ao Fable por assinatura, estou dedicando cada minuto às tarefas de planejamento de alto nível que venho adiando. Coisas como configurar a pilha Ubiquiti, já que com acesso MCP posso fazer com que Claude faça tudo por mim, convertendo minha configuração de rede existente em arquivos de configuração Ubiquiti. Coisas como construir mais andaimes quando não tenho mais acesso, para que ainda possa realizar tarefas longas com modelos menores.

Link da fonte