Tentei Open WebUI, AnythingLLM e Odysseus para hospedar meu próprio fluxo de trabalho de IA e apenas um foi entregue

A IA auto-hospedada passou para a fase de chatbot. Agora existe toda uma categoria de ferramentas que envolve o modelo de sua escolha e oferece a ele um local adequado com armazenamento, documentos, ferramentas, agentes e tudo mais. Tudo o que você precisa fazer é adicioná-lo ao executor e o espaço de trabalho fará o resto. Em teoria, um deles é tudo que você precisa para cobrir a maior parte do que você faria com IA na nuvem, apenas sem assinatura e sem bate-papo em um servidor aleatório. Eu passei por algumas dessas ferramentas de espaço de trabalho de IA e todas elas fazem a mesma coisa de maneiras muito diferentes…

Quer se manter atualizado sobre as últimas IA? O boletim informativo XDA AI Insider é publicado semanalmente com análises aprofundadas, recomendações de ferramentas e informações práticas que você não encontrará em nenhum outro lugar do site. Assine alterando suas preferências de boletim informativo!

AnythingLLM transformou minhas anotações locais em algo com memória

Isto é para as peças que seu model runner deixa de fora

AnythingLLM é produzido pela Mintplex Labs e é totalmente de código aberto. A maneira como funciona é que ele fica sobre o executor de modelo existente em vez de substituí-lo, então LM Studio, Ollama, llama.cpp ou vLLM continuam a fazer a inferência real e AnythingLLM envolve todo o espaço de trabalho em torno dele. Você também pode apontar para uma API de nuvem como Anthropic ou OpenAI se quiser combinar o modelo de limite na mesma interface.

A principal razão pela qual o peguei foi a memória persistente e funciona. De vez em quando, um processo em segundo plano lê seus bate-papos recentes, extrai fatos que valem a pena guardar e os reintroduz em conversas futuras para que seu modelo local realmente saiba o que você contou semanas atrás. Há escopo de espaço de trabalho e global e, para ser honesto, esta é uma configuração muito melhor do que tentar alterar a memória via MCP ou prompts personalizados no LM Studio.

Embora eu ainda não tenha aproveitado ao máximo o AnythingLLM, já que é principalmente uma ferramenta que uso para memória, vale a pena mencionar os espaços de trabalho. Cada um é sua própria bolha isolada com seus próprios documentos, memória, modelo e configurações, para que você possa ter um espaço de trabalho de pesquisa executando o modelo local e um espaço de trabalho de codificação focado na API Claude, e nada quebra. Depois, há o lado do agente, que permite que o modelo realmente faça coisas como navegar na web, executar SQL, salvar arquivos ou usar servidores MCP, e é acionado usando @agent em qualquer chat. No geral, é uma ferramenta muito útil, embora um pouco simplificada para o espaço de trabalho.

Odisseu faz mais do que qualquer local de trabalho deveria

Aquele construído por PewDiePie

Odisseu é de longe o mais novo dos três e também o mais estranho. É um espaço de trabalho de IA auto-hospedado criado por PewDiePie, lançado há um mês no momento em que este artigo foi escrito. Em cerca de um mês, ganhou mais de 77.000 estrelas no GitHub, o que é muito para um projeto que surgiu do nada. Está em Python e FastAPI com ChromaDB para armazenamento de vetores e se conecta ao Ollama, llama.cpp, LM Studio, vLLM ou à API da nuvem, se desejar. A configuração leva um minuto se você seguir a rota do Docker, o que eu fiz, mas a recompensa vale a pena. A interface em si é muito bonita de se ver, e não sei se já disse isso sobre algo pré-hospedado.

Minha coisa favorita aqui é o livro de receitas, que analisa sua máquina e recomenda modelos que realmente funcionarão em seu hardware, usando um catálogo de mais de 270 opções. Então, em vez de ter que adivinhar se um modelo caberá em sua VRAM ou baixar 12B apenas para descobrir que ele quebra seu sistema, o livro de receitas informa isso antecipadamente e permite que você faça uma escolha diretamente na mesma tela.

O bate-papo é honestamente a coisa menos interessante. No entanto, cada conversa vem com um painel de notas que me dá a melhor sensação do NotebookLM para que você possa anotar onde parou, salvar trechos úteis de sua resposta e salvar um arranhão próximo ao modelo real sem sair da guia.

Há também um gerenciador de tarefas que a IA pode realmente ver e interagir, para adicionar tarefas, priorizá-las ou processá-las por meio de conversas com você, o que é algo realmente útil que está na mesma janela do seu bate-papo. E outra ferramenta muito estranha que você pode encontrar aqui, mas estou brincando com ela de qualquer maneira, é o editor de imagens… no espaço de trabalho de IA que tem tudo isso. Esta é a tentativa relatada de PewDiePie de usar seu Photoshop.

Open WebUI é o mais confiável

Estável e capaz, mas chato

Open WebUI é o mais velho dos três, com 350 milhões de downloads e fácil de usar, uma das interfaces de IA auto-hospedadas mais instaladas. Ele está posicionado como um espaço de trabalho completo no estilo ChatGPT que você mesmo gerencia e, como AnythingLLM, é independente de back-end, portanto pode ser conectado ao Ollama, LM Studio, vLLM, LocalAI ou qualquer API compatível com OpenAI. Docker é o caminho principal de instalação com um comando.

O bate-papo em si é limpo, mas chato; O que mais gosto é que cada conversa vem com um espaço de trabalho de notas com um editor avançado onde você pode escrever rascunhos livremente, deixar a IA transcrever partes selecionadas e, em seguida, inserir a nota inteira de volta no bate-papo como contexto.

Existem também canais onde as coisas ficam mais interessantes do que a interface normal de chat. Os canais são espaços compartilhados no estilo Slack onde você, seus colegas de equipe e vários modelos de IA vivem na mesma linha do tempo. Você marca um modelo com @ para trazê-lo para a conversa e ele responde diretamente no tópico para que você possa dizer ao GPT para escrever algo, marcar Claude para criticá-lo e fixá-lo.

A memória persistente também está aqui e funciona automaticamente para todos os chats, portanto seu contexto será persistido. Os plug-ins são seu outro ponto forte, com filtros, ações, canais, ferramentas e habilidades, bem como suporte ao servidor de ferramentas MCP e OpenAPI para que você possa estendê-lo se desejar.

Minha escolha não é o que eu esperava

AnythingLLM faz um bom trabalho, mas acho que é um pouco simplificado por se chamar de espaço de trabalho. A WebUI aberta é sólida e cobre tudo que você precisa, mas é um pouco chata, e não há nada de errado em ser chata, só não é o que me atrai neste caso. Odyssey surgiu do nada para mim, e adoro a mistura de ferramentas que ele oferece, a interface e o quanto disso é orientado aos personagens. Se todos os três exigissem uma assinatura, eu consideraria pagar pelo Odyssey.

Link da fonte