Como jornalista e empresário, passo muito tempo em reuniões. Algumas dessas reuniões são entrevistas, enquanto outras são discussões ou ligações de clientes. Além disso, costumo fazer muitos memorandos de voz, registrando meus pensamentos e pesquisas pessoais sobre coisas nas quais posso trabalhar ao longo do dia.
O problema é que ouvir gravações é uma forma extremamente ineficiente de ser produtivo. Pior ainda, muitas vezes esqueço qual postagem contém as informações que procuro. Se você já viu um arquivo de gravação de um smartphone, saberá que ele tem um nome de arquivo enigmático que não diz muito.
Por um tempo, assinei serviços como Otter.ai, o OG de transcrição de voz. Poderia transformar minhas conversas em transcrições pesquisáveis e me ajudar a organizar minhas anotações de reuniões, mas eu não era um grande fã. Primeiro, preciso enviar informações privilegiadas para um serviço de terceiros, mas estou tentando evitar sobrecarga de assinaturas, principalmente nesta economia.
Isso me levou a Speakra. Esta é uma plataforma de transcrição de código aberto que pode ser executada em seu próprio servidor, em vez de enviar suas gravações para a nuvem de outra pessoa. O Speakr pode ser operado a partir do seu LLM local. Por outro lado, se você deseja um LLM em nuvem, também pode conectá-lo à API OpenAI e a muitos outros dispositivos. Ele pega minhas reuniões, entrevistas e anotações de voz e as transforma em uma transcrição pesquisável sem me inscrever ou armazenar meus dados. Depois de usá-lo por algumas semanas, posso dizer com segurança que ele se tornou um dos meus serviços favoritos e mais úteis em minha pilha auto-hospedada.
Este plugin Obsidian gratuito transforma minha voz em notas e tudo funciona no meu computador
Usando o plugin Whisper com LLM nativo, uso Obsidian para transcrever minhas notas de voz e arquivos de áudio como texto em meu computador.
O Speakr me dá quase tudo que eu quero do Otter.ai sem uma assinatura
Privacidade, propriedade e custo foram os motivos pelos quais mudei
Como ferramenta, o Speakr resolve um problema muito simples. Você pode gravar diretamente no navegador ou fazer upload de gravações de áudio e a ferramenta converterá conversas faladas em texto pesquisável. Como a plataforma foi projetada em torno da privacidade e da propriedade local, já é um grande avanço em comparação com Otter.ai. Assim como os serviços comerciais, ele pode até separar vários palestrantes em uma única gravação, o que o torna uma ótima ferramenta para transcrever entrevistas.
A privacidade e a propriedade dos dados são provavelmente os maiores motivos para a criação de tal serviço. Regularmente conduzo entrevistas e sessões de brainstorming e, claro, organizo muitas reuniões onde NDA ou informações embargadas são compartilhadas comigo. Não posso ter essas informações em uma nuvem de terceiros. Isso não é apenas uma quebra de contrato, mas qualquer vazamento potencial pode ter consequências graves para mim.
Com o Speakr, todas essas gravações ficam completamente no meu computador, sob meu controle, ao mesmo tempo que me dá a conveniência da transcrição moderna com tecnologia de IA. A outra vantagem, como mencionei acima, é o custo. Embora Otter.ai seja excelente, a maioria de seus recursos mais úteis são baseados em assinatura. Não sou mesquinho, mas simplesmente não quero pagar por outra assinatura. O Speakr me oferece muitos dos mesmos recursos gratuitamente, embora não todos. Não preciso me preocupar com limites de uso diário ou mensal e a qualidade da transcrição é praticamente tão boa quanto a do Otter.
Como posso usar o Speakr para transcrever reuniões e memorandos de voz?
Os resumos de IA me ajudam a revisar as conversas com mais rapidez
Como qualquer outro aplicativo Docker, começar a usar o Speakr é muito fácil. Você só precisa extrair o arquivo de compilação do Docker e definir algumas variáveis de ambiente com base em sua configuração pessoal. Se estiver usando um módulo local, você desejará adicionar a API à sua instância do Whisper e, se estiver conectado ao Cloud LLM, poderá adicionar sua chave de API ao arquivo de ambiente. Tudo leva alguns minutos com no máximo.
Como tenho tendência a gravar muitas das minhas notas de áudio no meu smartphone, normalmente carrego uma gravação existente através do navegador. Eu também poderia digitar diretamente no navegador enquanto estou na minha mesa. Não importa como os arquivos são inseridos no aplicativo, ele os processa e gera uma transcrição que você pode pesquisar, revisar e consultar facilmente mais tarde. Além da transcrição, oferece alguns recursos que o tornam mais útil do que um conversor de voz tradicional.
Um dos meus recursos favoritos é a identificação do alto-falante. Durante entrevistas ou reuniões com várias pessoas, o Speakr pode separar os participantes e atribuir-lhes seções da conversa. Isso torna mais fácil pular para o que uma pessoa específica disse, em vez de percorrer toda a transcrição. Além disso, a funcionalidade de pesquisa é extremamente útil. Posso pesquisar palavras-chave, nomes de produtos ou até mesmo um tópico específico e pular não apenas para a seção relevante, mas também para a transcrição correspondente. Se você tiver uma lista com uma dúzia ou mais de entradas, isso pode ser muito útil.
O outro recurso que uso muito é o resumo automático. Além de criar uma transcrição, o Speakr também fornecerá um rápido resumo dos principais pontos discutidos, mensagens principais e até mesmo as próximas etapas com base no que foi entendido em sua gravação de voz. Bem, esta parte nem sempre é precisa, mas faz um trabalho relativamente decente ao obter as informações relevantes. Ele não substituirá suas anotações pessoais, mas ajuda muito a obter uma visão geral do assunto da conversa.
Isso é apenas arranhar a superfície. Ele também possui recursos como Perfis de Voz, que podem identificar palestrantes usando incorporação de voz, permitindo que membros recorrentes sejam identificados automaticamente em gravações futuras. Ainda não usei, mas vejo que será útil.
Uma maneira melhor de gerenciar transcrições de reuniões
No que diz respeito a uma ferramenta gratuita, o Speakr é muito bom. Entre a propriedade dos dados e precisão da transcrição, este aplicativo gratuito de código aberto resolve meu problema de como transformar conversas faladas em pesquisáveis e úteis sem quebrar banco. Embora a natureza gratuita do aplicativo seja certamente atraente, eu valorizo mais a propriedade dos dados de gravação e transcrição. Se você já usa um servidor doméstico ou mesmo um NAS, o Speakr é um daqueles projetos que é uma recomendação fácil se você trabalha regularmente com transcrições de reuniões e gravações de áudio.








