[go: up one dir, main page]

Nos bastidores: como a ElevenLabs tornou-se uma líder de US$ 3 bi em áudio de IA com a Stripe

A ElevenLabs é líder global em pesquisa e tecnologias para áudio com IA, criando ferramentas de ponta para áudio com IA para empresas, desenvolvedores e criadores. A plataforma permite que milhões de usuários e milhares de empresas, inclusive funcionários de mais de 72% das empresas Fortune 500, criem dublagens e narrações ou lancem agentes de atendimento com voz rapidamente, de forma acessível, em mais de 30 idiomas.

Produtos usados

    Billing
    Connect
    Payments
    Checkout
Global
Startup

Durante a infância na Polônia no início dos anos 2000, Mati Staniszewski e Piotr Dabkowski não suportavam os filmes mal dublados que eram obrigados a assistir. O orçamento de dublagem de filmes estrangeiros era limitado: a maioria dos filmes tinha apenas um narrador que recitava as falas de todos os personagens, com pouca profundidade, nuance ou emoção.

Essas experiências de infância acompanharam os amigos em sua carreira no setor de tecnologia e, um dia, deram origem a uma ideia: e se eles pudessem resolver o terrível problema de dublagem – e muitos outros – criando vozes sintetizadas realistas, emotivas e com consciência de contexto?

Com essa ideia, eles lançaram em 2022 a ElevenLabs, usando os avanços da IA e deep learning para criar a primeira empresa a gerar vozes artificiais capazes de criar fala humana (e até risos). Com essa inovação, a startup foi pioneira na tecnologia de áudio por IA. Hoje, a ElevenLabs oferece cada vez mais produtos, inclusive um sistema de conversão de texto em fala para conteúdos de áudio e vídeo, ferramentas de design de voz para desenvolvimento de personagens, um estúdio de tradução e dublagem e um kit para chatbots de IA que podem interagir com os clientes.

Para monetizar esses produtos à medida que a empresa se expandia, era necessário encontrar um parceiro de pagamentos avançado. Sediada em Londres e Nova York, a ElevenLabs recorreu à Stripe em 2023 para lançar assinaturas de valor fixo para suas ferramentas de IA de áudio. Desde então, a ElevenLabs já usou diversos produtos da Stripe para lançar serviços de nível empresarial e apoiar seu modelo de negócios em rápida evolução. Por exemplo, a Stripe foi parceira em iniciativas importantes, como um marketplace onde dubladores podem licenciar suas vozes para uso comercial.

“Começamos há cerca de dois anos e meio e já somos um unicórnio. Temos centenas de milhares de assinantes em autoatendimento e empresas como Perplexity, Time magazine e Bertelsmann usam a plataforma. Todos esses pagamentos foram gerenciados pelo nosso primeiro engenheiro que configurou a Stripe," comemora Luke Harries, diretor de crescimento da ElevenLabs.

Assinaturas, repasses e fluxos de trabalho para agentes com um engenheiro de cobrança

A ElevenLabs começou com 11 vozes de IA humanizadas. Ao contrário das primeiras vozes de IA, que eram robóticas, a tecnologia replica nuances de idade, sotaque, sexo, entonação e outros fatores que tornam cada voz humana única. Com esse realismo e a capacidade de avaliar emoções a partir de pistas textuais, o mecanismo de conversão de texto em fala da ElevenLabs fez sucesso entre criadores que queriam dublar scripts de vídeo, podcasts, reportagens, audiolivros e qualquer tipo de conteúdo de áudio ou vídeo.

A ElevenLabs escolheu o Stripe Billing para começar, criar alternativas rapidamente e otimizar a expansão das assinaturas de ferramentas de conversão de voz em texto para criadores e editores de conteúdo. A simplicidade da API e do SDK da Stripe fez a equipe perceber que poderia criar rapidamente vários níveis de preços, praticamente sem gastar mais tempo de desenvolvimento. A flexibilidade do Billing também permitiu otimizar as assinaturas para clientes maiores, com lançamentos de produtos em escala empresarial, como um estúdio completo de produção de áudio e serviços de dublagem.

Com o alcance global da Stripe, a ElevenLabs consegue aceitar assinantes instantaneamente de todo o mundo, usando o Pacote de Otimização de Checkout da Stripe para criar uma página de inscrição simples e eficaz para o público global. Por exemplo, a empresa incorporou o formulário do Checkout à página, com carteiras digitais e formas de pagamento regionais como Apple Pay, Google Pay e Revolut Pay, sem trabalho de desenvolvimento. Também adicionou a solução de checkout acelerado da Stripe, o Link, que preenche automaticamente os dados de pagamentos salvos do cliente em qualquer lugar da rede Link. Os usuários do Pacote de Otimização de Checkout constatam aumento de conversão, e a experiência de checkout fácil e rápida do Link já responde por 20% dos pagamentos da ElevenLabs.

Como empresa de IA, a ElevenLabs viu o potencial da IA da Stripe para a jornada do assinante. Em vez aplicar regras rígidas, os modelos de IA integrados ao Pacote de Otimização de Checkout determinam dinamicamente as formas de pagamento a serem exibidas e sua ordem, em cada finalização de compra, personalizando a experiência oferecida pela ElevenLabs.

Os produtos da Stripe também permitiram à empresa lidar com uma série de tarefas de faturamento e pagamento, como gerenciar repasses e simplificar o processo de onboarding. Na verdade, a ElevenLabs fez todas as integrações da Stripe e gerencia seus diversos fluxos de faturamento e pagamento com apenas um engenheiro. "Se tivéssemos que criar toda a infraestrutura de assinatura internamente para todas as regiões geográficas, imagino que precisaríamos de uma equipe de engenharia completa dedicada exclusivamente a pagamentos", diz Harries.

Com sua tecnologia sofisticada de clonagem de voz, a ElevenLabs viu uma oportunidade de apoiar a comunidade profissional de dubladores e adicionar mais um serviço ao seu modelo de negócios. Com o Stripe Connect, a empresa criou um marketplace onde os dubladores podem clonar suas vozes para projetos comerciais, definir termos e receber pagamentos sempre que um usuário da ElevenLabs selecionar sua voz para um projeto. O Connect trouxe recursos prontos para uso para gerenciar a integração de dubladores, repasses internacionais e gestão de questões regulatórias, como os requisitos de Conheça Seu Cliente (KYC). Por exemplo, a conformidade com as regras de KYC pode ser um obstáculo considerável para plataformas em todo o processo de integração. Os recursos da Stripe novamente economizaram tempo e recursos que a ElevenLabs pôde dedicar aos seus principais projetos de IA de áudio.

A ElevenLabs observou que muitas empresas utilizavam seus modelos de conversão de texto em fala e conversão de fala em texto para desenvolver agentes de IA. Elas levavam meses para entrar em produção e repetiam o processo usando as mesmas estruturas. A ElevenLabs lançou a própria plataforma para criar uma voz de IA conversacional para que os clientes acelerem a produção e possam concentrar-se na lógica de negócios do agente, em vez da infraestrutura. Com o kit de ferramentas para agentes da Stripe, a plataforma de agentes da ElevenLabs permitiu que os agentes concluíssem os fluxos de trabalho de atendimento ao cliente ou de vendas. Por exemplo, o agente de IA de uma empresa pode acessar sua conta Stripe para emitir um reembolso ou concluir uma transação enviando um link de checkout. “A maior mudança nos agentes de IA conversacionais é que em vez de apenas responder perguntas, eles terão autonomia para executar certas ações”, explica Harries.

Um parceiro para manter a ElevenLabs à frente da concorrência

Tendo começado com 11 vozes, a ElevenLabs agora conta com mais de 5.000 vozes disponíveis na plataforma, em parte resultado do seu marketplace avançado. A plataforma já pagou mais de US$ 4 milhões a dubladores, e alguns dos mais bem pagos recebem mais de US$ 10.000 por mês.

Os usuários já criaram mais de 550.000 agentes de IA na plataforma e isso é só o começo, considerando o número de casos de uso possibilitados por bots verdadeiramente conversacionais e fluxos de trabalho com agentes. A ElevenLabs também continua adicionando mais idiomas aos seus recursos de conversão de texto em fala e dublagem, que agora funcionam em 33 idiomas, como inglês, francês e espanhol e que agora contam com novas opções, como croata e tâmil.

Harries compara a concorrência no setor de áudio com IA à Fórmula 1, onde todas as empresas buscam a próxima novidade tecnológica ou produto inovador para chegar à liderança. Por isso, ele não espera que o ritmo de inovação da ElevenLabs diminua tão cedo. Para ele, a Stripe será parceira fundamental na continuidade dessa inovação.

“Estou animado para continuar aumentando o volume de pagamentos com a Stripe, fazendo pagamentos de muitos milhões para dubladores em nossa plataforma e expandindo para muito mais países e opções de pagamento”, concluir Harries.

Supporting subscriptions, payouts, and agentic workflows with one billing engineer

ElevenLabs started with 11 human-like AI voices. Unlike previous robotic AI voices, ElevenLabs technology replicates the nuances of age, accent, gender, intonation, and other factors that make each human voice unique. That realism, combined with the platform’s ability to gauge emotion from textual clues, made ElevenLabs’ Text to Speech engine a hit among creators looking to voice video scripts, podcasts, news reports, audiobooks, and almost any other type of audio or video content.

ElevenLabs chose Stripe Billing to get started easily, iterate rapidly, and seamlessly scale its subscription service for voice-to-text tools for content creators and publishers. The ease of working with the Stripe API and SDK made the team confident they could quickly build multiple pricing tiers with virtually no engineering time dedicated to the task. Billing’s flexibility also meant the company could scale its subscription offerings to accommodate larger customers as it rolled out enterprise-scale products such as a full-fledged audio production studio and dubbing services.

With Stripe’s global reach, ElevenLabs was able to instantly accept subscribers from all over the world, and the company used Stripe’s Optimized Checkout Suite to design a simple, effective subscription sign-up page for the global audience. For example, the company embedded the prebuilt Checkout form on its page, which made it easy to offer digital wallets and local payment methods such as Apple Pay, Google Pay, and Revolut Pay with no additional coding required. ElevenLabs also added Stripe’s accelerated checkout solution, Link, to enable customers to autofill their saved payment information anywhere across the Link network. Optimized Checkout Suite users benefit from an uplift in conversion rates, and Link’s easy, faster checkout experience now accounts for 20% of ElevenLabs’ payments. By running Stripe on AWS, ElevenLabs is supported by built-in AI tools to localize, personalize, and optimize the buying experience for its customers.

As an AI company, ElevenLabs saw the potential for Stripe’s AI to make a significant impact on the subscriber journey. Instead of relying on rigid rules, the AI models built into the Optimized Checkout Suite dynamically determine which payment methods to display in what order for every checkout, helping ElevenLabs provide a more personalized user experience.

Stripe products also enabled ElevenLabs to efficiently manage a range of billing and payment tasks, such as managing payouts and simplifying the onboarding process. In fact, ElevenLabs accomplished its Stripe integrations and is managing its various billing and payment workflows with just one engineer.

When ElevenLabs developed sophisticated voice cloning technology, the company saw an opportunity to support the professional voice actor community and add another new layer to its business model. Using Stripe Connect, ElevenLabs created a marketplace where actors can clone their voices for commercial projects, set terms, and receive payouts any time an ElevenLabs user selects their voice for a project. Connect offered ready-to-use capabilities to handle voice actor onboarding, including supporting international payouts and managing regulatory hurdles such as Know Your Customer (KYC) requirements. For instance, compliance with KYC rules can pose a considerable hurdle for platforms throughout the onboarding process. Stripe’s features again saved development time and resources that ElevenLabs could dedicate to its core audio AI projects.

ElevenLabs saw many companies using their Text to Speech and Speech to Text models to build AI agents. The companies often took months to get in production and were rebuilding the same underlying stack. So ElevenLabs launched their own platform to create a Conversational AI voice for customers to get to production quicker and focus on building the agent business logic rather than infrastructure. With the Stripe agent toolkit, ElevenLabs’ agent platform could enable agents to complete customer service or sales workflows. For example, a business’s AI agent could reach into its Stripe account to issue a refund or complete a transaction by sending out a checkout link. “The biggest shift in conversational AI agents is going to be from just pure question answering, to now using their own autonomy to execute certain actions,” said Harries.

A partner to keep ElevenLabs ahead of the competition

Building on those first 11 voices, ElevenLabs now has more than 5,000 voices available on its platform—driven in part by its advanced marketplace. The platform has paid out more than $4 million to voice actors, with some top earners making more than $10,000 a month.

Already, users have made more than 550,000 AI agents on the platform, which is just the start, considering the number of use cases enabled by truly conversational bots and agentic workflows. ElevenLabs also continues to add more languages to its Text to Speech and dubbing capabilities, which now supports 33 languages ranging from English, French, and Spanish to newer additions such as Croatian and Tamil.

Harries likens the competition in the AI audio space to Formula 1, where every company is looking for the next technology iteration or breakthrough product to power it to the front of the field. As a result, he doesn’t expect the pace of innovation to slow anytime soon for ElevenLabs. And he sees Stripe as a key partner for continuing that innovation.

Transparência total

Modelo de preços por transação integrado, sem tarifas ocultas.

Integração rápida

Comece a usar a Stripe em apenas 10 minutos.