[go: up one dir, main page]

Dietro le quinte: ecco come ElevenLabs è diventata un'azienda audio IA leader da tre miliardi di dollari grazie a Stripe

ElevenLabs è un'azienda leader globale nella ricerca e nella tecnologia audio basata sull’IA e sviluppa strumenti audio basati su IA all'avanguardia per imprese, sviluppatori e creator. La piattaforma serve milioni di utenti e migliaia di attività, inclusi i dipendenti di oltre il 72% delle aziende Fortune 500, che possono creare in modo veloce e conveniente voice-over di alta qualità e su vasta scala e lanciare agenti vocali interattivi basati su IA in oltre 30 lingue.

Prodotti utilizzati

    Billing
    Connect
    Payments
    Checkout
In tutto il mondo
Start-up

Cresciuti in Polonia nei primi anni Duemila, Mati Staniszewski e Piotr Dabkowski non riuscivano a sopportare i film mal doppiati che guardavano. Il budget per il doppiaggio dei film stranieri in polacco era scarso, pertanto la maggior parte dei film prevedeva un solo doppiatore che recitava le battute di tutti i personaggi con poca profondità, scarse sfumature e quasi nessuna emozione.

Queste esperienze d'infanzia sono rimaste impresse nei due amici, anche mentre facevano carriera nel settore tecnologico, e alla fine hanno dato vita a un'idea: risolvere il problema del doppiaggio, insieme a tanti altri, creando voci tramite sintesi vocale che fossero realistiche, commoventi e basate sul contesto.

Questa idea ha portato nel 2022 al lancio di ElevenLabs, che ha sfruttato i progressi in ambito IA e deep learning per diventare la prima azienda a creare voci artificiali capaci di generare un parlato simile a quello umano e persino le risate. Questa svolta ha dato alla start-up un reale vantaggio competitivo nelle tecnologie audio basate sull'IA. Oggi ElevenLabs offre una suite di prodotti in continua espansione che include un motore text-to-speech per contenuti audio e video, strumenti di progettazione vocale per lo sviluppo dei personaggi, uno studio di traduzione e di doppiaggio e un kit di strumenti per i chatbot IA conversazionali in grado di interagire con i clienti.

Monetizzare questi prodotti durante la crescita dell'azienda richiedeva un partner per i pagamenti altrettanto avanzato. ElevenLabs, con sede a Londra e a New York, si è affidata a Stripe nel 2023 per lanciare gli abbonamenti a tariffa fissa per i propri strumenti audio basati su IA. Da allora ElevenLabs si è basata sull’ampiezza dell'offerta Stripe per espandersi nei servizi di livello enterprise e supportare il proprio modello di business a rapida evoluzione. Ad esempio, l'azienda ha scelto Stirpe per realizzare iniziative strategiche come il suo marketplace, in cui i doppiatori possono concedere in licenza la propria voce per l'uso commerciale.

"Abbiamo iniziato circa due anni e mezzo fa e ora siamo un unicorno", ha dichiarato Luke Harries, Responsabile della crescita presso ElevenLabs. "Abbiamo centinaia di migliaia di abbonati e imprese self-service, come Perplexity, Time magazine e Bertelsmann, che usano la nostra piattaforma. Tutti questi pagamenti sono stati gestiti dal nostro primo tecnico che si è occupato di configurare Stripe".

Supporto di abbonamenti, bonifici e flussi di lavoro agentici con un solo tecnico addetto agli addebiti

ElevenLabs ha iniziato con 11 voci artificiali simili a quelle umane. A differenza delle precedenti voci robotiche generate dall'IA, la tecnologia di ElevenLabs riproduce le sfumature legate a età, accento, genere, intonazione e altri fattori che rendono unica ogni voce umana. Questo realismo, combinato alla capacità della piattaforma di calibrare le emozioni a partire da indizi testuali, ha reso il motore di sintesi vocale di ElevenLabs molto apprezzato tra i creator che desiderano dare voce a script video, podcast, notiziari, audiolibri e quasi ogni tipo di contenuti audio o video.

ElevenLabs ha scelto Stripe Billing per iniziare senza difficoltà, iterare rapidamente e adattare in modo fluido il proprio servizio in abbonamento agli strumenti di riconoscimento vocale per creatori di contenuti. La facilità di utilizzo dell'API e dell'SDK di Stripe ha dato al team la fiducia di poter sviluppare rapidamente diversi livelli tariffari dedicando praticamente zero tempo di ingegneria a questo compito. La flessibilità di Billing, inoltre, ha permesso all'azienda di ampliare la propria offerta di abbonamenti per accogliere clienti più grandi, lanciando prodotti di livello enterprise come uno studio di produzione audio completo e servizi di doppiaggio.

Grazie alla portata globale di Stripe, ElevenLabs ha potuto accettare istantaneamente abbonati di ogni parte del mondo, utilizzando la suite di ottimizzazione dei pagamenti di Stripe per progettare una pagina di iscrizione agli abbonamenti semplice ed efficace per il pubblico globale. Ad esempio, l'azienda ha implementato il modulo preintegrato di Checkout nella pagina, semplificando l'offerta di wallet e di altri metodi di pagamento locali come Apple Pay, Google Pay e Revolut Pay senza necessità di codice aggiuntivo. ElevenLabs si è inoltre affidata alla soluzione per pagamenti accelerati di Stripe, Link, per permettere ai clienti di compilare automaticamente i dati di pagamento salvati ovunque nel circuito Link. Gli utenti della suite di ottimizzazione dei pagamenti hanno beneficiato dell'aumento dei tassi di conversione e l'esperienza di pagamento rapida e semplice offerta da Link rappresenta ora il 20% di tutti i pagamenti di ElevenLabs.

In qualità di azienda specializzata in intelligenza artificiale, ElevenLabs ha riconosciuto il potenziale dell'IA di Stripe nel migliorare significativamente l'esperienza degli abbonati. Invece di affidarsi a regole rigide, i modelli di IA integrati nella suite di ottimizzazione dei pagamenti determinano in modo dinamico quali metodi di pagamento proporre e in quale ordine per ogni checkout, aiutando ElevenLabs a offrire un'esperienza utente più personalizzata.

I prodotti di Stripe hanno inoltre permesso a ElevenLabs di gestire in modo efficiente una serie di attività di addebito e pagamento, ad esempio la gestione dei bonifici e la semplificazione della procedura di attivazione. Di fatto, ElevenLabs ha completato le integrazioni Stripe e sta gestendo i vari flussi di lavoro di addebito e pagamento con un solo tecnico a disposizione. "Se dovessimo sviluppare l'intera infrastruttura di abbonamento internamente per gestire tutte le aree geografiche cui ci rivolgiamo, avremmo bisogno di un intero team di tecnici dedicato solo ai pagamenti", ha dichiarato Harries.

Quando ElevenLabs ha sviluppato una sofisticata tecnologia di clonazione vocale, l'azienda ha colto l'opportunità di supportare la community di doppiatori professionisti e di aggiungere un nuovo livello al proprio modello di business. Grazie a Stripe Connect, ElevenLabs ha creato un marketplace in cui gli attori possono clonare le proprie voci per progetti commerciali, stabilire i termini e ricevere bonifici ogni volta che un utente di ElevenLabs seleziona la sua voce per un progetto. Connect ha messo a disposizione funzionalità pronte all'uso per gestire l'attivazione degli attori e persino supportare i bonifici internazionali e gestire le complessità normative come i requisiti di adeguata verifica della clientela. Ad esempio, la conformità alle regole KYC può rappresentare un ostacolo significativo per le piattaforme nell'intera procedura di attivazione. Le funzioni di Stripe hanno fatto risparmiare all'azienda tempo e risorse di sviluppo che ElevenLabs ha potuto dedicare ai suoi progetti principali di IA audio.

ElevenLabs ha visto che molte aziende utilizzavano i suoi modelli di sintesi vocale e riconoscimento vocale per creare agenti IA. Le aziende spesso impiegavano mesi per avviare la produzione ricostruendo ogni volta lo stesso stack di base. Perciò ElevenLabs ha lanciato la propria piattaforma per creare una voce conversazionale IA con l'obiettivo di accelerare l'ingresso in produzione e permettere ai clienti di concentrarsi sulla logica dell'agente, anziché sull'infrastruttura. Grazie al kit di strumenti per agenti di Stripe, la piattaforma per agenti di ElevenLabs ha permesso agli agenti di completare flussi di lavoro legati all'assistenza clienti o alle vendite. Ad esempio, un agente IA di un'attività può accedere al proprio account Stripe per emettere un rimborso o completare una transazione inviando un link di pagamento. "Il cambiamento più significativo negli agenti conversazionali basati su IA sarà il passaggio dalla semplice risposta a domande all'autonomia nell'eseguire azioni concrete", ha dichiarato Harries.

Un partner grazie al quale ElevenLabs può sbaragliare la concorrenza

A partire da quelle prime 11 voci, ElevenLabs ne ha create oltre 5.000 che sono disponibili sulla sua piattaforma, grazie anche al suo avanzato marketplace. La piattaforma ha corrisposto oltre 4 milioni di dollari ai doppiatori, i più richiesti dei quali realizzano oltre 10.000 $ al mese.

Gli utenti hanno già creato oltre 550.000 agenti IA sulla piattaforma, un numero destinato a crescere considerando il numero di casi d'uso permessi dai flussi di lavoro con bot conversazionali e agentici. ElevenLabs continua ad aggiungere altre lingue alle funzionalità di sintesi vocale e doppiaggio e ora supporta 33 lingue, fra cui inglese, francese e spagnolo fino a lingue più recenti come il croato e il tamil.

Harries paragona la competizione nel mercato audio IA alla Formula 1, dove ogni azienda cerca la prossima iterazione tecnologica o un nuovo prodotto rivoluzionario che possa portarla in testa. Come risultato, non si aspetta che il ritmo dell'innovazione rallenti a breve per ElevenLabs. Inoltre, considera Stripe un partner strategico per continuare sulla strada a innovare.

"Sono entusiasta all'idea di aumentare il volume dei pagamenti elaborati tramite Stripe, [effettuare] molti altri milioni di pagamenti ai doppiatori presenti sulla nostra piattaforma ed espanderci in molti altri Paesi con ulteriori opzioni di pagamento", ha detto Harries.

Supporting subscriptions, payouts, and agentic workflows with one billing engineer

ElevenLabs started with 11 human-like AI voices. Unlike previous robotic AI voices, ElevenLabs technology replicates the nuances of age, accent, gender, intonation, and other factors that make each human voice unique. That realism, combined with the platform’s ability to gauge emotion from textual clues, made ElevenLabs’ Text to Speech engine a hit among creators looking to voice video scripts, podcasts, news reports, audiobooks, and almost any other type of audio or video content.

ElevenLabs chose Stripe Billing to get started easily, iterate rapidly, and seamlessly scale its subscription service for voice-to-text tools for content creators and publishers. The ease of working with the Stripe API and SDK made the team confident they could quickly build multiple pricing tiers with virtually no engineering time dedicated to the task. Billing’s flexibility also meant the company could scale its subscription offerings to accommodate larger customers as it rolled out enterprise-scale products such as a full-fledged audio production studio and dubbing services.

With Stripe’s global reach, ElevenLabs was able to instantly accept subscribers from all over the world, and the company used Stripe’s Optimized Checkout Suite to design a simple, effective subscription sign-up page for the global audience. For example, the company embedded the prebuilt Checkout form on its page, which made it easy to offer digital wallets and local payment methods such as Apple Pay, Google Pay, and Revolut Pay with no additional coding required. ElevenLabs also added Stripe’s accelerated checkout solution, Link, to enable customers to autofill their saved payment information anywhere across the Link network. Optimized Checkout Suite users benefit from an uplift in conversion rates, and Link’s easy, faster checkout experience now accounts for 20% of ElevenLabs’ payments. By running Stripe on AWS, ElevenLabs is supported by built-in AI tools to localize, personalize, and optimize the buying experience for its customers.

As an AI company, ElevenLabs saw the potential for Stripe’s AI to make a significant impact on the subscriber journey. Instead of relying on rigid rules, the AI models built into the Optimized Checkout Suite dynamically determine which payment methods to display in what order for every checkout, helping ElevenLabs provide a more personalized user experience.

Stripe products also enabled ElevenLabs to efficiently manage a range of billing and payment tasks, such as managing payouts and simplifying the onboarding process. In fact, ElevenLabs accomplished its Stripe integrations and is managing its various billing and payment workflows with just one engineer.

When ElevenLabs developed sophisticated voice cloning technology, the company saw an opportunity to support the professional voice actor community and add another new layer to its business model. Using Stripe Connect, ElevenLabs created a marketplace where actors can clone their voices for commercial projects, set terms, and receive payouts any time an ElevenLabs user selects their voice for a project. Connect offered ready-to-use capabilities to handle voice actor onboarding, including supporting international payouts and managing regulatory hurdles such as Know Your Customer (KYC) requirements. For instance, compliance with KYC rules can pose a considerable hurdle for platforms throughout the onboarding process. Stripe’s features again saved development time and resources that ElevenLabs could dedicate to its core audio AI projects.

ElevenLabs saw many companies using their Text to Speech and Speech to Text models to build AI agents. The companies often took months to get in production and were rebuilding the same underlying stack. So ElevenLabs launched their own platform to create a Conversational AI voice for customers to get to production quicker and focus on building the agent business logic rather than infrastructure. With the Stripe agent toolkit, ElevenLabs’ agent platform could enable agents to complete customer service or sales workflows. For example, a business’s AI agent could reach into its Stripe account to issue a refund or complete a transaction by sending out a checkout link. “The biggest shift in conversational AI agents is going to be from just pure question answering, to now using their own autonomy to execute certain actions,” said Harries.

A partner to keep ElevenLabs ahead of the competition

Building on those first 11 voices, ElevenLabs now has more than 5,000 voices available on its platform—driven in part by its advanced marketplace. The platform has paid out more than $4 million to voice actors, with some top earners making more than $10,000 a month.

Already, users have made more than 550,000 AI agents on the platform, which is just the start, considering the number of use cases enabled by truly conversational bots and agentic workflows. ElevenLabs also continues to add more languages to its Text to Speech and dubbing capabilities, which now supports 33 languages ranging from English, French, and Spanish to newer additions such as Croatian and Tamil.

Harries likens the competition in the AI audio space to Formula 1, where every company is looking for the next technology iteration or breakthrough product to power it to the front of the field. As a result, he doesn’t expect the pace of innovation to slow anytime soon for ElevenLabs. And he sees Stripe as a key partner for continuing that innovation.

Massima trasparenza dei costi

Tariffazione integrata per transazione, senza costi occulti

Avvia la tua integrazione

Inizia a usare Stripe in appena 10 minuti