Aumento do volume de son
Aumente o volume do son en liña. Aumente o volume dos seus ficheiros de son sen distorsión. Name
Solte aquí o ficheiro ou prema para examinar
- 20 dB (máis silencioso)0 dB+20 dB (Máis alto)
A procesar...
Gratuito. Non se require rexistro.
Todas as ferramentasPrecisa a transcrición completa, non só unha ferramenta?
Envíe son ou vídeo ou pegue unha ligazón: transcrición AI en máis de 100 linguas con detección de falantes. 10 minutos gratuítos ao día, sen rexistro.
Preguntas frecuentes
Aplicación executase no navegador: apega un URL, envía un ficheiro ou grava co micrófono. STT.ai escolle o modelo de IA e devolve a transcrición en menos de 5 minutos. Exporta como TXT, SRT, VTT, DOCX, JSON ou PDF.
Si, cada visitante recibe 600 minutos libres para comezar en STT.ai, utilizábeis para Aplicación igual que calquera outro fluxo de traballo. Os plans de pago que comezan en $5/ mes desbloquean ficheiros máis longos, transcricións privadas e filas prioritarias.
Aplicación funciona cos mesmos modelos de IA que o resto de STT.ai. Os nosos mellores modelos alcanzan o 95- 97% de precisión na fala clara (3- 5% de taxa de erros de palabra nos benchmarks). Troca de modelo ao instante se a primeira pasada está por baixo do obxectivo.
Aplicación pode executarse en calquera dos máis de 10 modelos de STT.ai: STT.ai Enhanced (máis preciso), Whisper Large V3 (99 linguas), NVIDIA Canary (# 1 WER nos lang soportados), Whisper Turbo (rápido), Moonshine (ligeiro) e máis.
Si. Todas as transcricións exportanse como SRT ou VTT, funciona con YouTube, Vimeo, TikTok, VLC e todos os principais reprodutores de vídeo. A ferramenta de gravación de subtítulos sobrepónos ao vídeo como subtítulos hardsub.
Si. A diarización dos oradores etiqueta automaticamente cada voz (Orador 1, Orador 2,...) e pode mudarlles o nome no editor incorporado. Funciona en todos os modelos e linguas.
A maioría dos Aplicación traballos rematan en menos de 5 minutos. Un ficheiro de son de 1 hora normalmente remata en 2- 3 minutos cos nosos modelos máis rápidos. A velocidade depende do modelo escollido e da carga actual da GPU.
Aplicación acepta máis de 20 formatos: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI e outros. A saída é TXT, SRT, VTT, DOCX, JSON ou PDF.
Si. Os ficheiros de son enviados a Aplicación son procesados e eliminados por omisión. Os plans Pro engadirán cifrado do lado do cliente - mesmo se a base de datos de STT.ai é violada, as súas transcricións son ilexibles sen a súa chave. Os datos nunca se empregan para adestramento de modelos sen unha opción explícita.
Si. STT.ai ofrece unha API REST con SDK de Python e Node. js, ademais dun servidor MCP para Claude e Cursor, todo útil para Aplicación fluxos de traballo. O nivel de API gratuíto inclúe 100 minutos/ mes.
Si. Cada transcrición ábrese no editor incorporado onde pode corrixir palabras, mudar o nome dos oradores, axustar marcas de tempo e engadir notas. Todos os cambios gárdanse automaticamente.
Cada transcrición obtén un URL único compartible. Exportar a DOCX ou PDF para correo electrónico. Os plans Pro engadirán ligazóns permanentes e protexidas por contrasinal, útiles para o traballo do cliente.
STT.ai xestiona máis de 1300 plataformas, incluíndo YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, hosts de podcasts e máis. A transcrición de URL só funciona con contidos dispoñibles publicamente; non se poden transcreber fontes protexidas por DRM.