[go: up one dir, main page]

Freie KI Rede zum Text

Transcribe audio & video to text in 100+ Sprachen. 10+ KI-Modelle. Lautsprechererkennung. Keine Anmeldung erforderlich.

10K
Transkriptionen
252K
Minuten transkribiert
100+
Sprachen
70+
Kostenlose Werkzeuge

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

Upgrade für Verbesserte
Privater Abschrift
Chatten Sie mit Transkript
Entsperren mit Pro →
Drop-Datei hier oder klicken Sie zum Durchsuchen
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB
Upgrade für Verbesserte
Privater Abschrift
Chatten Sie mit Transkript
Entsperren mit Pro →
Upgrade für Verbesserte
Aufzeichnung: 0:00
In Echtzeit Vosk (instant)
Verstärkt Flüstern (genau)
Öffentliche Links: 24h, nur Text · Melden Sie sich an für 7d + Audio · Pro für private Links

Echtzeit-Sprache zu Text. AI-Auto-Korrekturen, wie Sie sprechen – Genauigkeit verbessert sich mit längeren Sprache.

Testen Sie zuerst Ihr Mikrofon
❤️ Liebe STT.ai? Erzählen Sie Ihren Freunden!
Du hast deine freien Transkriptionen benutzt.

Melden Sie sich kostenlos an, um 600 Minuten zu bekommen, oder ein Upgrade von $5/Monat für Tausende mehr.

10 kostenlos min/Tag 600 min frei mit Anmeldung Keine Kreditkarte Verschlüsselt
Melde dich kostenlos an →
Clientseitig verschlüsselter Speicher — Ihre Transkripte werden in Ihrem Browser verschlüsselt. Auch wir können sie nicht lesen. Erfahren Sie, wie es funktioniert →

Wie funktioniert STT.ai?

Drei Schritte zur genauen Transkription

1. URL hochladen, aufzeichnen oder einfügen

Ziehen Sie alle Audio- oder Videodateien (MP3, WAV, MP4 und 20+ Formate) aus Ihrem Mikrofon in Echtzeit auf. Oder fügen Sie einen Link von YouTube, Vimeo, TikTok und 1.300+ Plattformen ein.

2. KI transkribiert mit Ihrer Wahl des Modells

Wählen Sie aus 10 + KI-Modelle einschließlich Whisper, NVIDIA Canary (#1 Genauigkeit) und Moonshine. Auto-Detektion Sprache aus 100 + Optionen. Lautsprecherdiarisierung identifiziert, wer was gesagt hat.

3. Exportieren, Teilen oder Integrieren

Downloaden Sie als TXT, SRT, VTT, DOCX, JSON oder PDF. Über den Link teilen. Nutzen Sie unsere API, um Transkription in Ihre App zu integrieren. Perfekt für Untertitel, Besprechungsnotizen, Podcasts und mehr.

100+
Unterstützte Sprachen
70+
Kostenlose Werkzeuge
1,300+
Unterstützte Plattformen
7
Formate exportieren

Entwickler-Erste API

Integrieren Sie in wenigen Minuten Sprach-zu-Text in Ihre App. RESTful API mit Echtzeit-WebSocket-Streaming.

REST + WebSocket — Datei-Upload und Echtzeit-Streaming
Mehrere Modelle — Whisper, Canary, Enhanced & more
Wahl des Sprechers — Auto-Erkennen, wer was gesagt hat
Flexible Leistung — JSON, TXT, SRT, VTT mit Wortzeitstempeln
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Bereit zum Transkribieren?

Laden Sie Ihre erste Datei kostenlos. Keine Kreditkarte, keine Anmeldung. 600 Minuten, um auf den freien Plan zu starten.

Transkribieren starten

Häufig gestellte Fragen

Rede zu Text läuft in Ihrem Browser: Fügen Sie eine URL ein, laden Sie eine Datei hoch oder nehmen Sie das Mikrofon auf. STT.ai wählt das AI-Modell und gibt das Transkript in weniger als 5 Minuten zurück. Exportieren Sie als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja — jeder Besucher erhält 600 freie Minuten, um auf STT.ai zu beginnen, verwendbar für Rede zu Text das gleiche wie jeder andere Workflow. Bezahlte Pläne ab $ 5 / Monat entsperren längere Dateien, private Transkripte und Priorität Warteschlange.

Rede zu Text läuft auf den gleichen AI-Modellen wie der Rest von STT.ai - unsere besten Modelle erreichen 95-97% Genauigkeit bei sauberer Sprache (3-5% Word Error Rate auf Benchmarks). Schalten Sie Modelle flugs, wenn der erste Pass unter Ihrem Ziel liegt.

Rede zu Text kann auf jedem der STT.ai 10+ Modelle laufen — STT.ai Enhanced (am genauesten), Whisper Large V3 (99 Sprachen), NVIDIA Canary (#1 WER auf unterstützten langs), Whisper Turbo (schnell), Moonshine (leichtgewichtig) und mehr.

Ja. Jeder Transkript-Export als SRT oder VTT – funktioniert mit YouTube, Vimeo, TikTok, VLC und jedem großen Videoplayer. Das Werkzeug mit Burn-Subtitles überlagert sie als Hardsubs auf Video.

Ja. Die Lautsprecherdiarisierung markiert automatisch jede Stimme (Speaker 1, Speaker 2,...) und Sie können sie im integrierten Editor umbenennen. Funktioniert über alle Modelle und Sprachen.

Die meisten Rede zu Text Jobs beenden in weniger als 5 Minuten. Eine 1-Stunden-Audiodatei komplettiert in der Regel in 2-3 Minuten mit unseren schnellsten Modellen. Geschwindigkeit hängt von gewählten Modell und aktuelle GPU-Last.

Rede zu Text akzeptiert 20+ Formate — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI und mehr. Ausgabe auf TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Audiodateien, die auf Rede zu Text eingereicht werden, werden standardmäßig verarbeitet und gelöscht. Pro Pläne fügen Client-seitige Verschlüsselung hinzu – auch wenn STT.ais Datenbank verletzt wird, sind Ihre Transkripte ohne Ihren Schlüssel unlesbar. Daten werden nie für Modelltraining ohne explizites Opt-In verwendet.

Ja. STT.ai bietet eine REST API mit Python und Node.js SDKs sowie einen MCP Server für Claude und Cursor – alle für Rede zu Text Workflows nutzbar. Kostenlose API-Ebene enthält 100 Minuten/Monat.

Ja. Jedes Transkript öffnet sich im integrierten Editor, wo Sie Wörter korrigieren, Lautsprecher umbenennen, Zeitstempel anpassen und Notizen hinzufügen können. Alle Änderungen speichern automatisch.

Jedes Transkript erhält eine einzigartige freigebende URL. Exportieren Sie nach DOCX oder PDF für E-Mail. Pro Pläne fügen passwortgeschützte und dauerhafte Links hinzu – nützlich für die Client-Arbeit.

STT.ai verarbeitet 1.300+ Plattformen, darunter YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, Podcast-Hosts und mehr. URL-Transkription funktioniert nur mit öffentlich zugänglichen Inhalten — DRM-geschützte Quellen können nicht transkribiert werden.