[go: up one dir, main page]

Libreng AI Pagsasalita sa Teksto

I-transcribe ang audio & video sa teksto sa 100+ wika. 10+ AI modelo. Speaker detection. Walang pag-signup na kinakailangan.

10K
Mga transkripsiyon
252K
minuto transcribed
100+
Mga wika
70+
libreng mga tool

Gumagana sa publikong magagamit na audio at video. DRM-protected na nilalaman ay hindi suportado.

Upgrade para sa Pinabuting
Pribadong transcript
Chat sa transcript
I-unlock sa Pro →
Drop file dito o mag-click upang mag-browse
Ang mga format ng video na suportado ay MP4, MOV, MKV, AVI, FLV, at iba pa.
Upgrade para sa Pinabuting
Pribadong transcript
Chat sa transcript
I-unlock sa Pro →
Upgrade para sa Pinabuting
Pag-record: 0:00
Real-time Ang Ōmi (おみ, lit.
Pinahusay Wika (tumpak)
Mga link ng publiko: 24h, teksto lamang · Mag-sign up para sa 7d + audio · Pro para sa mga pribadong link

Real-time na pagsasalita sa teksto. Nag-a-auto-correct ang AI habang nagsasalita ka — pinabuting katumpakan sa mas mahabang pagsasalita.

Subukan ang iyong microphone muna
❤️ Ibig STT.ai? Sabihin sa iyong mga kaibigan!
Ginamit mo na ang iyong libreng transcriptions

Mag-sign up para sa libreng upang makakuha ng 600 minuto, o mag-upgrade mula sa $5/buwan para sa libu-libong higit pa.

10 libreng minuto/araw 600 minuto libreng may pag-signup Walang credit card Naka-encrypt
Mag-sign up para sa libreng →
Client-side naka-encrypt na imbakan — Ang iyong mga transcript ay naka-encrypt sa iyong browser. Hindi namin mababasa ang mga ito. Alamin kung paano ito gumagana →

Pinagkakatiwalaan ng mga propesyonal sa buong mundo

Paano gumagana ang STT.ai

Tatlong hakbang sa tumpak na transcription

1. I-upload, Record, o I-paste ang URL

I-drag at i-drop ang anumang audio o video file (MP3, WAV, MP4, at 20 + format). Record mula sa iyong mic sa real-time. O i-paste ang isang link mula sa YouTube, Vimeo, TikTok, at 1,300 + platform.

2. AI transcribes sa iyong pagpili ng modelo

Pumili mula sa 10+ AI modelo kabilang ang Whisper, NVIDIA Canary (#1 katumpakan), at Moonshine. Auto-detect wika mula sa 100+ mga pagpipilian. Speaker diarization tumutukoy na sinabi kung ano.

3. Export, Ibahagi, o Isama

I-download bilang TXT, SRT, VTT, DOCX, JSON, o PDF. Ibahagi sa pamamagitan ng link. Gamitin ang aming API upang isama ang transcription sa iyong app. Perpekto para sa mga subtitle, mga tala ng pulong, podcast, at higit pa.

100+
Wika Suportado
70+
Libreng mga tool
1,300+
Platforms Suportado
7
Export Formats

Developer-una API

Isama ang pagsasalita-sa-text sa iyong app sa loob ng ilang minuto. RESTful API na may real-time WebSocket streaming.

Ang.web ay isang Internet top-level domain (TLD). — File-upload at real-time streaming
Maraming mga modelo — Wisper, Canary, Pinabuting & higit pa
Speaker diarization — Auto-detect na sinabi kung ano
Ang kakayahang umangkop output — JSON, TXT, SRT, VTT na may mga salita timestamps
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Nagbabago mula sa ibang serbisyo ng pagsasalita patungo sa serbisyo ng teksto?

Handa na bang mag-transcribe?

I-upload ang iyong unang file nang libre. Walang credit card, walang pag-signup. 600 minuto upang simulan ang libreng plano.

Magsisimulang mag-translate

Mga Madalas Itanong

Ang pagsasalita sa teksto ay tumatakbo sa iyong browser: i-paste ang isang URL, mag-upload ng isang file, o mag-record mula sa iyong mic. STT.ai ay pumipili ng modelo ng AI at nagbabalik ng transcript sa ilalim ng5minuto. I-export bilang TXT, SRT, VTT, DOCX, JSON, o PDF.

Oo — ang bawat bisita ay makakakuha ng 600 libreng minuto upang magsimula sa STT.ai, magagamit para sa pagsasalita sa teksto ang parehong tulad ng anumang iba pang workflow. Paid plano simula sa $5/buwan i-unlock mas mahabang mga file, pribadong transcripts, at prayoridad queueing.

Ang pagsasalita sa teksto ay tumatakbo sa parehong AI na modelo tulad ng natitirang STT.ai - ang aming pinakamahusay na mga modelo ay umabot sa 95-97% na katumpakan sa malinis na pagsasalita (3-5% Error Rate sa Word sa mga benchmark). Maglipat ng mga modelo sa paglipad kung ang unang pass ay mas mababa sa iyong target.

pagsasalita sa teksto can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Ang bawat transcript ay nai-export bilang SRT o VTT – gumagana sa YouTube, Vimeo, TikTok, VLC, at bawat pangunahing video player. Ang tool na burn-subtitles ay nag-ooverlay sa mga ito sa video bilang hardsubs.

Oo. Speaker diarization awtomatikong labels bawat boses (Speaker 1, Speaker2,...) at maaari mong palitan ang pangalan ng mga ito sa built-in editor. Gumagana sa lahat ng mga modelo at wika.

Most pagsasalita sa teksto jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

pagsasalita sa teksto accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Oo. Ang mga audio file na ipinadala sa pagsasalita sa teksto ay pinoproseso at tinanggal sa default. Ang mga plano ng Pro ay nagdaragdag ng client-side encryption — kahit na ang database ng STT.ai ay nasira, ang iyong mga transcript ay hindi mababasa nang walang iyong key. Ang data ay hindi kailanman ginagamit para sa modelo ng pagsasanay nang walang malinaw na pagpipilian sa pag-opt-in.

Oo. STT.ai nag-aalok ng isang REST API na may Python at Node.js SDKs, pati na rin ang isang MCP server para sa Claude at Cursor — lahat ng magagamit para sa pagsasalita sa teksto workflows. Libreng API tier kasama ang 100 minuto / buwan.

Oo. Ang bawat transcript ay bukas sa built-in editor kung saan maaari mong ayusin ang mga salita, baguhin ang pangalan ng mga speaker, ayusin ang mga timestamp, at magdagdag ng mga tala. Ang lahat ng mga pagbabago ay awtomatikong i-save.

Ang bawat transcript ay nakuha ng isang natatanging ibahagi URL. Export sa DOCX o PDF para sa email. Pro plano magdagdag ng password-protected at permanenteng mga link - kapaki-pakinabang para sa trabaho ng kliyente.

Ang STT.ai ay may kakayahang mag-translate ng 1,300+ na platform kabilang ang YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast host, at marami pa. Ang URL transcription ay gumagana sa mga nilalaman na magagamit sa publiko lamang — hindi maaaring isalin ang mga pinagkukunan na protektado ng DRM.