将音频和视频发送到100+语言文本上。 10+ AI 模式, 语音探测, 不需要注册 。
10K
转录
252K
转录的分钟
100+
语言
70+
空闲工具
STT.ai 如何运作
三步,准确转录
1. 上传、记录或粘贴 URL
拖放任何音频或视频文件( MP3、 WAV、 MP4 和 20+ 格式) 。 实时记录您的麦克风。 或者粘贴来自YouTube、 Vimeo、 TikTok 和 1300+ 平台的链接 。
2. AI 与你选择模式的连接
从 10 + AI 模型中选择, 包括 Whiseper 、 NVIDIA 加那利( # 1 精度) 和 Moonshine 。 从 100 + 选项中自动检测语言 。 演讲人 diarization 确定谁说了什么 。
3. 出口、份额或一体化
下载为 TXT、 SRT、 VTT、 DOCX、 JSON、 或 PDF 。 通过链接共享 。 使用我们的 API 将抄录入您的应用程序 。 适合字幕、 会议笔记、 播客等等 。
100+
语文支助
70+
空闲工具
1,300+
支持平台
7
导出格式
开发者- 第一 API
将语音到文字整合到您的应用程序中, 以分钟为分钟。 实时 WebSocket 流动的更新 API 。
REST + Web 套件 — 文件上传和实时流
多种模式 — 耳语、加那利语、扩音和更多
议长对角 — 自动检测谁说了什么
弹性产出 — Jsson, TXT, SRT, VTT 配字数时间戳
import requests
response = requests.post(
"https://api.stt.ai/v1/transcribe",
headers={"Authorization": f"Bearer {API_KEY}"},
files={"file": open("meeting.mp3", "rb")},
data={
"model": "large-v3-turbo",
"language": "auto",
"diarize": "true",
"response_format": "json",
},
)
result = response.json()
for seg in result["segments"]:
print(f"{seg['speaker']}: {seg['text']}")
常见问题
语音对文本在您的浏览器中运行:粘贴 URL, 上传文件, 或者从您的 mic. STT.ai 中记录 。 选择 AI 模型并在5分钟内返回 抄本 。 导出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。
是的,每个访客都有600分钟的自由时间从STT.ai开始,可用于其他工作流程 语音对文本 。 支付计划从5美元/月开始,打开更长的文件、私人记录和排队优先。
语音对文本运行的AI模式与STT.ai的其余部分相同——我们的最佳模式在清洁演讲中达到95-97%的准确度(基准值为3-5%字错误率 ) 。 如果第一个通过低于目标, 则在飞行上切换模型。
语音对文本可以运行STT.ai的10+型的任何一种模式——STT.ai增强型(最精确)、低语大V3(99种语言)、荷兰语加那利语加那利语(#1 WER on subed sangs)、小舌头涡轮(快)、月光(轻量级)等等。
是的,作为SRT或VTT的每一份记录稿出口都是与YouTube、Vimeo、TikTok、VLC和每个主要视频播放器合作的,燃烧字幕工具作为硬子将它们作为视频覆盖。
是的,议长的二分法自动标出每个声音(1号发言人,2号发言人,...),你可以在内置编辑中重新命名。在所有模式和语言中工作。
大部分 语音对文本 工作在5 分钟内完成。 1小时的音频文件通常以2-3分钟以最快的模型完成。 速度取决于所选的模式和当前 GPU 装载量 。
语音对文本 接受20+格式 : MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVI等。 输出到 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。
Yes. Audio files submitted to 语音对文本 are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.
是 STT.ai 提供与 Python 和 Node.js SDKs 的REST API, 加上一个为Claude 和 Cursor 提供的 MCP 服务器, 全部用于 语音对文本 工作流程。 免费 API 级别包括 100 分钟/ 月。
是的。每份笔录都打开在内置编辑器中,您可以在此校正单词、重命名扬声器、调整时间戳和添加笔记。所有更改都自动保存。
每一份记录稿都有一个独特的可分享的网址。 将文件导出到 DOCX 或 PDF 进行电子邮件。 Pro 计划增加密码保护和长期链接, 用于客户工作。
STT.ai处理1 300+平台,包括YouTube、Vimeo、TikTok、SoundCloud、Zom、Gooom Meet、播客主机等。 URL转录只使用公开可获取的内容,DRM保护的信息来源不能被转录。