音频和视频转文字 | 免费语音转文字

import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

import fs from "fs";

const form = new FormData();
form.append("file", fs.createReadStream("meeting.mp3"));
form.append("model", "large-v3-turbo");
form.append("language", "auto");
form.append("diarize", "true");

const res = await fetch("https://api.stt.ai/v1/transcribe", {
  method: "POST",
  headers: { Authorization: `Bearer ${API_KEY}` },
  body: form,
});

const { segments } = await res.json();
segments.forEach(s =>
  console.log(`${s.speaker}: ${s.text}`)
);

从另一个演讲到短信服务?

STT.ai vs Otter.ai STT.ai vs TurboScribe STT.ai vs Fireflies STT.ai vs Rev 全部比较 →

简单、透明定价

开始自由。随你成长, 缩放。

自由

$0/以单位

600分钟后开始

5种5语言
TXT & SRT 导出
API 访问

启动器

$9/以单位

3 000分钟/月/月

100+语言
所有AI 模型
所有出口格式

人口最多

职业

$19/以单位

每月7 500分钟/月

私人记录誊本
无限制小组席位
优先处理事项处理

商业商

$39/以单位

20 000分钟/月

全部在 Pro 中
50K分钟储存库
无限制的 AI 聊天

查看所有计划和定价 →

辅助语言

所有100+语文 →

English Spanish French German Japanese Chinese Arabic Hindi Portuguese Russian Korean Italian Turkish Dutch Polish +85 +85 以上

准备好抄写了吗?

免费上传第一个文件没有信用卡,没有注册 600分钟后开始免费计划

开始切换

常见问题

语音对文本在您的浏览器中运行:粘贴 URL, 上传文件, 或者从您的 mic. STT.ai 中记录。选择 AI 模型并在5分钟内返回抄本。导出为 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。

是的,每个访客都有600分钟的自由时间从STT.ai开始,可用于其他工作流程语音对文本。支付计划从5美元/月开始,打开更长的文件、私人记录和排队优先。

语音对文本运行的AI模式与STT.ai的其余部分相同——我们的最佳模式在清洁演讲中达到95-97%的准确度(基准值为3-5%字错误率 ) 。如果第一个通过低于目标, 则在飞行上切换模型。

语音对文本可以运行STT.ai的10+型的任何一种模式——STT.ai增强型(最精确)、低语大V3(99种语言)、荷兰语加那利语加那利语(#1 WER on subed sangs)、小舌头涡轮(快)、月光(轻量级)等等。

是的,作为SRT或VTT的每一份记录稿出口都是与YouTube、Vimeo、TikTok、VLC和每个主要视频播放器合作的,燃烧字幕工具作为硬子将它们作为视频覆盖。

是的,议长的二分法自动标出每个声音(1号发言人,2号发言人,...),你可以在内置编辑中重新命名。在所有模式和语言中工作。

大部分语音对文本工作在5 分钟内完成。 1小时的音频文件通常以2-3分钟以最快的模型完成。速度取决于所选的模式和当前 GPU 装载量。

语音对文本接受20+格式 : MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVI等。输出到 TXT、 SRT、 VTT、 DOCX、 JSON 或 PDF 。

Yes. Audio files submitted to 语音对文本 are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

是 STT.ai 提供与 Python 和 Node.js SDKs 的REST API, 加上一个为Claude 和 Cursor 提供的 MCP 服务器, 全部用于语音对文本工作流程。免费 API 级别包括 100 分钟/ 月。

是的。每份笔录都打开在内置编辑器中,您可以在此校正单词、重命名扬声器、调整时间戳和添加笔记。所有更改都自动保存。

每一份记录稿都有一个独特的可分享的网址。将文件导出到 DOCX 或 PDF 进行电子邮件。 Pro 计划增加密码保护和长期链接, 用于客户工作。

STT.ai处理1 300+平台,包括YouTube、Vimeo、TikTok、SoundCloud、Zom、Gooom Meet、播客主机等。 URL转录只使用公开可获取的内容,DRM保护的信息来源不能被转录。

对文本的语音

STT.ai 如何运作

1. 上传、记录或粘贴 URL

2. AI 与你选择模式的连接

3. 出口、份额或一体化

民众使用案件

音频和视频所需的一切

开发者- 第一 API

简单、透明定价

辅助语言

准备好抄写了吗?

常见问题

How does 语音对文本 work on STT.ai?

Is 语音对文本 free?

How accurate is 语音对文本?

人工智能的模型我可以用在 语音对文本 中吗?

Can I get subtitles from 语音对文本?

Does 语音对文本 detect different speakers?

How long does 语音对文本 take?

支持什么输入格式 语音对文本?

我用 语音对文本 时 我的音频是私密的吗?

Is there a 语音对文本 API?

Can I edit a 语音对文本 transcript after?

How do I share what 语音对文本 produces?

还有什么其他平台在语音对文本之外还能工作?