[go: up one dir, main page]

Free AI Từ nói sang văn bản

Phiên dịch âm thanh và video thành văn bản bằng hơn 100 ngôn ngữ. 10+ mô hình AI. Kiểm tra người nói. Không cần đăng ký.

10K
bản dịch
252K
phút đã phiên âm
100+
ngôn ngữ
70+
công cụ miễn phí

Làm việc với âm thanh và video công cộng. Không hỗ trợ nội dung được bảo vệ DRM.

Tăng cấp cho nâng cấp
Bản dịch riêng
Trò chuyện với bản ghi chép
Mở khóa với Pro →
Thả tập tin vào đây hoặc nhấn để duyệt
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — lên đến 2GB
Tăng cấp cho nâng cấp
Bản dịch riêng
Trò chuyện với bản ghi chép
Mở khóa với Pro →
Tăng cấp cho nâng cấp
Ghi âm: 0:00
Thời gian thực Sáp (trong giây lát)
Tăng cường Tiếng thì thầm (đúng)
Liên kết công cộng: 24h, chỉ văn bản · Đăng ký cho 7d + âm thanh · Tốt cho liên kết riêng

Tự động sửa lỗi khi bạn nói — độ chính xác tăng lên khi nói lâu hơn.

Kiểm tra micro đầu tiên
❤️ Cảm ơn bạn đã ghé thăm STT.ai.
Anh đã dùng bản dịch miễn phí của mình.

Đăng ký miễn phí để nhận 600 phút, hoặc nâng cấp từ $5/tháng cho hàng ngàn người khác.

10 phút miễn phí/ngày 600 phút miễn phí với đăng ký Không có thẻ tín dụng Đã mã hóa
Đăng ký miễn phí →
Bộ nhớ được mã hóa phía máy khách — Bản ghi của anh được mã hóa trong trình duyệt của anh, ngay cả chúng tôi cũng không thể đọc được. Hãy học cách làm việc →

Được các chuyên gia tin tưởng trên toàn thế giới

STT.ai hoạt động như thế nào

Ba bước để phiên âm chính xác

1. Tải lên, ghi, hoặc dán URL

Kéo và thả bất kỳ tập tin âm thanh hay video nào (MP3, WAV, MP4, và hơn 20 định dạng). Ghi âm từ micro của bạn trong thời gian thực. Hoặc dán một liên kết từ YouTube, Vimeo, TikTok, và hơn 1.300 nền tảng.

2. AI Transcribes with Your Choice of Model

Chọn từ 10+ mô hình AI bao gồm Whisper, NVIDIA Canary (# chính xác số 1), và Moonshine. Tự động phát hiện ngôn ngữ từ 100+ tùy chọn. Đánh dấu người nói để xác định ai nói gì.

3. Xuất, chia sẻ, hoặc tích hợp

Tải về dạng TXT, SRT, VTT, DOCX, JSON, hoặc PDF. Chia sẻ qua liên kết. Dùng API của chúng tôi để tích hợp phiên dịch vào ứng dụng của bạn. Tốt cho phụ đề, ghi chú cuộc họp, podcast, và nhiều hơn nữa.

100+
Ngôn ngữ được hỗ trợ
70+
Công cụ miễn phí
1,300+
Nền tảng được hỗ trợ
7
Định dạng xuất

API của nhà phát triển

Tạo và chia sẻ các video trên YouTube. ^ “Review: The RESTful API with WebSocket streaming”.

REST + WebSocket — Tải lên tập tin và truyền trực tiếp
Nhiều mô hình — Whisper, Canary, Cải tiến và nhiều hơn
Tự động — Tự động phát hiện ai nói gì
Xuất linh hoạt — JSON, TXT, SRT, VTT với dấu thời gian từ
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Đang chuyển từ dịch vụ nói khác sang dịch vụ văn bản?

Sẵn sàng để ghi lại chưa?

Tải lên tập tin đầu tiên miễn phí, không cần thẻ tín dụng, không cần đăng ký, 600 phút để bắt đầu miễn phí.

Bắt đầu phiên âm

Câu hỏi thường gặp

Từ nói sang văn bản chạy trong trình duyệt của bạn: dán URL, tải lên tập tin, hay ghi âm từ mic của bạn. STT.ai chọn mô hình AI và trả lại bản ghi trong 5 phút. Xuất dạng TXT, SRT, VTT, DOCX, JSON, hoặc PDF.

Có — mỗi khách truy cập có 600 phút miễn phí để bắt đầu trên STT.ai, có thể sử dụng cho Từ nói sang văn bản giống như bất kỳ luồng công việc nào khác. Các kế hoạch trả tiền bắt đầu từ $5/tháng mở khóa các tập tin dài hơn, bản ghi riêng và xếp hàng ưu tiên.

Từ nói sang văn bản chạy trên cùng mô hình AI như phần còn lại của STT.ai — các mô hình tốt nhất của chúng tôi đạt đến độ chính xác 95-97% trong nói rõ (3-5% Tỷ lệ lỗi từ trong các tiêu chuẩn). Thay đổi mô hình khi bay nếu lần đầu đi qua dưới mục tiêu của bạn.

Từ nói sang văn bản có thể chạy trên bất kỳ STT.ai 10+ mẫu — STT.ai Enhanced (đúng nhất), Whisper Large V3 (99 ngôn ngữ), NVIDIA Canary (#1 WER trên langs hỗ trợ), Whisper Turbo (nhanh), Moonshine (nhẹ), và nhiều hơn nữa.

Có. Mỗi bản dịch được xuất thành SRT hoặc VTT — hoạt động với YouTube, Vimeo, TikTok, VLC, và mọi trình xem video lớn. Công cụ ghi phụ đề sẽ đặt chúng lên video như phần phụ đề.

Có. Tự động dán nhãn mỗi giọng nói (Giọng nói 1, Giọng nói 2,...) và bạn có thể đổi tên chúng trong trình biên tập nội bộ. Hoạt động trên tất cả các mẫu và ngôn ngữ.

Hầu hết Từ nói sang văn bản công việc hoàn thành trong 5 phút. Một tập tin âm thanh 1 giờ thường hoàn thành trong 2-3 phút với các mẫu nhanh nhất của chúng tôi. Tốc độ phụ thuộc vào mẫu chọn và tải CPU hiện tại.

Từ nói sang văn bản chấp nhận hơn 20 định dạng — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, và nhiều hơn nữa. Xuất thành TXT, SRT, VTT, DOCX, JSON, hoặc PDF.

Có. Tập tin âm thanh gửi đến Từ nói sang văn bản được xử lý và xóa theo mặc định. Các gói Pro thêm mã hóa bên khách — ngay cả khi cơ sở dữ liệu của STT.ai bị phá vỡ, bản ghi của bạn không đọc được nếu không có chìa khóa của bạn. Dữ liệu không bao giờ được dùng cho việc huấn luyện mô hình nếu không có sự đồng ý rõ ràng.

Có. STT.ai cung cấp một API REST với Python và Node.js SDKs, cộng thêm một máy chủ MCP cho Claude và Cursor — tất cả đều có thể sử dụng cho Từ nói sang văn bản workflows.

Có. Mỗi bản ghi sẽ được mở trong trình biên tập bên trong nơi bạn có thể sửa chữa từ, đổi tên người nói, điều chỉnh dấu thời gian, và thêm ghi chú. Tất cả các thay đổi sẽ được tự động lưu.

Mỗi bản ghi nhận có một URL có thể chia sẻ độc nhất. Xuất DOCX hoặc PDF cho email. Các kế hoạch Pro thêm liên kết bảo vệ mật khẩu và liên kết vĩnh viễn — hữu ích cho công việc khách hàng.

STT.ai xử lý 1.300+ nền tảng bao gồm YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, và nhiều hơn nữa. URL transcription works with publicly-available content only — DRM-protected sources cannot be transcribed.