آڈیو اور ویڈیو کو ٹیکسٹ میں تبدیل کریں | مفت اسپیچ ٹو ٹیکسٹ

کسی بھی آڈیو یا ویڈیو فائلیں گھسیٹ کر ڈالیں (MP3, WAV, MP4, اور 20+ فارمیٹ).اپنے مائیکرو فون سے ریئل ٹائم میں ریکارڈ کریں. یا یو ٹیوب، ویمیو، ٹیک ٹک اور 1300+ پلیٹ فارم سے ایک لینک کو پسٹ کریں.

2. اے آئی آپ کے انتخاب کے ماڈل کے ساتھ نقل کرتا ہے

10+ AI ماڈل سے منتخب کريں بشمول Whisper، NVIDIA Canary (#1 accuracy) اور Moonshine. 100+ آپشنز سے خودکار زبان کا پتہ لگايں.

3. برآمد، تقسیم یا انٹیگریٹ

TXT، SRT، VTT، DOCX، JSON، یا PDF کے طور پر ڈاؤن لوڈ کریں۔ لینک کے ذریعے اشتراک کریں۔ آپ کے ایپ میں نقل کو شامل کرنے کے لئے ہمارے API کا استعمال کریں۔ سبٹیٹیلز، میٹنگ نوٹس، پوڈکاسٹ اور مزید کے لئے بہترین۔

عام استعمال کے حالات

تمام استعمال کے حالات →

میٹنگیں

میٹنگ یادداشتیں اور عمل آیٹم

کلاس نوٹس اور اسٹڈی گائيڈز

قانوني

دفاتر

آپ کو آڈیو اور ویڈیو کے لئے جو کچھ بھی ضرورت ہے

AI سے طاقتور 70+ مفت اوزار

لفظ سے متن

آڈیو اور ویڈیو فائلیں نقل کریں

لائي وٹرنسکریپشن

رئل-ٹائم مائیکرو فون نقل

يو ٹیوب

کسی بھی ویڈیو سے عنوان نکالیں

ذیلی عنوانات ایڈیٹر

SRT & VTT فائلیں آن لائن منسوخ کریں

شور ختم کرنے والا

آڈیو سے پس منظر کی شور کو ہٹاو

آڈیو تبدیل کرنے والا

MP3, WAV, FLAC, OGG, AAC اور مزید

آواز ختم کرنے والا

آوازوں کو جدا کريں يا ان کو ہٹايں

آڈیو ترمینر

اوڈیو فائلیں کاٹیں اور ترمیم کریں

عنوان تبدیل کرنے والا

SRT، VTT، SSA، SBV فارمیٹ

میٹنگ میٹوڈ

عمل آیٹم نکالیں

تحریر سے بولنا

متن کو فطری بولنے میں تبدیل کریں

سب تیٹرس

100+ زبانوں میں ذیلی عنوانات کا ترجمہ کریں

تمام 70+ ٹولز دیکھیں →

100+

زبانیں

70+

مفت اوزار

1,300+

پلیٹ فارم

برآمد

ڈیولپر-فیئر API

منٹوں میں آپ کی ایپ میں لفظ سے متن میں شامل کریں. RESTful API ریئل-ٹائم ویب ساکٹ اسٹریمنگ کے ساتھ.

REST + ویب ساکٹ — فائلیں اپ لوڈ کریں اور ریئل ٹائم اسٹریمنگ

متعدد ماڈل — خفیہ، Canary، بہتر اور زیادہ

اسپیکر — خودکار-مشخص کریں کہ کون نے کیا کہا

لنچبل آؤٹ پٹ — JSON, TXT, SRT, VTT ورڈ ٹائم سٹیمپز کے ساتھ

API دستاویزات کھیل کا میدان

import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

import fs from "fs";

const form = new FormData();
form.append("file", fs.createReadStream("meeting.mp3"));
form.append("model", "large-v3-turbo");
form.append("language", "auto");
form.append("diarize", "true");

const res = await fetch("https://api.stt.ai/v1/transcribe", {
  method: "POST",
  headers: { Authorization: `Bearer ${API_KEY}` },
  body: form,
});

const { segments } = await res.json();
segments.forEach(s =>
  console.log(`${s.speaker}: ${s.text}`)
);

ایک اور بولنے سے ٹیکس سروس میں تبدیل کرنا؟

STT.ai vs Otter.ai STT.ai vs TurboScribe STT.ai vs Fireflies STT.ai vs Rev سب کا موازنہ کریں →

سادہ، شفافیت قیمت

آزاد شروع. آپ کے بڑھتے ہوئے پیمانے.

مفت

$0/ميگا بائٹ

شروع کرنے کے لیے 600 منٹ

زبانیں
TXT اور SRT برآمد
API رسائی

شروع

$9/ميگا بائٹ

3000 منٹ/مہین

100+ زبانیں
تمام AI ماڈل
تمام برآمدات کے فارمیٹ

نجی نقل
لامحدود ٹیم سیٹ
ترجیحی پروسیسنگ

کاروبار

$39/ميگا بائٹ

20,000 منٹ/مہین

پرو میں سب کچھ
50K منٹ کی ذخيرہ
لامحدود AI چیٹ

تمام منصوبے اور قیمتیں دیکھیں →

مدد شدہ زبانیں

تمام 100+ زبانیں →

English Spanish French German Japanese Chinese Arabic Hindi Portuguese Russian Korean Italian Turkish Dutch Polish +85 مزید

نقل کرنے کے لئے تیار ہیں؟

آپ کی پہلی فائلیں مفت اپ لوڈ کریں. کوئی کریڈٹ کارڈ نہیں، کوئی سائن اپ نہیں. 600 منٹ مفت منصوبے پر شروع کرنے کے لئے.

نقل شروع کریں

عام سوالات

زبان سے متن آپکے براؤزر ميں چلتا هے URL کو پيسٹ کريں ، فائل اپ لوڈ کريں يا آپکے مائک سے ريکورڈ کريں STT.ai AI ماڈل کو منتخب کر تا هے اور 5 منٹ ميں نقل واپس کر تا هے TXT ، SRT ، VTT ، DOCX ، JSON يا PDF کے طور پر خارج کريں

ہاں - ہر مہمان کو STT.ai پر شروع کرنے کے لیے 600 مفت منٹ ملتے ہیں، زبان سے متن کے لیے استعمال کرنے کے لیے کسی بھی دوسرے ورک فلو کی طرح. $5/مئی سے شروع ہونے والے پیسے کے منصوبے طویل فائلیں، نجی نقل، اور ترجیح کی قطار کو کھولتے ہیں۔

زبان سے متن STT.aiکے بقيه حصے کے طور پر عين AI ماڈل پر چلتا هے - ہمارے بهترين ماڈل صاف بولنے پر 95-97% دقت تک پہنچتے هيں (3-5% لفظ غلطي ريٹ بنکمارکز پر) اگر اول پاس آپکے مقصد کے نيچے هے تو ماڈل کو فوري طور پر تبديل کريں

زبان سے متن STT.ai کے 10+ ماڈل کے کسی بھی پر چل سکتا ہے - STT.ai بہتر (سب سے زیادہ صحیح)، Whisper Large V3 (99 زبانیں)، NVIDIA Canary (#1 WER مدد شدہ لنگر پر)، Whisper Turbo (فائل)، Moonshine (لچھٹ وزن)، اور زیادہ.

ہاں ہر نقل SRT یا VTT کے طور پر برآمد کرتا ہے - یو ٹیوب، ویمیو، ٹک کٹ، VLC اور ہر اہم ویڈیو پلیئر کے ساتھ کام کرتا ہے. برن سب ٹیٹلز ٹول ان کو ویڈیو پر ہارڈ سب کے طور پر اوورلےڈ کرتا ہے.

ہاں ، اسپيکر دياريزيشن خودکار طور پر ہر آواز کو ليبل کر تا هے (سپيکر 1 ، اسپيکر 2 ،...) اور آپ انکا نام بدل سکتے هيں اندروني ايڈيٽر ميں تمام ماڈل اور زبانوں ميں کام کر تا هے

اکثر زبان سے متن کام 5 منٹ میں ختم ہوتے ہیں. ایک 1 گھنٹہ کی آڈیو فائل عام طور پر ہمارے سب سے تیز ماڈل کے ساتھ 2-3 منٹ میں مکمل ہو جاتی ہے. رفتار منتخب ماڈل اور جاری GPU لوڈ پر منحصر ہے.

زبان سے متن 20+ فارمیٹ قبول کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور مزید. TXT, SRT, VTT, DOCX, JSON, or PDF میں خروجی.

ہاں. آڈیو فائلیں جو زبان سے متن کو پیش کی جاتی ہیں وہ عمل میں لائے جاتے ہیں اور دیفالٹ سے حذف کی جاتی ہیں. پرو پلان کلائنٹ جانبی خفیہ سازی شامل کرتے ہیں - اگرچہ اگر STT.ai کی ڈیٹا بیس کو توڑ دیا جائے تو بھی، آپ کی نقلات آپ کی کلید کے بغیر پڑھی نہیں جاسکتی. ڈیٹا کو ماڈل تربیت کے لیے کبھی بھی استعمال نہیں کیا جاتا ہے بغیر واضح آپٹ ان کے.

ہاں۔ STT.ai پائتھون اور Node.js SDKs کے ساتھ ایک REST API پیش کرتا ہے، اور Claude اور Cursor کے لئے ایک MCP سرور بھی — سب زبان سے متن کے لئے استعمال کرنے کے قابل۔ مفت API Tier میں 100 منٹ/مہین شامل ہیں۔

ہاں ہر نقل اندروني ايڈيٽر ميں کھولي جا تا هے جہاں آپ لفظوں کو درست کر سکتے هيں ، اسپيکر کا نام بدل سکتے هيں ، وقت کے نشانات کو ترتيب دے سکتے هيں اور نوٹس شامل کر سکتے هيں سب تبديلياں خودکار طور پر محفوظ کي جا سکتی هيں

ہر نقل ایک منفرد URL حاصل کرتا ہے. DOCX یا PDF میں ای میل کے لیے برآمد. پرو پلان پاس ورڈ محفوظ اور دائمی رابطے شامل کرتے ہیں - کلائنٹ کام کے لیے مفید.

STT.ai یو ٹیوب، ویمیو، ٹک کٹ، ساؤنڈ کلاؤڈ، زوم، گوگل میٹ، پوڈکاسٹ ہوسٹز اور مزید شامل کرتے ہوئے 1300+ پلیٹ فارموں کو ہینڈل کرتا ہے۔ URL ترنسکریپشن صرف عوامی طور پر دستیاب مواد کے ساتھ کام کرتا ہے - DRM محفوظ منابع کو ترنسکریپٹ نہیں کیا جاسکتا۔

لفظ سے متن ماڈل

STT.ai کیسے کام کرتا ہے

1. اپ لوڈ، ریکارڈ یا پیسٹ URL

2. اے آئی آپ کے انتخاب کے ماڈل کے ساتھ نقل کرتا ہے

3. برآمد، تقسیم یا انٹیگریٹ

عام استعمال کے حالات

آپ کو آڈیو اور ویڈیو کے لئے جو کچھ بھی ضرورت ہے

ڈیولپر-فیئر API

سادہ، شفافیت قیمت

مدد شدہ زبانیں

نقل کرنے کے لئے تیار ہیں؟

عام سوالات

زبان سے متن STT.ai پر کیسے کام کرتا ہے؟

کیا زبان سے متن مفت ہے؟

زبان سے متن کتنا صحیح ہے؟

میں کیا AI ماڈل استعمال کر سکتا ہوں زبان سے متن کے لیے؟

کیا میں زبان سے متن سے سب سیٹل حاصل کر سکتا ہوں؟

کیا زبان سے متن مختلف اسپیکروں کو تلاش کرتا ہے؟

زبان سے متن کتنا وقت لے گا؟

کیا انوٹاپ فارمیٹ زبان سے متن کو مدد دیتی ہے؟

کیا میری آڈیو پرائیویٹ ہے جب میں زبان سے متن استعمال کر رہا ہوں؟

کیا آپ کو ایک API زبان سے متن ملتا ہے؟

کیا میں بعد میں زبان سے متن ترنسکریپٹ کو تبدیل کر سکتا ہوں؟

میں کس طرح شیئر کر سکتا ہوں جو زبان سے متن پیدا کرتا ہے؟

کیا دوسرے پلیٹ فارم زبان سے متن کے علاوہ کام کرتے ہیں؟