[go: up one dir, main page]

مفت AI لفظ سے متن

100+ زبانوں میں متن میں آڈیو اور ویڈیو نقل کریں. 10+ AI ماڈل. اسپیکر کی دریافت. کوئی سائن اپ کی ضرورت نہیں.

10K
نقل
252K
منٹ
100+
زبانیں
70+
مفت اوزار

عوامی طور پر دستیاب آڈیو اور ویڈیو کے ساتھ کام کرتا ہے. DRM-محفوظ مواد کو مدد نہیں دی جاتی.

بہتری کے لیے اپگریڈ
نجی نقل
نقل کے ساتھ گفتگو کریں
پرو کے ساتھ تالک کھولیں →
فائلیں یہاں ڈالیں یا براؤز کرنے کے لیے کلک کریں
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - 2GB تک
بہتری کے لیے اپگریڈ
نجی نقل
نقل کے ساتھ گفتگو کریں
پرو کے ساتھ تالک کھولیں →
بہتری کے لیے اپگریڈ
ریکارڈنگ: 0:00
رئیل ٹائم موشی (حالی)
بہتر چپکے سے (صحيح)
عوامی رابطے: 24h، صرف متن · رجسٹر کریں 7d + آڈیو کے لیے · پرو نجی لنکس کے لیے

رئل ٹائم اسپیکینگ سے ٹیکسٹ. AI خودکار طور پر درست کرتا ہے جیسے آپ بولتے ہیں - صحیح بات بولنے سے بہتر ہوتا ہے

پہلے اپنا مائیکرو فون جانچیں
❤️ STT.ai سے محبت؟ اپنے دوستوں کو بتاؤ!
آپ نے اپنے مفت نقل استعمال کر رہے ہیں

600 منٹ حاصل کرنے کے لیے مفت میں رجسٹر کریں، یا $5/مئی سے ہزاروں زیادہ کے لئے اپگریڈ کریں.

10 مفت منٹ/دن 600 منٹ مفت میں رجسٹر کوئی کریڈٹ کارڈ نہیں خفیہ
مفت میں رجسٹر کریں →
کلائنٹ سائیڈ انکرپٹڈ اسٹوریج — آپ کے نقل آپ کے براؤزر میں خفیہ ہیں. ہم بھی انہیں پڑھ نہیں سکتے. اسکے کام کيا کر نے کو سيکھيں →

دنیا بھر میں پیشہ وروں کے ذریعے اعتماد

STT.ai کیسے کام کرتا ہے

صحيح نقل کے لئے تین قدم

1. اپ لوڈ، ریکارڈ یا پیسٹ URL

کسی بھی آڈیو یا ویڈیو فائلیں گھسیٹ کر ڈالیں (MP3, WAV, MP4, اور 20+ فارمیٹ).اپنے مائیکرو فون سے ریئل ٹائم میں ریکارڈ کریں. یا یو ٹیوب، ویمیو، ٹیک ٹک اور 1300+ پلیٹ فارم سے ایک لینک کو پسٹ کریں.

2. اے آئی آپ کے انتخاب کے ماڈل کے ساتھ نقل کرتا ہے

10+ AI ماڈل سے منتخب کريں بشمول Whisper، NVIDIA Canary (#1 accuracy) اور Moonshine. 100+ آپشنز سے خودکار زبان کا پتہ لگايں.

3. برآمد، تقسیم یا انٹیگریٹ

TXT، SRT، VTT، DOCX، JSON، یا PDF کے طور پر ڈاؤن لوڈ کریں۔ لینک کے ذریعے اشتراک کریں۔ آپ کے ایپ میں نقل کو شامل کرنے کے لئے ہمارے API کا استعمال کریں۔ سبٹیٹیلز، میٹنگ نوٹس، پوڈکاسٹ اور مزید کے لئے بہترین۔

100+
زبانیں
70+
مفت اوزار
1,300+
پلیٹ فارم
7
برآمد

ڈیولپر-فیئر API

منٹوں میں آپ کی ایپ میں لفظ سے متن میں شامل کریں. RESTful API ریئل-ٹائم ویب ساکٹ اسٹریمنگ کے ساتھ.

REST + ویب ساکٹ — فائلیں اپ لوڈ کریں اور ریئل ٹائم اسٹریمنگ
متعدد ماڈل — خفیہ، Canary، بہتر اور زیادہ
اسپیکر — خودکار-مشخص کریں کہ کون نے کیا کہا
لنچبل آؤٹ پٹ — JSON, TXT, SRT, VTT ورڈ ٹائم سٹیمپز کے ساتھ
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

ایک اور بولنے سے ٹیکس سروس میں تبدیل کرنا؟

نقل کرنے کے لئے تیار ہیں؟

آپ کی پہلی فائلیں مفت اپ لوڈ کریں. کوئی کریڈٹ کارڈ نہیں، کوئی سائن اپ نہیں. 600 منٹ مفت منصوبے پر شروع کرنے کے لئے.

نقل شروع کریں

عام سوالات

زبان سے متن آپکے براؤزر ميں چلتا هے URL کو پيسٹ کريں ، فائل اپ لوڈ کريں يا آپکے مائک سے ريکورڈ کريں STT.ai AI ماڈل کو منتخب کر تا هے اور 5 منٹ ميں نقل واپس کر تا هے TXT ، SRT ، VTT ، DOCX ، JSON يا PDF کے طور پر خارج کريں

ہاں - ہر مہمان کو STT.ai پر شروع کرنے کے لیے 600 مفت منٹ ملتے ہیں، زبان سے متن کے لیے استعمال کرنے کے لیے کسی بھی دوسرے ورک فلو کی طرح. $5/مئی سے شروع ہونے والے پیسے کے منصوبے طویل فائلیں، نجی نقل، اور ترجیح کی قطار کو کھولتے ہیں۔

زبان سے متن STT.aiکے بقيه حصے کے طور پر عين AI ماڈل پر چلتا هے - ہمارے بهترين ماڈل صاف بولنے پر 95-97% دقت تک پہنچتے هيں (3-5% لفظ غلطي ريٹ بنکمارکز پر) اگر اول پاس آپکے مقصد کے نيچے هے تو ماڈل کو فوري طور پر تبديل کريں

زبان سے متن STT.ai کے 10+ ماڈل کے کسی بھی پر چل سکتا ہے - STT.ai بہتر (سب سے زیادہ صحیح)، Whisper Large V3 (99 زبانیں)، NVIDIA Canary (#1 WER مدد شدہ لنگر پر)، Whisper Turbo (فائل)، Moonshine (لچھٹ وزن)، اور زیادہ.

ہاں ہر نقل SRT یا VTT کے طور پر برآمد کرتا ہے - یو ٹیوب، ویمیو، ٹک کٹ، VLC اور ہر اہم ویڈیو پلیئر کے ساتھ کام کرتا ہے. برن سب ٹیٹلز ٹول ان کو ویڈیو پر ہارڈ سب کے طور پر اوورلےڈ کرتا ہے.

ہاں ، اسپيکر دياريزيشن خودکار طور پر ہر آواز کو ليبل کر تا هے (سپيکر 1 ، اسپيکر 2 ،...) اور آپ انکا نام بدل سکتے هيں اندروني ايڈيٽر ميں تمام ماڈل اور زبانوں ميں کام کر تا هے

اکثر زبان سے متن کام 5 منٹ میں ختم ہوتے ہیں. ایک 1 گھنٹہ کی آڈیو فائل عام طور پر ہمارے سب سے تیز ماڈل کے ساتھ 2-3 منٹ میں مکمل ہو جاتی ہے. رفتار منتخب ماڈل اور جاری GPU لوڈ پر منحصر ہے.

زبان سے متن 20+ فارمیٹ قبول کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور مزید. TXT, SRT, VTT, DOCX, JSON, or PDF میں خروجی.

ہاں. آڈیو فائلیں جو زبان سے متن کو پیش کی جاتی ہیں وہ عمل میں لائے جاتے ہیں اور دیفالٹ سے حذف کی جاتی ہیں. پرو پلان کلائنٹ جانبی خفیہ سازی شامل کرتے ہیں - اگرچہ اگر STT.ai کی ڈیٹا بیس کو توڑ دیا جائے تو بھی، آپ کی نقلات آپ کی کلید کے بغیر پڑھی نہیں جاسکتی. ڈیٹا کو ماڈل تربیت کے لیے کبھی بھی استعمال نہیں کیا جاتا ہے بغیر واضح آپٹ ان کے.

ہاں۔ STT.ai پائتھون اور Node.js SDKs کے ساتھ ایک REST API پیش کرتا ہے، اور Claude اور Cursor کے لئے ایک MCP سرور بھی — سب زبان سے متن کے لئے استعمال کرنے کے قابل۔ مفت API Tier میں 100 منٹ/مہین شامل ہیں۔

ہاں ہر نقل اندروني ايڈيٽر ميں کھولي جا تا هے جہاں آپ لفظوں کو درست کر سکتے هيں ، اسپيکر کا نام بدل سکتے هيں ، وقت کے نشانات کو ترتيب دے سکتے هيں اور نوٹس شامل کر سکتے هيں سب تبديلياں خودکار طور پر محفوظ کي جا سکتی هيں

ہر نقل ایک منفرد URL حاصل کرتا ہے. DOCX یا PDF میں ای میل کے لیے برآمد. پرو پلان پاس ورڈ محفوظ اور دائمی رابطے شامل کرتے ہیں - کلائنٹ کام کے لیے مفید.

STT.ai یو ٹیوب، ویمیو، ٹک کٹ، ساؤنڈ کلاؤڈ، زوم، گوگل میٹ، پوڈکاسٹ ہوسٹز اور مزید شامل کرتے ہوئے 1300+ پلیٹ فارموں کو ہینڈل کرتا ہے۔ URL ترنسکریپشن صرف عوامی طور پر دستیاب مواد کے ساتھ کام کرتا ہے - DRM محفوظ منابع کو ترنسکریپٹ نہیں کیا جاسکتا۔