よくある質問
音声のボリュームを上げる はブラウザで実行されます。URLを貼り付け、ファイルをアップロード、またはマイクから録音します。STT.ai は AI モデルを選択し、5 分以内に転写を返します。 TXT、SRT、VTT、DOCX、JSON、PDF としてエクスポートします。
はい - 訪問者はSTT.aiで開始するために600分のフリーミニットを得ます。 音声のボリュームを上げる は他のワークフローと同じように使用できます。有料プランは$5/月から始まり、長いファイル、プライベートトランスクリプト、優先キューをロックします。
音声のボリュームを上げる は STT.ai の他の部分と同じ AI モデルで動作します。最良のモデルは 95-97% の正確性を持ちます。 もし最初のパスが目標より低い場合は、モデルを変更します。
音声のボリュームを上げるはSTT.aiの10以上のモデルで動作します。STT.ai Enhanced (最も正確)、Whisper Large V3 (99言語)、NVIDIA Canary (#1 WER on supported langs)、Whisper Turbo (fast)、Moonshine (lightweight)、その他。
はい。すべての字幕は SRT または VTT としてエクスポートされます。YouTube、Vimeo、TikTok、VLC、その他の主要なビデオプレーヤーで動作します。Burn-Subtitles ツールはこれらをビデオにハードサブとしてオーバーレイします。
はい。スピーカーダイアリズムは自動的に各音声にラベルを付けます。内蔵エディタで名前を変更できます。すべてのモデルと言語で動作します。
音声のボリュームを上げる ジョブのほとんどは 5 分以内に完了します。1 時間のオーディオファイルは、最も速いモデルでは 2-3 分で完了します。速度は、選択したモデルと現在の GPU 負荷に依存します。
音声のボリュームを上げる は MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVI などの 20 以上のフォーマットをサポートします。出力は TXT、SRT、VTT、DOCX、JSON、または PDF です。
はい。音声のボリュームを上げるに送信されたオーディオファイルは、標準で処理され削除されます。プロプランはクライアント側暗号化を追加します。STT.aiのデータベースが破壊されたとしても、鍵なしで転写は読み取れません。データは明示的なオプションなしにモデルの訓練に使用されません。
STT.aiはPythonとNode.js SDKを使ったREST APIを提供し、ClaudeとCursorのためのMCPサーバを提供します。これらはすべて音声のボリュームを上げるワークフローに使用できます。無料APIの階層は100分/月を含みます。
はい。すべてのトランスポートは内蔵されたエディタで開きます。そこで言葉を訂正、話者の名前を変更、タイムスタンプを調整、ノートを追加できます。すべての変更は自動的に保存されます。
すべての転写は共有可能なユニークな URL を持ちます。メールのために DOCX または PDF にエクスポートします。プロプランはパスワード保護された永続リンクを追加します。クライアントの作業に役立ちます。
STT.aiはYouTube、Vimeo、TikTok、SoundCloud、Zoom、Google Meet、ポッドキャストホストなど1,300以上のプラットフォームを扱う。URL転写は公開可能なコンテンツのみで動作します。DRM保護されたソースは転写できません。