אתם יכולים לציין ש-Cloud Speech-to-Text יציין ערך של דיוק או רמת מהימנות למילים בודדות בתמלול.
רמת הסמך של המילה
כש-Cloud Speech-to-Text מתמלל קטע אודיו, הוא גם מודד את רמת הדיוק של התשובה. התשובה שנשלחת מ-Cloud STT מציינת את רמת המהימנות של כל בקשת התמלול כמספר בין 0.0 ל-1.0. בדוגמת הקוד הבאה מוצג ערך רמת הביטחון שמוחזר על ידי Cloud STT.
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.96748614
}
]
}
]
}
בנוסף לרמת הסמך של התמלול כולו, Cloud STT יכול לספק גם את רמת הסמך של מילים ספציפיות בתמלול. התגובה כוללת פרטים על WordInfo בתמליל, שמציינים את רמת הביטחון לגבי מילים ספציפיות, כמו בדוגמה הבאה.
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98360395,
"words": [
{
"startOffset": "0s",
"endOffset": "0.300s",
"word": "how",
"confidence": SOME NUMBER
},
...
]
}
]
}
]
}
הפעלת רמת סמך ברמת המילה בבקשה
בקטע הקוד הבא אפשר לראות איך להפעיל את רמת המהימנות ברמת המילה בבקשת תמלול ל-Cloud Speech-to-Text באמצעות קבצים מקומיים וקבצים מרוחקים.
שימוש בקובץ מקומי
REST
פרטים נוספים זמינים בנקודת קצה ל-API של speech:recognize.
כדי לבצע זיהוי דיבור סינכרוני, שולחים בקשת POST ומספקים את גוף הבקשה המתאים. בדוגמה הבאה מוצגת בקשת POST באמצעות curl. בדוגמה נעשה שימוש ב-Google Cloud CLI כדי ליצור אסימון גישה. הוראות להתקנת ה-CLI של gcloud מופיעות במדריך למתחילים.
בדוגמה הבאה אפשר לראות איך לשלוח בקשת POST באמצעות curl, כשגוף הבקשה מאפשר רמת מהימנות ברמת המילה.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v2/projects/{project}/locations/global/recognizers/{recognizers}:recognize \ --data '{ "config": { "features": { "enableWordTimeOffsets": true, "enableWordConfidence": true } }, "uri": "gs://cloud-samples-tests/speech/brooklyn.flac" }' > word-level-confidence.txt
אם הבקשה תתבצע בהצלחה, השרת יחזיר קוד סטטוס 200 OK של HTTP ואת התגובה בפורמט JSON, שתישמר בקובץ בשם word-level-confidence.txt.
{
"results": [
{
"alternatives": [
{
"transcript": "how old is the Brooklyn Bridge",
"confidence": 0.98360395,
"words": [
{
"startOffset": "0s",
"endOffset": "0.300s",
"word": "how",
"confidence": 0.98762906
},
{
"startOffset": "0.300s",
"endOffset": "0.600s",
"word": "old",
"confidence": 0.96929157
},
{
"startOffset": "0.600s",
"endOffset": "0.800s",
"word": "is",
"confidence": 0.98271006
},
{
"startOffset": "0.800s",
"endOffset": "0.900s",
"word": "the",
"confidence": 0.98271006
},
{
"startOffset": "0.900s",
"endOffset": "1.100s",
"word": "Brooklyn",
"confidence": 0.98762906
},
{
"startOffset": "1.100s",
"endOffset": "1.500s",
"word": "Bridge",
"confidence": 0.98762906
}
]
}
],
"languageCode": "en-us"
}
]
}
Python
מידע על התקנה ושימוש בספריית הלקוח של Cloud STT מופיע במאמר ספריות הלקוח של Cloud STT. מידע נוסף מופיע במאמרי העזרה של Cloud STT Python API.
כדי לבצע אימות ב-Cloud STT, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.