เริ่มต้นใช้งาน AI ในตัว

Alexandra Klepper
Alexandra Klepper

เผยแพร่: 12 ธันวาคม 2024, อัปเดตล่าสุด: 20 พฤษภาคม 2025

AI API ในตัวช่วยให้เว็บแอปพลิเคชันของคุณ ทำงานที่ขับเคลื่อนด้วย AI ได้โดยไม่ต้องติดตั้งใช้งานหรือจัดการโมเดล AI ของตัวเอง เรากำลังดำเนินการเพื่อกำหนดมาตรฐาน API เหล่านี้ในเบราว์เซอร์ต่างๆ

ข้อกำหนด

หากต้องการใช้ AI ในตัว จะต้องมีข้อกำหนดเกี่ยวกับโมเดลและฮาร์ดแวร์

โมเดล

Translator API และ Language Detector API ใช้โมเดลผู้เชี่ยวชาญ ส่วน API อื่นๆ ทั้งหมด ใช้โมเดลภาษาที่ออกแบบมาให้ทำงานในเครื่องบนเดสก์ท็อปและแล็ปท็อป

Summarizer API, Writer API, Rewriter API และ Proofreader API รองรับเฉพาะ รูปแบบข้อความต่อข้อความ Prompt API มีความสามารถในสื่อหลากรูปแบบ

Gemini Nano ใน Chrome

ใน Chrome โมเดลภาษาคือ Gemini Nano Gemini Nano ไม่พร้อมให้บริการ ในอุปกรณ์เคลื่อนที่

ตั้งแต่ Chrome 140 เป็นต้นไป Gemini Nano จะรองรับภาษาอังกฤษ สเปน และญี่ปุ่นสำหรับข้อความอินพุต และเอาต์พุต

ก่อนใช้ API ของ AI ในตัว โปรดยอมรับนโยบายการใช้งานที่ไม่อนุญาตสำหรับ Generative AI ของ Google

ฮาร์ดแวร์

นักพัฒนาแอปและผู้ใช้ที่ใช้งานฟีเจอร์โดยใช้ API เหล่านี้ใน Chrome ต้องมีคุณสมบัติตรงตามข้อกำหนดต่อไปนี้ เบราว์เซอร์อื่นๆ อาจมีข้อกำหนดในการใช้งานที่แตกต่างกัน

API ตรวจหาภาษาและ API แปลภาษาใช้งานได้ใน Chrome บนเดสก์ท็อป API เหล่านี้ใช้ไม่ได้ใน อุปกรณ์เคลื่อนที่ Prompt API, Summarizer API, Writer API, Rewriter API และ Proofreader API จะทำงานใน Chrome เมื่อเป็นไปตามเงื่อนไขต่อไปนี้

  • ระบบปฏิบัติการ: Windows 10 หรือ 11, macOS 13 ขึ้นไป (Ventura ขึ้นไป), Linux หรือ ChromeOS (ตั้งแต่แพลตฟอร์ม 16389.0.0 ขึ้นไป) ในอุปกรณ์ Chromebook Plus Chrome สำหรับ Android, iOS และ ChromeOS ในอุปกรณ์ที่ไม่ใช่ Chromebook Plus ยังไม่รองรับ API ที่ใช้ Gemini Nano
  • พื้นที่เก็บข้อมูล: มีพื้นที่ว่างอย่างน้อย 22 GB ในวอลุ่มที่มีโปรไฟล์ Chrome ของคุณ
  • GPU: VRAM มากกว่า 4 GB เท่านั้น
  • เครือข่าย: อินเทอร์เน็ตแบบไม่จำกัดหรือการเชื่อมต่อแบบไม่จำกัดปริมาณ

ขนาดที่แน่นอนของ Gemini Nano อาจแตกต่างกันไปเมื่อเบราว์เซอร์อัปเดตโมเดล หากต้องการดูขนาดปัจจุบัน ให้ไปที่ chrome://on-device-internals

เริ่มสร้าง

เรามี AI API ในตัวหลายรายการที่พร้อมใช้งานใน ขั้นตอนการพัฒนาต่างๆ โดยบางฟีเจอร์จะอยู่ใน Chrome เวอร์ชันเสถียร บางฟีเจอร์จะพร้อมใช้งานสำหรับ ผู้เข้าร่วมโปรแกรมทดลองใช้ฟีเจอร์ต้นทาง และบางฟีเจอร์จะพร้อมใช้งานสำหรับ ผู้เข้าร่วมโปรแกรมทดลองใช้เวอร์ชันแรกๆ เท่านั้น

API แต่ละรายการมีชุดวิธีการของตัวเองในการเริ่มต้นใช้งานและดาวน์โหลดโมเดล ทั้งสำหรับการสร้างต้นแบบในเครื่องและในสภาพแวดล้อมการใช้งานจริงที่มีการทดสอบต้นทาง

คุณใช้ API ทั้งหมดนี้ได้เมื่อสร้างส่วนขยาย Chrome

การดาวน์โหลดโมเดล

API และโมเดลจะติดตั้งมาใน Chrome ครั้งแรกที่ผู้ใช้โต้ตอบ กับ API เหล่านี้ ระบบจะต้องดาวน์โหลดโมเดลไปยังเบราว์เซอร์

หากต้องการตรวจสอบว่า API พร้อมใช้งานหรือไม่ ให้เรียกใช้ฟังก์ชันแบบอะซิงโครนัส availability() ซึ่งจะแสดงผล Promise ที่มีค่าใดค่าหนึ่งต่อไปนี้

  • "unavailable": อุปกรณ์ของผู้ใช้หรือตัวเลือกเซสชันที่ขอไม่รองรับ อุปกรณ์อาจมีพลังงานหรือพื้นที่ในดิสก์ไม่เพียงพอ
  • "downloadable": ต้องดาวน์โหลดเพิ่มเติมเพื่อสร้างเซสชัน ซึ่งอาจรวมถึงโมเดลผู้เชี่ยวชาญ โมเดลภาษา หรือการปรับแต่ง คุณอาจต้องเปิดใช้งานผู้ใช้เพื่อโทรหา create()
  • "downloading": การดาวน์โหลดกำลังดำเนินการอยู่และต้องเสร็จสมบูรณ์ก่อนจึงจะใช้ เซสชันได้
  • "available": คุณสร้างเซสชันได้ทันที

การเปิดใช้งานผู้ใช้

หากอุปกรณ์รองรับ API ของ AI ในตัว แต่โมเดลยังไม่พร้อมใช้งาน ผู้ใช้จะต้องโต้ตอบเพื่อเริ่มเซสชันด้วย create()

ใช้พร็อพเพอร์ตี้ UserActivation.isActive เพื่อยืนยันการเปิดใช้งานของผู้ใช้ ซึ่งอาจเป็นการคลิก แตะ หรือกดแป้น

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

ตัวอย่างเช่น เมื่อใช้ Summarizer API คุณจะ ขอให้ผู้ใช้โต้ตอบกับปุ่มที่ระบุว่า "สรุป" เพื่อเปิดใช้งาน Summarizer.create() ได้

ใช้ API ใน localhost

API ทั้งหมดพร้อมใช้งานใน localhost ใน Chrome

  1. ไปที่ chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
  2. เลือกเปิดใช้
  3. คลิกเปิดอีกครั้งหรือรีสตาร์ท Chrome

หากต้องการยืนยันว่า Gemini Nano ดาวน์โหลดและทำงานตามที่ต้องการ ให้เปิดเครื่องมือสำหรับนักพัฒนาเว็บแล้วพิมพ์ await LanguageModel.availability(); ลงในคอนโซล ซึ่งควรแสดงผลเป็น available

แก้ปัญหา localhost

หากโมเดลทำงานไม่เป็นไปตามที่คาดไว้ ให้ทำตามขั้นตอนต่อไปนี้

  1. รีสตาร์ท Chrome
  2. ไปที่ chrome://on-device-internals
  3. เลือกแท็บสถานะโมเดลและตรวจสอบว่าไม่มีข้อผิดพลาด
  4. เปิดเครื่องมือสำหรับนักพัฒนาเว็บแล้วพิมพ์ LanguageModel.availability(); ลงในคอนโซล ซึ่งควรแสดงผลเป็น available

หากจำเป็น ให้รอสักครู่แล้วทำตามขั้นตอนเหล่านี้อีกครั้ง

กระบวนการมาตรฐาน

เรากำลังดำเนินการเพื่อกำหนดมาตรฐาน API เหล่านี้ เพื่อให้ทำงานได้ในทุกเบราว์เซอร์ ซึ่งหมายความว่าเราได้เสนอ API ให้กับชุมชนแพลตฟอร์มเว็บ และย้าย API ไปยัง W3C Web Incubator Community Group เพื่อหารือกันต่อไป

เราขอความคิดเห็นจาก W3C, Mozilla และ WebKit สำหรับ API แต่ละรายการ

มีส่วนร่วมและแชร์ความคิดเห็น

หากคุณลองใช้ AI ในตัวและมีความคิดเห็น โปรดแจ้งให้เราทราบ