เริ่มต้นใช้งาน AI ในตัว

Alexandra Klepper

เผยแพร่: 12 ธันวาคม 2024, อัปเดตล่าสุด: 20 พฤษภาคม 2025

API ของ AI ในตัวช่วยให้เว็บแอปพลิเคชันของคุณ ทำงานที่ขับเคลื่อนด้วย AI ได้โดยไม่ต้องติดตั้งใช้งานหรือจัดการโมเดล AI ของตัวเอง เรากำลังดำเนินการเพื่อกำหนดมาตรฐาน API เหล่านี้ในเบราว์เซอร์ต่างๆ

ข้อกำหนด

หากต้องการใช้ AI ในตัว จะต้องมีข้อกำหนดเกี่ยวกับโมเดลและฮาร์ดแวร์

โมเดล

Translator API และ Language Detector API ใช้โมเดลผู้เชี่ยวชาญ ส่วน API อื่นๆ ทั้งหมด ใช้โมเดลภาษาที่ออกแบบมาให้ทำงานในเครื่องบนเดสก์ท็อปและแล็ปท็อป

Summarizer API, Writer API, Rewriter API และ Proofreader API รองรับเฉพาะ รูปแบบข้อความต่อข้อความ Prompt API มีความสามารถในสื่อหลากรูปแบบ

Gemini Nano ใน Chrome

Chrome ใช้โมเดลภาษา Gemini Nano Gemini Nano ไม่พร้อมให้บริการ ในอุปกรณ์เคลื่อนที่

ตั้งแต่ Chrome 140 เป็นต้นไป Gemini Nano จะรองรับภาษาอังกฤษ สเปน และญี่ปุ่นสำหรับข้อความอินพุต และเอาต์พุต

ก่อนใช้ API ของ AI ในตัว โปรดยอมรับนโยบายการใช้งานที่ไม่อนุญาตสำหรับ Generative AI ของ Google

ฮาร์ดแวร์

นักพัฒนาแอปและผู้ใช้ที่ใช้งานฟีเจอร์โดยใช้ API เหล่านี้ใน Chrome ต้องมีคุณสมบัติตรงตามข้อกำหนดต่อไปนี้ เบราว์เซอร์อื่นๆ อาจมีข้อกำหนดในการใช้งานที่แตกต่างกัน

API ตรวจหาภาษาและ API แปลภาษาจะทำงานใน Chrome บนเดสก์ท็อป API เหล่านี้ใช้ไม่ได้ในอุปกรณ์เคลื่อนที่ Prompt API, Summarizer API, Writer API, Rewriter API และ Proofreader API จะทำงานใน Chrome เมื่อเป็นไปตามเงื่อนไขต่อไปนี้

ระบบปฏิบัติการ: Windows 10 หรือ 11, macOS 13 ขึ้นไป (Ventura ขึ้นไป), Linux หรือ ChromeOS (ตั้งแต่แพลตฟอร์ม 16389.0.0 ขึ้นไป) ในอุปกรณ์ Chromebook Plus Chrome สำหรับ Android, iOS และ ChromeOS ในอุปกรณ์ที่ไม่ใช่ Chromebook Plus ยังไม่รองรับ API ที่ใช้ Gemini Nano
พื้นที่เก็บข้อมูล: มีพื้นที่ว่างอย่างน้อย 22 GB ในวอลุ่มที่มีโปรไฟล์ Chrome ของคุณ
โมเดลในตัวควรมีขนาดเล็กกว่ามาก ขนาดที่แน่นอนอาจแตกต่างกันเล็กน้อยเมื่อมีการอัปเดต
GPU หรือ CPU: โมเดลในตัวสามารถทำงานด้วย GPU หรือ CPU
- GPU: VRAM มากกว่า 4 GB เท่านั้น
- CPU: RAM 16 GB ขึ้นไปและ CPU 4 คอร์ขึ้นไป
เครือข่าย: อินเทอร์เน็ตแบบไม่จำกัดหรือการเชื่อมต่อแบบไม่จำกัดปริมาณ
คำสำคัญ: A การเชื่อมต่อแบบคิดตามปริมาณการใช้งาน คือการเชื่อมต่ออินเทอร์เน็ตที่มีการจำกัดปริมาณข้อมูล การเชื่อมต่อ Wi-Fi และอีเทอร์เน็ตมักจะไม่จำกัดปริมาณการใช้งาน โดยค่าเริ่มต้น ในขณะที่การเชื่อมต่อเครือข่ายมือถือมักจะจำกัดปริมาณการใช้งาน

ขนาดที่แน่นอนของ Gemini Nano อาจแตกต่างกันไปเมื่อเบราว์เซอร์อัปเดตโมเดล หากต้องการดูขนาดปัจจุบัน ให้ไปที่ chrome://on-device-internals

เริ่มสร้าง

เรามี AI API ในตัวหลายรายการที่พร้อมใช้งานใน ขั้นตอนการพัฒนาต่างๆ บางฟีเจอร์อยู่ใน Chrome เวอร์ชันเสถียร บางฟีเจอร์พร้อมให้ใช้งานสำหรับ ผู้เข้าร่วมโปรแกรมทดลองใช้จากต้นทาง และบางฟีเจอร์พร้อมให้ใช้งานสำหรับ ผู้เข้าร่วมโปรแกรมทดลองใช้เวอร์ชันแรกๆ เท่านั้น

API แต่ละรายการมีชุดวิธีการของตัวเองในการเริ่มต้นใช้งานและดาวน์โหลดโมเดล ทั้งสำหรับการสร้างต้นแบบในเครื่องและในสภาพแวดล้อมการใช้งานจริงที่มีการทดลองใช้ต้นทาง

คุณใช้ API ทั้งหมดนี้ได้เมื่อสร้างส่วนขยาย Chrome

การดาวน์โหลดโมเดล

API และโมเดลต่างๆ จะรวมอยู่ใน Chrome ในครั้งแรกที่ผู้ใช้โต้ตอบ กับ API เหล่านี้ ระบบจะต้องดาวน์โหลดโมเดลไปยังเบราว์เซอร์

หากต้องการตรวจสอบว่า API พร้อมใช้งานหรือไม่ ให้เรียกใช้ฟังก์ชันแบบอะซิงโครนัส availability() ซึ่งจะแสดงผล Promise ที่มีค่าใดค่าหนึ่งต่อไปนี้

"unavailable": อุปกรณ์ของผู้ใช้หรือตัวเลือกเซสชันที่ขอไม่รองรับ อุปกรณ์อาจมีพลังงานหรือพื้นที่ในดิสก์ไม่เพียงพอ
"downloadable": ต้องดาวน์โหลดเพิ่มเติมเพื่อสร้างเซสชัน ซึ่งอาจรวมถึงโมเดลผู้เชี่ยวชาญ โมเดลภาษา หรือการปรับแต่ง คุณอาจต้องเปิดใช้งานผู้ใช้เพื่อโทรหา create()
"downloading": การดาวน์โหลดกำลังดำเนินการอยู่และต้องเสร็จสมบูรณ์ก่อนจึงจะใช้เซสชันได้
"available": คุณสร้างเซสชันได้ทันที

API บางรายการต้องมีตัวเลือกเพิ่มเติมเมื่อเรียกความพร้อม เช่น Prompt API กำหนดให้ต้องประกาศการรองรับภาษา

// Makes sure the model is available for English and Japanese.
await LanguageModel.availability({ languages: ["en", "ja"] });

การเปิดใช้งานผู้ใช้

หากอุปกรณ์รองรับ API ของ AI ในตัว แต่ยังไม่ได้ดาวน์โหลดโมเดล ผู้ใช้ต้องโต้ตอบกับหน้าเว็บของคุณอย่างมีความหมายเพื่อให้แอปพลิเคชันของคุณเริ่มเซสชันด้วย create()

ใช้พร็อพเพอร์ตี้ UserActivation.isActive เพื่อยืนยันว่าผู้ใช้โต้ตอบกับหน้าเว็บโดยตรงตั้งแต่หน้าเว็บ โหลดเสร็จแล้ว ซึ่งอาจรวมถึงการแตะ การคลิก การกดแป้น mousedown หรือ เหตุการณ์การเปิดใช้งานแบบติดหนึบอื่นๆ

// Check for user activation.
if (navigator.userActivation.isActive) {
  // Create an instance of a built-in API
}

ตัวอย่างเช่น เมื่อใช้ Summarizer API คุณสามารถ ขอให้ผู้ใช้โต้ตอบกับปุ่มที่ระบุว่า "สรุป" เพื่อเปิดใช้งาน Summarizer.create() หรือคุณจะสร้างตัวสรุปเมื่อผู้ใช้เริ่ม พิมพ์ ซึ่งเป็นเหตุการณ์ keydown ก็ได้

ใช้ API ใน localhost

API ทั้งหมดพร้อมใช้งานใน localhost ใน Chrome

ไปที่ chrome://flags/#optimization-guide-on-device-model
เลือกเปิดใช้
คลิกเปิดอีกครั้งหรือรีสตาร์ท Chrome

สำหรับ API ที่ใช้ Gemini Nano คุณต้องตั้งค่า chrome://flags/#prompt-api-for-gemini-nanoเป็นเปิดใช้หรือ เปิดใช้แบบหลายภาษาด้วย คุณสามารถยืนยันว่าโมเดลได้ดาวน์โหลดและทำงาน ตามที่ต้องการในคอนโซล DevTools เรียกใช้ await LanguageModel.availability(); ในคอนโซล

แก้ปัญหา localhost

หากฟีเจอร์ทดลองไม่ปรากฏใน chrome://flags ให้ตรวจสอบว่าคุณได้ดาวน์โหลด Chrome เวอร์ชันล่าสุดแล้ว

หากโมเดลทำงานไม่เป็นไปตามที่คาดไว้ ให้ทำตามขั้นตอนต่อไปนี้

รีสตาร์ท Chrome
ไปที่ chrome://on-device-internals
เลือกแท็บสถานะโมเดลและตรวจสอบว่าไม่มีข้อผิดพลาด
เปิดเครื่องมือสำหรับนักพัฒนาเว็บแล้วพิมพ์ LanguageModel.availability(); ลงในคอนโซล ซึ่งควรแสดงผลเป็น available

หากจำเป็น ให้รอสักครู่แล้วทำตามขั้นตอนเหล่านี้ซ้ำ

กระบวนการมาตรฐาน

เรากำลังดำเนินการเพื่อกำหนดมาตรฐาน API เหล่านี้ เพื่อให้ทำงานได้ในทุกเบราว์เซอร์ ซึ่งหมายความว่าเราได้เสนอ API ให้กับ ชุมชนแพลตฟอร์มเว็บ และย้าย API ไปยัง W3C Web Incubator Community Group เพื่อหารือเพิ่มเติม

เราขอความคิดเห็นจาก W3C, Mozilla และ WebKit สำหรับ API แต่ละรายการ

มีส่วนร่วมและแชร์ความคิดเห็น

หากคุณลองใช้ AI ในตัวและมีความคิดเห็น โปรดแจ้งให้เราทราบ

ดู AI API ในตัวทั้งหมด
เข้าร่วมโปรแกรมเวอร์ชันตัวอย่างก่อนเปิดตัว เพื่อดู API ใหม่ๆ ก่อนใครและเข้าถึงรายชื่ออีเมลของเรา
หากมีความคิดเห็นเกี่ยวกับการใช้งานของ Chrome โปรดรายงานข้อบกพร่อง Chromium
ดูข้อมูลเกี่ยวกับมาตรฐานเว็บ