প্রকাশিত: ডিসেম্বর 12, 2024, সর্বশেষ আপডেট: 20 মে, 2025
অন্তর্নির্মিত AI API এর সাথে, আপনার ওয়েব অ্যাপ্লিকেশনটি নিজস্ব AI মডেল স্থাপন বা পরিচালনার প্রয়োজন ছাড়াই AI-চালিত কাজগুলি সম্পাদন করতে পারে৷ আমরা ব্রাউজার জুড়ে এই APIগুলিকে মানক করার জন্য কাজ করছি৷
প্রয়োজনীয়তা
অন্তর্নির্মিত AI ব্যবহার করার জন্য, মডেল এবং হার্ডওয়্যার প্রয়োজনীয়তা আছে।
মডেল
অনুবাদক এবং ভাষা আবিষ্কারক এপিআই বিশেষজ্ঞ মডেল ব্যবহার করে। অন্যান্য সমস্ত API একটি ভাষা মডেল ব্যবহার করে, যা ডেস্কটপ এবং ল্যাপটপে স্থানীয়ভাবে চালানোর জন্য ডিজাইন করা হয়েছে।
Summarizer API, Writer API, Rewriter API, এবং Proofreader API, শুধুমাত্র টেক্সট-টু-টেক্সট মোডালিটি সমর্থন করে। প্রম্পট API-এর মাল্টিমোডাল ক্ষমতা রয়েছে ।
ক্রোমে জেমিনি ন্যানো
ক্রোমে, ভাষার মডেল জেমিনি ন্যানো। জেমিনি ন্যানো মোবাইল ডিভাইসে উপলব্ধ নয়৷
Chrome 140 থেকে, Gemini Nano ইনপুট এবং আউটপুট পাঠ্যের জন্য ইংরেজি, স্প্যানিশ এবং জাপানি সমর্থন করে।
আপনি বিল্ট-ইন AI API ব্যবহার করার আগে, Google-এর জেনারেটিভ AI নিষিদ্ধ ব্যবহারের নীতি স্বীকার করুন।
হার্ডওয়্যার
নিম্নলিখিত প্রয়োজনীয়তাগুলি বিকাশকারী এবং ব্যবহারকারীদের জন্য বিদ্যমান যারা Chrome-এ এই APIগুলি ব্যবহার করে বৈশিষ্ট্যগুলি পরিচালনা করে৷ অন্যান্য ব্রাউজারগুলির বিভিন্ন অপারেটিং প্রয়োজনীয়তা থাকতে পারে।
ল্যাঙ্গুয়েজ ডিটেক্টর এবং ট্রান্সলেটর এপিআই ডেস্কটপে Chrome-এ কাজ করে। এই APIগুলি মোবাইল ডিভাইসে কাজ করে না। প্রম্পট এপিআই, সামারাইজার এপিআই, রাইটার এপিআই, রিরাইটার এপিআই, এবং প্রুফরিডার এপিআই Chrome-এ কাজ করে যখন নিম্নলিখিত শর্তগুলি পূরণ হয়:
- অপারেটিং সিস্টেম : উইন্ডোজ 10 বা 11; macOS 13+ (ভেন্টুরা এবং তার পরে); লিনাক্স; অথবা ChromeOS (প্ল্যাটফর্ম 16389.0.0 এবং পরবর্তীতে) Chromebook Plus ডিভাইসে। অ-Chromebook প্লাস ডিভাইসে Android, iOS এবং ChromeOS-এর জন্য Chrome এখনও জেমিনি ন্যানো ব্যবহার করে এমন API দ্বারা সমর্থিত নয়৷
- সঞ্চয়স্থান : আপনার Chrome প্রোফাইলে থাকা ভলিউমে কমপক্ষে 22 GB খালি স্থান।
- GPU : কঠোরভাবে 4 GB এর বেশি VRAM।
- নেটওয়ার্ক : সীমাহীন ডেটা বা একটি আনমিটার সংযোগ।
ব্রাউজার মডেল আপডেট করার সাথে সাথে জেমিনি ন্যানো এর সঠিক আকার পরিবর্তিত হতে পারে। বর্তমান আকার নির্ধারণ করতে, chrome://on-device-internals
যান৷
নির্মাণ শুরু করুন
উন্নয়নের বিভিন্ন পর্যায়ে বেশ কিছু অন্তর্নির্মিত AI API পাওয়া যায় । কিছু ক্রোম স্থিতিশীল, কিছু মূল ট্রায়ালের উপলব্ধ অংশগ্রহণকারী, এবং অন্যরা শুধুমাত্র প্রারম্ভিক পূর্বরূপ প্রোগ্রাম অংশগ্রহণকারীদের জন্য উপলব্ধ৷
স্থানীয় প্রোটোটাইপিং এবং উৎপত্তি ট্রায়াল সহ উত্পাদন পরিবেশ উভয় ক্ষেত্রেই মডেলটি শুরু করতে এবং ডাউনলোড করার জন্য প্রতিটি API-এর নিজস্ব নির্দেশাবলীর সেট রয়েছে।
- অনুবাদক API
- ভাষা সনাক্তকারী API
- সামারাইজার API
- Writer API এবং Rewriter API
- প্রুফরিডার API
- প্রম্পট API
ক্রোম এক্সটেনশন তৈরি করার সময় এই সমস্ত API ব্যবহার করা যেতে পারে।
মডেল ডাউনলোড
এপিআইগুলি ক্রোমে তৈরি করা হয়েছে, যেমন মডেলগুলি। প্রথমবার যখন একজন ব্যবহারকারী এই APIগুলির সাথে ইন্টারঅ্যাক্ট করে, মডেলটি অবশ্যই ব্রাউজারে ডাউনলোড করতে হবে।
একটি API ব্যবহারযোগ্য এবং প্রস্তুত কিনা তা নির্ধারণ করতে, অ্যাসিঙ্ক্রোনাস availability()
ফাংশনটি কল করুন, যা নিম্নলিখিত মানগুলির একটির সাথে একটি প্রতিশ্রুতি প্রদান করে:
-
"unavailable"
: ব্যবহারকারীর ডিভাইস বা অনুরোধ করা সেশন বিকল্পগুলি সমর্থিত নয়৷ ডিভাইসের অপর্যাপ্ত শক্তি বা ডিস্ক স্থান থাকতে পারে। -
"downloadable"
: একটি সেশন তৈরি করার জন্য অতিরিক্ত ডাউনলোডের প্রয়োজন, যার মধ্যে একটি বিশেষজ্ঞ মডেল, একটি ভাষা মডেল, বা ফাইন-টিউনিং অন্তর্ভুক্ত থাকতে পারে।create()
কল করার জন্য ব্যবহারকারীর সক্রিয়করণের প্রয়োজন হতে পারে। -
"downloading"
: ডাউনলোডগুলি চলছে এবং আপনি একটি সেশন ব্যবহার করার আগে অবশ্যই সম্পূর্ণ করতে হবে৷ -
"available"
: আপনি অবিলম্বে একটি সেশন তৈরি করতে পারেন।
ব্যবহারকারী সক্রিয়করণ
যদি ডিভাইসটি অন্তর্নির্মিত AI API সমর্থন করতে পারে, কিন্তু মডেলটি এখনও উপলব্ধ না হয়, create()
এর সাথে একটি সেশন শুরু করার জন্য একটি ব্যবহারকারীর ইন্টারঅ্যাকশন প্রয়োজন।
ব্যবহারকারী সক্রিয়করণ নিশ্চিত করতে UserActivation.isActive
প্রপার্টি ব্যবহার করুন, যা একটি ক্লিক, ট্যাপ বা কী প্রেস হতে পারে।
// Check for user activation.
if (navigator.userActivation.isActive) {
// Create an instance of a built-in API
}
উদাহরণ স্বরূপ Summarizer API-এর সাথে, আপনি ব্যবহারকারীদেরকে Summarizer.create()
সক্রিয় করতে "সারসংক্ষেপ" বলে বোতামের সাথে ইন্টারঅ্যাক্ট করতে বলতে পারেন।
লোকালহোস্টে API ব্যবহার করুন
সমস্ত API গুলি ক্রোমের localhost
উপলব্ধ।
-
chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
যান। - সক্রিয় নির্বাচন করুন।
- পুনরায় চালু করুন বা Chrome পুনরায় চালু করুন ক্লিক করুন।
নিশ্চিত করতে জেমিনি ন্যানো ডাউনলোড হয়েছে এবং উদ্দেশ্য অনুযায়ী কাজ করে, DevTools খুলুন এবং টাইপ করুন await LanguageModel.availability();
কনসোলে এই available
ফিরে আসা উচিত.
স্থানীয় হোস্টের সমস্যা সমাধান করুন
যদি মডেলটি প্রত্যাশিত হিসাবে কাজ না করে তবে এই পদক্ষেপগুলি অনুসরণ করুন:
- Chrome পুনরায় চালু করুন।
-
chrome://on-device-internals
এ যান। - মডেল স্ট্যাটাস ট্যাবটি নির্বাচন করুন এবং নিশ্চিত করুন যে কোনও ত্রুটি নেই।
- DevTools খুলুন এবং
LanguageModel.availability();
কনসোলে এইavailable
ফিরে আসা উচিত.
যদি প্রয়োজন হয়, কিছু সময় অপেক্ষা করুন এবং এই পদক্ষেপগুলি পুনরাবৃত্তি করুন।
মান প্রক্রিয়া
আমরা এই APIগুলিকে মানক করার জন্য কাজ করছি, যাতে তারা সমস্ত ব্রাউজারে কাজ করে৷ এর মানে আমরা ওয়েব প্ল্যাটফর্ম সম্প্রদায়ের কাছে API গুলি প্রস্তাব করেছি, এবং আরও আলোচনার জন্য সেগুলিকে W3C ওয়েব ইনকিউবেটর কমিউনিটি গ্রুপে স্থানান্তরিত করেছি৷
আমরা প্রতিটি API-এর জন্য W3C, Mozilla, এবং WebKit থেকে প্রতিক্রিয়ার অনুরোধ করছি।
জড়িত এবং মতামত শেয়ার করুন
আপনি যদি বিল্ট-ইন AI চেষ্টা করেন এবং প্রতিক্রিয়া জানান, আমরা এটি শুনতে চাই।
- সমস্ত অন্তর্নির্মিত AI APIs আবিষ্কার করুন।
- নতুন এপিআই এবং আমাদের মেলিং তালিকায় অ্যাক্সেসের জন্য প্রাথমিক পূর্বরূপ প্রোগ্রামে যোগ দিন ।
- Chrome এর বাস্তবায়ন সম্পর্কে আপনার মতামত থাকলে, একটি Chromium বাগ ফাইল করুন।
- ওয়েব স্ট্যান্ডার্ড সম্পর্কে জানুন।