आर्टिफ़िशियल इंटेलिजेंस (एआई) में कई जटिल और नई टेक्नोलॉजी शामिल हैं. पहले इन टेक्नोलॉजी के लिए इंसानी इनपुट की ज़रूरत होती थी, लेकिन अब इन्हें कंप्यूटर की मदद से पूरा किया जा सकता है. सामान्य तौर पर, एआई एक ऐसा प्रोग्राम या मॉडल है जो इंसानों के लिए नहीं बनाया गया है. यह समस्याओं को हल करने और क्रिएटिविटी दिखाने के लिए कई तरह के काम कर सकता है.
एआई शब्द का इस्तेमाल अक्सर आर्टिफ़िशियल इंटेलिजेंस के क्षेत्र में अलग-अलग तरह की टेक्नोलॉजी को दिखाने के लिए किया जाता है. हालांकि, इनके स्कोप में काफ़ी अंतर हो सकता है.
आर्टिफ़िशियल इंटेलिजेंस और मशीन लर्निंग को समझने के लिए, कई शब्द और कॉन्सेप्ट हैं. ये आपके काम आ सकते हैं. यहां आपको Chrome के दस्तावेज़ में इस्तेमाल होने वाले सामान्य शब्द मिलेंगे. इनमें सबसे अहम, क्लाइंट-साइड एआई से जुड़े शब्द हैं.
क्लाइंट-साइड एआई
वेब पर मौजूद ज़्यादातर एआई सुविधाएं, सर्वर पर काम करती हैं. हालांकि, क्लाइंट-साइड एआई, उपयोगकर्ता के ब्राउज़र में काम करता है और उपयोगकर्ता के डिवाइस पर अनुमान लगाता है. इसके कई फ़ायदे हैं. जैसे, कम समय में डेटा प्रोसेस होना, सुविधाओं को बनाने में कम लागत लगना, उपयोगकर्ता की निजता बढ़ना, और ऑफ़लाइन ऐक्सेस.
क्लाइंट-साइड एआई, छोटे और ऑप्टिमाइज़ किए गए मॉडल पर काम करता है. ये मॉडल परफ़ॉर्मेंस के लिए ऑप्टिमाइज़ किए जाते हैं. ऐसा हो सकता है कि ये मॉडल, सर्वर साइड के बड़े मॉडल से बेहतर परफ़ॉर्म करें. अपने इस्तेमाल के उदाहरण का आकलन करें, ताकि यह तय किया जा सके कि आपके लिए कौनसा समाधान सही है.
पहले से मौजूद एआई
पहले से मौजूद एआई, क्लाइंट-साइड एआई का एक रूप है. इसमें छोटे मॉडल, ब्राउज़र में पहले से मौजूद होते हैं. Chrome के लिए, इसमें Gemini Nano और एक्सपर्ट मॉडल शामिल हैं. इन मॉडल को डाउनलोड करने के बाद, एआई की सुविधा का इस्तेमाल करने वाली सभी वेबसाइटें और वेब ऐप्लिकेशन, डाउनलोड करने में लगने वाले समय को छोड़कर सीधे तौर पर सुविधा को लागू करने और लोकल इन्फ़रेंस पर जा सकते हैं.
एआई की सुविधा वाले एपीआई को इस तरह से डिज़ाइन किया गया है कि वे टास्क के लिए सही मॉडल के हिसाब से अनुमान लगा सकें. उदाहरण के लिए, Prompt API, किसी भाषा मॉडल के आधार पर अनुमान लगाता है. वहीं, Translator API, पहले से मौजूद किसी एक्सपर्ट मॉडल के आधार पर अनुमान लगाता है.
सर्वर-साइड एआई
सर्वर-साइड एआई में, क्लाउड-आधारित एआई सेवाएं शामिल होती हैं. Gemini 1.5 Pro को क्लाउड पर चलने वाला एक ऐप्लिकेशन समझें. ये मॉडल, काफ़ी बड़े और ज़्यादा असरदार होते हैं. यह बात खास तौर पर लार्ज लैंग्वेज मॉडल पर लागू होती है.
हाइब्रिड एआई
हाइब्रिड एआई का मतलब ऐसे किसी भी समाधान से है जिसमें क्लाइंट और सर्वर, दोनों कॉम्पोनेंट शामिल हों. उदाहरण के लिए:
- क्लाइंट-साइड मॉडल, जो सर्वर-साइड मॉडल पर फ़ॉलबैक करते हैं. इन्हें उन कामों के लिए बनाया जाता है जिन्हें डिवाइस पर असरदार तरीके से पूरा नहीं किया जा सकता.
- ऐसा हो सकता है कि डिवाइस पर ज़रूरी संसाधन उपलब्ध न हों.
- मॉडल या एपीआई सिर्फ़ कुछ एनवायरमेंट में उपलब्ध है.
- सुरक्षा के लिए, क्लाइंट और सर्वर के बीच मॉडल को बांटा जाता है.
- उदाहरण के लिए, किसी मॉडल को इस तरह से बांटा जा सकता है कि 75% काम क्लाइंट पर हो और बाकी 25% सर्वर पर हो. इससे क्लाइंट-साइड के फ़ायदे मिलते हैं. साथ ही, मॉडल के कुछ हिस्से को डिवाइस से बाहर रखने की अनुमति मिलती है, ताकि वह निजी बना रहे.
Prompt API का इस्तेमाल करके, Firebase AI Logic के साथ हाइब्रिड आर्किटेक्चर सेट अप किया जा सकता है.
जनरेटिव एआई
जनरेटिव एआई, मशीन लर्निंग का एक फ़ॉर्म है. यह लोगों को ऐसा कॉन्टेंट बनाने में मदद करता है जो इंसानों के बनाए कॉन्टेंट जैसा लगता है. जनरेटिव एआई, भाषा मॉडल का इस्तेमाल करके डेटा को व्यवस्थित करता है. साथ ही, दिए गए कॉन्टेक्स्ट के आधार पर टेक्स्ट, इमेज, वीडियो, और ऑडियो बनाता है या उनमें बदलाव करता है. जनरेटिव एआई, पैटर्न मैच करने और अनुमान लगाने से आगे बढ़कर काम करता है.
लार्ज लैंग्वेज मॉडल (एलएलएम) में कई (अरबों तक) पैरामीटर होते हैं. इनका इस्तेमाल करके, कई तरह के टास्क किए जा सकते हैं. जैसे, टेक्स्ट या इमेज जनरेट करना, उन्हें कैटगरी में बांटना या उनकी खास जानकारी देना.
स्मॉल लैंग्वेज मॉडल (एसएलएम) में, एक जैसे टास्क पूरे करने के लिए पैरामीटर की संख्या काफ़ी कम होती है. साथ ही, इसे क्लाइंट-साइड पर इस्तेमाल किया जा सकता है.
नैचुरल लैंग्वेज प्रोसेसिंग (एनएलपी)
नैचुरल लैंग्वेज प्रोसेसिंग, मशीन लर्निंग की एक क्लास है. इसका मकसद, कंप्यूटर को इंसानों की भाषा समझने में मदद करना है. इसमें किसी भाषा के नियमों से लेकर, लोगों के इस्तेमाल किए जाने वाले खास शब्द, बोलियां, और स्लैंग शामिल हैं.
एजेंट या एआई एजेंट
एजेंट एक ऐसा सॉफ़्टवेयर होता है जो उपयोगकर्ता की ओर से किसी टास्क को पूरा करने के लिए, अपने-आप कार्रवाइयों की एक सीरीज़ प्लान करता है और उन्हें लागू करता है. साथ ही, यह अपने एनवायरमेंट में होने वाले बदलावों के हिसाब से खुद को ढालता है. कार्रवाइयों में एपीआई फ़ंक्शन या डेटाबेस क्वेरी शामिल हो सकती हैं. ये कार्रवाइयां, वेबपेज पर या तीसरे पक्ष के ऐप्लिकेशन के ज़रिए की जाती हैं. जैसे, Project Mariner.
चैटबॉट, एजेंट नहीं होता है. चैटबॉट, किसी मैसेंजर (चाहे वह इंसान हो या कोई और) को जवाब देता है. साथ ही, यह सवालों के जवाब जैसे कॉन्टेंट को जनरेट करने के लिए, किसी मॉडल पर निर्भर होता है. वहीं, एजेंट किसी टास्क को पूरा करने के लिए, टूल या डेटाबेस के साथ इंटरैक्ट करता है.
अन्य संसाधन
अगर आपने वेब पर एआई का इस्तेमाल पहली बार किया है, तो web.dev पर एआई से जुड़े संसाधनों का हमारा कलेक्शन देखें.