قبل از اینکه با هوش مصنوعی بسازید، باید پلتفرمی را که روی آن میزبانی میشود انتخاب کنید. انتخاب شما بر سرعت، هزینه، مقیاسپذیری و قابلیت اعتماد سیستم هوش مصنوعی شما تأثیر میگذارد. میتوانید بین موارد زیر یکی را انتخاب کنید:
- هوش مصنوعی سمت کلاینت : مستقیماً در مرورگر اجرا میشود. این بدان معناست که دادهها میتوانند به صورت خصوصی، روی دستگاه کاربر باقی بمانند و هیچ تأخیر شبکهای وجود ندارد. با این حال، برای عملکرد خوب، هوش مصنوعی سمت کلاینت به موارد استفاده بسیار خاص و تعریفشدهای نیاز دارد.
- هوش مصنوعی سمت سرور : در فضای ابری اجرا میشود. بسیار توانمند و مقیاسپذیر است، اما از نظر تأخیر و هزینه، گرانتر است.
هر گزینه با بدهبستانهایی همراه است و تنظیم مناسب به مورد استفاده، مهارتهای تیمی و منابع شما بستگی دارد. به عنوان مثال، ممکن است یک ابزار خلاصهسازی ارائه دهید که به صورت محلی اجرا میشود تا کاربران بتوانند بدون نیاز به مدیریت اطلاعات شخصی قابل شناسایی (PII) سوالات شخصی خود را بپرسند. با این حال، یک نماینده پشتیبانی مشتری میتواند با استفاده از یک مدل مبتنی بر ابر که به پایگاه داده بزرگی از منابع دسترسی دارد، پاسخهای مفیدتری ارائه دهد.
در این ماژول، شما یاد میگیرید که چگونه:
- مقایسهی بدهبستانهای بین هوش مصنوعی سمت کلاینت و سمت سرور.
- پلتفرم خود را با مورد استفاده و قابلیتهای تیم خود مطابقت دهید.
- سیستمهای ترکیبی طراحی کنید که هوش مصنوعی را هم روی کلاینت و هم روی سرور ارائه میدهند تا با محصول شما رشد کنند.
برای استقرار، پلتفرمهای هوش مصنوعی را در دو محور اصلی در نظر بگیرید. میتوانید موارد زیر را انتخاب کنید:
- محل اجرای مدل : آیا سمت کلاینت اجرا میشود یا سمت سرور؟
- قابلیت سفارشیسازی : چقدر بر دانش و قابلیتهای مدل کنترل دارید؟ اگر بتوانید مدل را کنترل کنید، به این معنی که بتوانید وزنهای مدل را تغییر دهید، میتوانید رفتار آن را برای برآورده کردن نیازهای خاص خود سفارشی کنید.
هوش مصنوعی سمت کلاینت در مرورگر اجرا میشود و محاسبات به صورت محلی روی دستگاه کاربر انجام میشود. نیازی به فراهم کردن محاسبات زمان استنتاج نیست و دادهها روی دستگاه کاربر باقی میمانند. این امر آن را سریع، خصوصی و مناسب برای تجربیات سبک و تعاملی میکند.
با این حال، مدلهای سمت کلاینت معمولاً بسیار کوچک هستند که میتواند قابلیتها و عملکرد آنها را محدود کند. آنها برای کارهای بسیار تخصصی، مانند تشخیص سمیت یا تحلیل احساسات، مناسبترین هستند. اغلب، اینها وظایف پیشبینی هوش مصنوعی با فضای خروجی محدود هستند.
دو گزینه اصلی وجود دارد:
- هوش مصنوعی داخلی : مرورگرهایی مانند گوگل کروم و مایکروسافت اج ، مدلهای هوش مصنوعی را در خود جای دادهاند. این مدلها از طریق فراخوانیهای جاوا اسکریپت و بدون نیاز به راهاندازی یا میزبانی قابل دسترسی هستند. پس از دانلود مدل، تمام وبسایتهایی که از آن استفاده میکنند میتوانند آن را فراخوانی کنند.
- مدلهای سفارشی : شما میتوانید از کتابخانههای سمت کلاینت، مانند Transformers.js و MediaPipe ، برای ادغام مدلها در برنامه خود استفاده کنید. این بدان معناست که میتوانید وزنهای مدل را کنترل کنید. با این حال، این بدان معناست که هر کاربر وبسایت شما باید مدل سفارشی شما را دانلود کند. حتی کوچکترین مدلهای هوش مصنوعی نیز در چارچوب یک وبسایت بزرگ هستند .
با هوش مصنوعی سمت سرور، برنامه وب شما یک API را برای ارسال ورودی به مدل هوش مصنوعی و دریافت خروجیهای آن فراخوانی میکند. این تنظیمات از مدلهای بزرگتر و پیچیدهتر پشتیبانی میکند و مستقل از سختافزار کاربر است.
دو دسته برای هوش مصنوعی سمت سرور عبارتند از:
- سرویسهای مدیریتشده : اینها مدلهایی هستند که توسط یک شخص ثالث، مانند Gemini 3 و GPT-5، در مراکز داده میزبانی میشوند. مالک مدل، یک API برای دسترسی به آن ارائه میدهد. این بدان معناست که میتوانید از مدلهای پیشرفته با حداقل تنظیمات استفاده کنید. این مدلها برای نمونهسازی سریع، مکالمه آزاد و استدلال عمومی ایدهآل هستند. با این حال، مقیاسپذیری روی یک سرویس مدیریتشده میتواند گران باشد.
- مدلهای خود-میزبان : شما میتوانید مدلهای وزن-باز، مانند Gemma یا Llama، را در زیرساخت خود یا در یک کانتینر مدیریتشده، مانند Vertex AI یا Hugging Face Inference، مستقر کنید. این رویکرد به این معنی است که میتوانید از پیشآموزش انجامشده توسط سازنده مدل بهرهمند شوید، اما کنترل مدل، تنظیم دقیق دادهها و عملکرد را حفظ میکنید.
ویژگیهای معماری پلتفرمهای هوش مصنوعی را بررسی کنید و برای تصمیمگیری در مورد راهاندازی اولیه خود، بدهبستانها را تجزیه و تحلیل کنید.
با هر تصمیمی، باید مصالحه کنید. نگاهی به ویژگیهای کلیدی که هزینه و ارزش پلتفرم هوش مصنوعی شما را تعریف میکنند، بیندازید:
- قدرت مدل : اینکه مدل بدون تنظیم، در طیف وسیعی از کاربران و وظایف چقدر خوب عمل میکند. اغلب، این با اندازه مدل همبستگی دارد.
- قابلیت سفارشیسازی : میزانی که میتوانید رفتار و معماری مدل را به دقت تنظیم، اصلاح یا کنترل کنید.
- دقت : کیفیت کلی و قابلیت اطمینان پیشبینیها یا نسلهای مدل.
- حریم خصوصی : میزانی که دادههای کاربر محلی و تحت کنترل کاربر باقی میمانند.
- هزینه ثابت : هزینه تکرارشونده مورد نیاز برای راهاندازی سیستم هوش مصنوعی صرف نظر از میزان استفاده، شامل تأمین زیرساخت و نگهداری.
- هزینه به ازای هر درخواست : هزینه اضافی هر درخواست ورودی.
- سازگاری : این رویکرد چقدر در مرورگرها، دستگاهها و محیطهای مختلف بدون منطق fallback کار میکند.
- راحتی کاربر : اینکه آیا کاربران برای استفاده از سیستم هوش مصنوعی نیاز به انجام مراحل اضافی، مانند دانلود یک مدل، دارند یا خیر.
- راحتی توسعهدهنده : استقرار، ادغام و نگهداری مدل برای اکثر توسعهدهندگان، بدون تخصص تخصصی هوش مصنوعی، چقدر سریع و آسان است.
جدول زیر نمونهای از تخمینها برای میزان عملکرد هر پلتفرم در هر معیار را ارائه میدهد، که در آن ۱ کمترین و ۵ بیشترین عملکرد را نشان میدهد.
برای نشان دادن فرآیند تصمیمگیری، یک ویژگی دیگر به Example Shoppe، یک پلتفرم تجارت الکترونیک متوسط، اضافه خواهیم کرد. شما به صرفهجویی در هزینهها در خدمات مشتری در ساعات غیرکاری علاقهمند هستید، بنابراین تصمیم میگیرید یک دستیار مبتنی بر هوش مصنوعی بسازید تا به سوالات کاربران در مورد سفارشات، مرجوعیها و محصولات پاسخ دهد.
شما میتوانید طرح کلی سیستم هوش مصنوعی را که شامل فرصت و راهحل است، بررسی کنید.
سناریو را با استفاده از دو دیدگاه تحلیل کنید: الزامات مورد استفاده و محدودیتهای کسب و کار یا تیم.
| مورد نیاز | تحلیل | معیارها | پیامد |
| دقت بالا و تطبیق پذیری | کاربران سوالات پیچیده و متنوعی در مورد سفارشات، محصولات و مرجوعیها میپرسند. | قدرت مدل، دقت | به یک مدل زبان بزرگ (LLM) نیاز دارد. |
| ویژگی دادهها | باید به سوالات خاص مربوط به دادهها، محصولات و سیاستهای شرکت پاسخ دهد. | قابلیت سفارشیسازی | نیاز به دریافت داده دارد، مانند RAG، اما تنظیم دقیق مدل را شامل نمیشود. |
| مورد نیاز | تحلیل | معیارها | پیامد |
| پایگاه کاربر | صدها هزار کاربر. | مقیاسپذیری، سازگاری | به معماری نیاز دارد که ترافیک بالا و قابل اعتمادی را مدیریت کند. |
| تمرکز پس از راهاندازی | تیم پس از انتشار نسخه ۱ به پروژههای دیگر خواهد پرداخت. | تلاش برای تعمیر و نگهداری | به یک راه حل با حداقل نگهداری مداوم نیاز دارید. |
| تخصص تیمی | توسعهدهندگان وب قوی، تخصص محدود در هوش مصنوعی/یادگیری ماشین | راحتی توسعهدهنده | راهکار باید به راحتی و بدون نیاز به مهارتهای تخصصی هوش مصنوعی قابل پیادهسازی و ادغام باشد. |
اکنون که معیارهای خود را اولویتبندی کردهاید، میتوانید به جدول تخمین بدهبستان مراجعه کنید تا مشخص کنید کدام پلتفرم با معیارهای اولویتدار شما مطابقت دارد:
از این تفکیک مشخص است که شما باید از هوش مصنوعی سمت سرور و احتمالاً یک سرویس مدیریتشده استفاده کنید. این یک مدل همهکاره برای سوالات پیچیده مشتری ارائه میدهد. با واگذاری زیرساخت، کیفیت مدل و زمان آماده به کار به ارائهدهنده، تلاش برای نگهداری و توسعه را به حداقل میرساند.
اگرچه قابلیت سفارشیسازی محدود است، اما این یک معامله ارزشمند برای یک تیم توسعه وب با تجربه محدود در مهندسی مدل است.
یک تنظیم تولید افزوده بازیابی (RAG) میتواند به شما کمک کند تا زمینه مرتبط را در زمان استنتاج به مدل ارائه دهید.
سیستمهای هوش مصنوعی بالغ به ندرت بر روی یک پلتفرم واحد یا با یک مدل اجرا میشوند. در عوض، آنها بارهای کاری هوش مصنوعی را توزیع میکنند تا بدهبستانها را بهینه کنند.
پس از راهاندازی، باید الزامات خود را بر اساس دادهها و بازخوردهای واقعی اصلاح کنید. در مثال ما، Example Shoppe، چند ماه صبر میکنید تا نتایج را تجزیه و تحلیل کنید و موارد زیر را بیابید:
- حدود ۸۰٪ درخواستها تکراری هستند (مثلاً «سفارش من کجاست؟»، «چگونه میتوانم این را برگردانم؟»). ارسال این درخواستها به یک سرویس مدیریتشده، سربار و هزینه زیادی ایجاد میکند.
- تنها ۲۰٪ از درخواستها نیاز به استدلال عمیقتر و گفتگوی تعاملی و بدون محدودیت زمانی دارند.
یک مدل محلی سبک میتواند ورودیهای کاربر را طبقهبندی کند و به پرسشهای روتین، مانند «سیاست بازگشت شما چیست؟» پاسخ دهد. میتوانید سوالات پیچیده، نادر یا مبهم را به مدل سمت سرور هدایت کنید.
با پیادهسازی هوش مصنوعی هم در سمت سرور و هم در سمت کلاینت، میتوانید هزینهها و تأخیر را کاهش دهید، در عین حال که در صورت نیاز به استدلال قدرتمند دسترسی خواهید داشت.
برای ساخت این سیستم ترکیبی برای Example Shoppe، باید با تعریف سیستم پیشفرض شروع کنید. در این حالت، بهتر است از سمت کلاینت شروع کنید. برنامه باید در دو حالت به سمت هوش مصنوعی سمت سرور مسیریابی کند:
- بازگشت مبتنی بر سازگاری : اگر دستگاه یا مرورگر کاربر نتواند درخواست را مدیریت کند، باید به سرور پاسخ داده شود.
- ارتقاء مبتنی بر قابلیت : اگر درخواست برای مدل سمت کلاینت، طبق معیارهای از پیش تعیینشده، بیش از حد پیچیده یا نامشخص باشد، باید به یک مدل سمت سرور بزرگتر ارتقاء داده شود. میتوانید از یک مدل برای طبقهبندی درخواست به عنوان رایج استفاده کنید، بنابراین وظیفه سمت کلاینت یا غیرمعمول را انجام میدهید و درخواست را به سیستم سمت سرور ارسال میکنید. به عنوان مثال، اگر مدل سمت کلاینت تشخیص دهد که سوال مربوط به یک مسئله غیرمعمول است، مانند دریافت بازپرداخت با ارزی متفاوت.
توزیع حجم کار بین دو پلتفرم، شما را انعطافپذیرتر میکند، اما پیچیدگیهایی را نیز به همراه دارد:
- هماهنگی : دو محیط اجرا به معنای بخشهای متحرک بیشتر است. شما برای مسیریابی، تلاش مجدد و fallbackها به منطق نیاز دارید.
- نسخهبندی : اگر از یک مدل در پلتفرمهای مختلف استفاده میکنید، باید در هر دو محیط سازگار باقی بماند.
- مهندسی سریع و مهندسی زمینه : اگر از مدلهای مختلفی در هر پلتفرم استفاده میکنید، باید مهندسی سریع را برای هر کدام انجام دهید.
- نظارت : گزارشها و معیارها از هم جدا هستند و نیاز به تلاش بیشتری برای یکپارچهسازی دارند.
- امنیت : شما دو سطح حمله را حفظ میکنید. هم نقاط پایانی محلی و هم نقاط پایانی ابری نیاز به مقاومسازی دارند.
این هم یک نکتهی دیگر است که باید در نظر بگیرید. اگر تیم کوچکی دارید یا در حال ساخت یک ویژگی غیرضروری هستید، شاید نخواهید این پیچیدگی را اضافه کنید.
انتظار داشته باشید که انتخاب پلتفرم شما تکامل یابد. از مورد استفاده شروع کنید، با تجربه و منابع تیم خود هماهنگ شوید و با رشد محصول و بلوغ هوش مصنوعی خود، این روند را تکرار کنید. وظیفه شما این است که ترکیب مناسبی از سرعت، حریم خصوصی و کنترل را برای کاربران خود پیدا کنید، سپس با کمی انعطافپذیری بسازید. به این ترتیب، میتوانید با الزامات در حال تغییر سازگار شوید و از بهروزرسانیهای آینده پلتفرم و مدل بهرهمند شوید.
- از آنجایی که انتخاب پلتفرم و مدل به یکدیگر وابسته هستند، درباره انتخاب مدل بیشتر بخوانید.
- بخوانید که چگونه با هوش مصنوعی ترکیبی و سمت کلاینت، فراتر از فضای ابری بروید