Gemini Nano با Google AI Edge SDK

در دستگاه‌های مجهز به اندروید پشتیبانی‌شده، می‌توانید بدون نیاز به اتصال شبکه یا ارسال داده به فضای ابری، تجربه‌های غنی از هوش مصنوعی تولید کنید. هوش مصنوعی روی دستگاه یک راه حل عالی برای موارد استفاده است که در آن تأخیر کم، هزینه کم و حفاظت از حریم خصوصی نگرانی های اصلی شما هستند.

برای موارد استفاده روی دستگاه، می‌توانید از مدل پایه نانو Gemini گوگل استفاده کنید. در حالی که از دیگر مدل‌های Gemini که استنتاج را در فضای ابری اجرا می‌کنند، کوچک‌تر است، می‌توانید Gemini Nano را برای انجام وظایف تخصصی و همچنین همتایان بزرگ‌تر آن به‌خوبی تنظیم کنید. Gemini Nano در سرویس سیستم AICore اندروید اجرا می‌شود که از سخت‌افزار دستگاه برای فعال کردن تأخیر استنتاج کم استفاده می‌کند و مدل را به‌روز نگه می‌دارد.

دسترسی به Gemini Nano API و AICore توسط Google AI Edge SDK ارائه شده است. Google AI Edge مجموعه ای جامع از ابزارها برای ML روی دستگاه است. درباره Google AI Edge بیشتر بیاموزید .

معماری

به عنوان یک ماژول در سطح سیستم، شما از طریق یک سری API به AICore دسترسی دارید تا استنتاج را روی دستگاه اجرا کنید. علاوه بر این، AICore دارای چندین ویژگی ایمنی داخلی است که ارزیابی کامل را در برابر فیلترهای ایمنی ما تضمین می کند. نمودار زیر نحوه دسترسی یک برنامه به AICore را برای اجرای Gemini Nano بر روی دستگاه نشان می دهد.

Google AI Edge SDK، AICore و Gemini Nano.
شکل 1. Google AI Edge SDK، AICore و Gemini Nano.

داده های کاربر را خصوصی و ایمن نگه دارید

هوش مصنوعی مولد روی دستگاه، درخواست‌ها را به صورت محلی اجرا می‌کند و تماس‌های سرور را حذف می‌کند. این رویکرد با حفظ داده‌های حساس در دستگاه، حریم خصوصی را افزایش می‌دهد، عملکرد آفلاین را فعال می‌کند و هزینه‌های استنتاج را کاهش می‌دهد.

AICore به اصول Private Compute Core با ویژگی های کلیدی زیر پایبند است:

اتصال بسته محدود : AICore از اکثر بسته‌های دیگر جدا شده است، با استثناهای محدود برای بسته‌های سیستمی خاص. هر گونه تغییر در این لیست مجاز فقط می تواند در طول یک به روز رسانی کامل Android OTA رخ دهد.

دسترسی غیر مستقیم به اینترنت : AICore دسترسی مستقیم به اینترنت ندارد. همه درخواست‌های اینترنتی، از جمله بارگیری‌های مدل، از طریق APK منبع باز Private Compute Services هدایت می‌شوند. APIها در سرویس‌های محاسباتی خصوصی باید به صراحت ماهیت حریم‌محوری خود را نشان دهند.

علاوه بر این، AICore برای جداسازی هر درخواست ساخته شده است و هیچ رکوردی از داده های ورودی یا خروجی های حاصل را پس از پردازش آنها ذخیره نمی کند تا از حریم خصوصی کاربر محافظت کند. برای کسب اطلاعات بیشتر، پست وبلاگ مقدمه ای بر حریم خصوصی و ایمنی برای Gemini Nano را بخوانید.

تصویری از معماری AICore
شکل 2. معماری AICore

مزایای دسترسی به مدل های پایه هوش مصنوعی با AICore

AICore سیستم عامل اندروید را قادر می سازد تا مدل های پایه هوش مصنوعی را ارائه و مدیریت کند. این به طور قابل توجهی هزینه استفاده از این مدل های بزرگ را در برنامه شما کاهش می دهد، عمدتاً به دلیل موارد زیر:

سهولت استقرار : AICore توزیع Gemini Nano را مدیریت می کند و به روز رسانی های آینده را مدیریت می کند. نیازی نیست نگران دانلود یا به‌روزرسانی مدل‌های بزرگ از طریق شبکه باشید، و نه تأثیری بر دیسک برنامه و بودجه حافظه زمان اجراتان داشته باشید.

استنتاج تسریع شده : AICore از سخت افزار روی دستگاه برای تسریع استنتاج استفاده می کند. برنامه شما در هر دستگاه بهترین عملکرد را دارد و نیازی نیست نگران رابط های سخت افزاری زیرین باشید.

قابلیت پشتیبانی شده

AICore از دستگاه ها و روش های زیر پشتیبانی می کند:

  • دستگاه های پشتیبانی شده : AICore در حال حاضر در دستگاه های سری Pixel 9، دستگاه های Google Pixel 8 Series از جمله Pixel 8 1 و Pixel 8a 2 ، دستگاه های سری S24 Samsung، Samsung Z Fold6، Samsung Z Flip6، Realme GT 6، Motorola Edge 50 Ultra، Motorola در دسترس است. Razr 50 Ultra، Xiaomi 14T/Pro و Xiaomi MIX Flip.
  • روش های پشتیبانی شده : AICore در حال حاضر از حالت متن برای Gemini Nano پشتیبانی می کند.

دستگاه های اضافی و پشتیبانی مدالیته حوزه های سرمایه گذاری فعال هستند.

موارد استفاده کنید

با توجه به محدودیت منابع دستگاه های تلفن همراه در مقایسه با سرورهای ابری، مدل های هوش مصنوعی مولد روی دستگاه با تمرکز بر کارایی و اندازه طراحی شده اند. این بهینه سازی وظایف خاص و به خوبی تعریف شده را بر برنامه های عمومی تر اولویت می دهد. موارد استفاده مناسب عبارتند از:

  • بازنویسی متن : لحن و سبک متن را تغییر دهید (به عنوان مثال، گاه به گاه به رسمی).
  • پاسخ هوشمند : پاسخ های مرتبط با زمینه را در یک موضوع چت ایجاد کنید.
  • تصحیح : شناسایی و تصحیح اشتباهات املایی و دستوری.
  • خلاصه سازی : اسناد طولانی را به خلاصه های مختصر (بند یا نقاط گلوله) متراکم کنید.

برای عملکرد بهینه، به مستندات راهبردهای محرک مراجعه کنید. برای کشف این موارد استفاده از نزدیک، برنامه نمونه ما را دانلود کنید و آزمایش Gemini Nano را آغاز کنید.

Gemini Nano توسط چندین برنامه گوگل استفاده می شود. برخی از نمونه ها عبارتند از:

  • Talkback: برنامه دسترس‌پذیری Android Talkback از قابلیت‌های ورودی چندوجهی Gemini Nano برای بهبود توضیحات تصویر برای کاربران کم بینا استفاده می‌کند.
  • Pixel Voice Recorder: برنامه Pixel Voice Recorder از Gemini Nano و AICore برای روشن کردن ویژگی خلاصه‌سازی روی دستگاه استفاده می‌کند. تیم Recorder جدیدترین مدل Gemini Nano را برای پشتیبانی از ضبط‌های طولانی‌تر و ارائه خلاصه‌های با کیفیت بالاتر به کار برد.
  • Gboard: پاسخ هوشمند Gboard از Gemini Nano روی دستگاه با AICore برای ارائه پاسخ‌های هوشمند دقیق استفاده می‌کند.

  1. Gemini Nano را می توان در دستگاه های پیکسل 8 به عنوان یک گزینه توسعه دهنده فعال کرد.

  2. Gemini Nano را می توان در دستگاه های Pixel 8a به عنوان یک گزینه توسعه دهنده فعال کرد.