تم تصميم هذا الدليل لمساعدتك في دمج حلول الذكاء الاصطناعي التوليدي وتعلُّم الآلة (AI/ML) من Google في تطبيقاتك. ويقدّم هذا الدليل إرشادات لمساعدتك في التعرّف على حلول الذكاء الاصطناعي وتعلُّم الآلة المختلفة المتاحة واختيار الحل الأنسب لاحتياجاتك. يهدف هذا المستند إلى مساعدتك في تحديد الأداة المناسبة لك وسبب اختيارها، وذلك من خلال التركيز على احتياجاتك وحالات الاستخدام.
لمساعدتك في اختيار حلّ الذكاء الاصطناعي/تعلُّم الآلة الأنسب لمتطلباتك المحدّدة، يتضمّن هذا المستند دليلًا للحلول. من خلال الإجابة عن سلسلة من الأسئلة حول أهداف مشروعك وقيوده، يرشدك الدليل إلى الأدوات والتقنيات الأنسب.
يساعدك هذا الدليل في اختيار أفضل حلّ للذكاء الاصطناعي لتطبيقك، ويجب أن تأخذ في الاعتبار العوامل التالية: نوع البيانات (نص أو صور أو ملفات صوتية أو فيديوهات) ومدى تعقيد المهمة (من التلخيص البسيط إلى المهام المعقدة التي تتطلّب معرفة متخصصة) وحجم البيانات (مدخلات قصيرة مقابل مستندات كبيرة). سيساعدك ذلك في تحديد ما إذا كنت تريد استخدام Gemini Nano على جهازك أو الذكاء الاصطناعي المستند إلى السحابة الإلكترونية من Firebase (Gemini Flash أو Gemini Pro).
الاستفادة من قوة الاستدلال على الجهاز فقط
عند إضافة ميزات تستند إلى الذكاء الاصطناعي وتعلُّم الآلة إلى تطبيق Android، يمكنك اختيار طرق مختلفة لتقديمها، إما على الجهاز أو باستخدام السحابة الإلكترونية.
تقدّم الحلول التي تعمل على الجهاز فقط، مثل Gemini Nano، نتائج بدون أي تكلفة إضافية، وتوفّر ميزات محسَّنة للخصوصية، وتتيح استخدام الجهاز بلا إنترنت بشكل موثوق، لأنّ بيانات الإدخال تتم معالجتها محليًا. ويمكن أن تكون هذه المزايا ضرورية في بعض حالات الاستخدام، مثل تلخيص الرسائل، ما يجعل المعالجة على الجهاز فقط أولوية عند اختيار الحلول المناسبة.
يتيح لك Gemini Nano إجراء الاستدلال مباشرةً على جهاز يعمل بنظام التشغيل Android. إذا كنت تعمل على نصوص أو صور أو مقاطع صوتية، ابدأ باستخدام واجهات برمجة التطبيقات المستندة إلى الذكاء الاصطناعي التوليدي في ML Kit للحصول على حلول جاهزة. تستند واجهات برمجة التطبيقات الخاصة بالذكاء الاصطناعي التوليدي في ML Kit إلى Gemini Nano، وتستفيد من AICore كخدمة أساسية تابعة لنظام التشغيل، كما أنّها معدَّلة بدقة لتنفيذ مهام معيّنة على الجهاز. تُعدّ واجهات برمجة التطبيقات المستندة إلى الذكاء الاصطناعي التوليدي في حزمة تعلّم الآلة مسارًا مثاليًا للإصدار العلني لتطبيقاتك، وذلك بفضل واجهتها ذات المستوى الأعلى وقابليتها للتوسّع. تتيح لك واجهات برمجة التطبيقات هذه إرسال طلبات بلغة طبيعية باستخدام نصوص وصور كمدخلات، ما يتيح مجموعة متنوعة من حالات الاستخدام، مثل فهم الصور والترجمات القصيرة والملخّصات الموجّهة وغير ذلك.
بالنسبة إلى مهام تعلُّم الآلة التقليدية، يمكنك تنفيذ نماذجك المخصّصة. نوفّر أدوات قوية مثل حزمة تعلّم الآلة وMediaPipe وLiteRT وميزات العرض في Google Play لتبسيط عملية التطوير.
بالنسبة إلى التطبيقات التي تتطلّب حلولاً متخصّصة للغاية، يمكنك استخدام نموذج مخصّص، مثل Gemma أو نموذج آخر مصمّم خصيصًا لحالة الاستخدام المحدّدة. يمكنك تشغيل النموذج مباشرةً على جهاز المستخدم باستخدام LiteRT، الذي يوفّر بنى نماذج مصمَّمة مسبقًا لتحسين الأداء.
يمكنك أيضًا التفكير في إنشاء حلّ مختلط من خلال الاستفادة من النماذج المتوفّرة على الجهاز والنماذج السحابية.
تستخدم التطبيقات على الأجهزة الجوّالة عادةً نماذج محلية لبيانات نصية صغيرة، مثل محادثات الدردشة أو مقالات المدونات. ومع ذلك، بالنسبة إلى مصادر البيانات الأكبر حجمًا (مثل ملفات PDF) أو عندما تكون هناك حاجة إلى معلومات إضافية، قد يكون من الضروري استخدام حلّ مستند إلى السحابة الإلكترونية يتضمّن نماذج Gemini أكثر فعالية.
دمج نماذج Gemini المتقدّمة
يمكن لمطوّري تطبيقات Android دمج إمكانات الذكاء الاصطناعي التوليدي المتقدّمة من Google، بما في ذلك نموذجا Gemini Pro وGemini Flash الفعّالان، في تطبيقاتهم باستخدام حزمة تطوير البرامج (SDK) الخاصة بـ Firebase AI Logic. تم تصميم حزمة تطوير البرامج (SDK) هذه لتلبية احتياجات البيانات الأكبر، وهي توفّر إمكانات وقدرة على التكيّف موسّعة من خلال إتاحة الوصول إلى نماذج الذكاء الاصطناعي المتعدّدة الوسائط العالية الأداء هذه.
باستخدام حزمة تطوير البرامج (SDK) الخاصة بأداة Firebase AI Logic، يمكن للمطوّرين إرسال طلبات من جهة العميل إلى نماذج الذكاء الاصطناعي من Google بأقل جهد ممكن. تنفّذ هذه النماذج، مثل Gemini Pro وGemini Flash، عمليات الاستدلال على السحابة الإلكترونية، وتتيح لتطبيقات Android معالجة مجموعة متنوعة من المدخلات، بما في ذلك الصور والأصوات والفيديوهات والنصوص. يتفوّق Gemini Pro في الاستدلال بشأن المشاكل المعقّدة وتحليل البيانات الشاملة، بينما توفّر سلسلة Gemini Flash سرعة فائقة وقدرة استيعاب كبيرة بما يكفي لمعظم المهام.
حالات استخدام تعلُّم الآلة التقليدي
على الرغم من أنّ الذكاء الاصطناعي التوليدي مفيد في إنشاء المحتوى وتعديله، مثل النصوص والصور والرموز البرمجية، إلا أنّه من الأفضل حلّ العديد من المشاكل الواقعية باستخدام أساليب تعلُّم الآلة التقليدية. تتفوق هذه الطرق الراسخة في المهام التي تتضمن التوقّع والتصنيف والرصد وفهم الأنماط ضمن البيانات الحالية، وغالبًا ما تكون أكثر كفاءة وأقل تكلفة من حيث الحوسبة وأسهل في التنفيذ من النماذج التوليدية.
تقدّم أُطر تعلُّم الآلة التقليدية حلولاً قوية ومحسّنة وأكثر عملية في كثير من الأحيان للتطبيقات التي تركّز على تحليل المدخلات أو تحديد الميزات أو تقديم توقّعات استنادًا إلى الأنماط التي تم التعرّف عليها، بدلاً من إنشاء مخرجات جديدة تمامًا. توفّر أدوات مثل ML Kit وLiteRT وMediaPipe من Google إمكانات فعّالة مصمَّمة خصيصًا لحالات الاستخدام غير التوليدية، لا سيما في بيئات الحوسبة على الأجهزة الجوّالة والحوسبة الطرفية.
بدء دمج تعلُّم الآلة باستخدام ML Kit
توفّر حزمة تعلّم الآلة حلولاً جاهزة للاستخدام ومحسَّنة للأجهزة الجوّالة لتنفيذ مهام تعلُّم الآلة الشائعة، ولا تتطلّب أي خبرة مسبقة في تعلُّم الآلة. تتيح لك حزمة تطوير البرامج (SDK) السهلة الاستخدام هذه على الأجهزة الجوّالة الاستفادة من خبرة Google في تعلُّم الآلة مباشرةً في تطبيقات Android وiOS، ما يتيح لك التركيز على تطوير الميزات بدلاً من تدريب النماذج وتحسينها. توفّر حزمة تعلُّم الآلة واجهات برمجة تطبيقات مُعدّة مسبقًا ونماذج جاهزة للاستخدام في ميزات، مثل فحص الرموز الشريطية والتعرّف على النصوص (التعرّف الضوئي على الحروف) واكتشاف الوجوه وتصنيف الصور واكتشاف العناصر وتتبُّعها وتحديد اللغة والرد الذكي.
ويتم عادةً تحسين هذه النماذج لتنفيذها على الجهاز فقط، ما يضمن وقت استجابة منخفضًا، وإمكانية استخدامها بدون اتصال بالإنترنت، وتعزيز خصوصية المستخدم لأنّ البيانات غالبًا ما تبقى على الجهاز. اختَر حزمة تعلّم الآلة لإضافة ميزات تعلُّم الآلة المعروفة بسرعة إلى تطبيقك على الأجهزة الجوّالة بدون الحاجة إلى تدريب النماذج أو طلب ناتج توليدي. وهي مثالية لتحسين التطبيقات بكفاءة من خلال إمكانات "ذكية" باستخدام نماذج Google المحسّنة أو من خلال نشر نماذج TensorFlow Lite مخصّصة.
يمكنك البدء باستخدام أدلتنا الشاملة ومستنداتنا على الموقع الإلكتروني للمطوّرين في ML Kit.
تفعيل نماذج تعلُّم الآلة المخصّصة باستخدام LiteRT
للحصول على تحكّم أكبر أو لنشر نماذج تعلُّم الآلة الخاصة بك، استخدِم حزمة مخصّصة لتعلُّم الآلة مبنية على LiteRT و"خدمات Google Play". توفّر هذه الحزمة الأساسيات اللازمة لنشر ميزات تعتمد على تعلُّم الآلة عالية الأداء. LiteRT هي مجموعة أدوات تم تحسينها لتشغيل نماذج TensorFlow بكفاءة على الأجهزة الجوّالة والأجهزة المضمّنة والأجهزة الطرفية التي تتضمّن موارد محدودة، ما يتيح لك تشغيل نماذج أصغر حجمًا وأسرع بكثير تستهلك قدرًا أقل من الذاكرة والطاقة ومساحة التخزين. تم تحسين وقت تشغيل LiteRT بشكل كبير ليتوافق مع مختلف مسرّعات الأجهزة (وحدات معالجة الرسومات ووحدات معالجة الإشارات الرقمية ووحدات معالجة الشبكات العصبية) على الأجهزة الطرفية، ما يتيح الاستنتاج بزمن انتقال منخفض.
اختَر LiteRT عندما تحتاج إلى نشر نماذج تعلُّم الآلة المدرَّبة بكفاءة (عادةً للتصنيف أو الانحدار أو الرصد) على الأجهزة التي تتضمّن قدرة حسابية أو عمر بطارية محدودًا، مثل الهواتف الذكية أو أجهزة إنترنت الأشياء أو وحدات التحكّم الدقيقة. وهو الحلّ المفضّل لنشر نماذج تنبؤية مخصّصة أو عادية على الأجهزة الطرفية حيث تكون السرعة والحفاظ على الموارد في غاية الأهمية.
مزيد من المعلومات حول نشر تعلُّم الآلة باستخدام LiteRT
دمج إمكانات الإدراك في الوقت الفعلي في تطبيقاتك باستخدام MediaPipe
توفّر MediaPipe حلولاً مفتوحة المصدر ومتوافقة مع عدة منصات وقابلة للتخصيص في مجال تعلُّم الآلة، وهي مصمَّمة للوسائط المباشرة والمبثوثة. يمكنك الاستفادة من أدوات محسّنة ومُعدّة مسبقًا لتنفيذ مهام معقّدة، مثل تتبُّع حركة اليد وتقدير الوضعية ورصد شبكة الوجه ورصد العناصر، وكلّها تتيح تفاعلاً عالي الأداء وفي الوقت الفعلي حتى على الأجهزة الجوّالة.
يمكن تخصيص مسارات معالجة MediaPipe المستندة إلى الرسومات البيانية بشكل كبير، ما يتيح لك تصميم حلول مخصّصة لتطبيقات Android وiOS والويب وأجهزة الكمبيوتر المكتبي وتطبيقات الخلفية. اختَر MediaPipe عندما يحتاج تطبيقك إلى فهم بيانات أجهزة الاستشعار المباشرة والردّ عليها على الفور، خاصةً بث الفيديو، لحالات الاستخدام مثل التعرّف على الإيماءات أو تأثيرات الواقع المعزّز أو تتبُّع اللياقة البدنية أو التحكّم في الصور الرمزية، وكل ذلك مع التركيز على تحليل المدخلات وتفسيرها.
استكشِف الحلول وابدأ في إنشاء التطبيقات باستخدام MediaPipe.
دمج تطبيقك مع مساعد الجهاز
في حين يركّز دمج الذكاء الاصطناعي التقليدي على "إضافة الذكاء الاصطناعي إلى تطبيقك"، يمكنك أيضًا "إضافة تطبيقك إلى الذكاء الاصطناعي". من خلال المساهمة بوظائف تطبيقك في ميزات الذكاء الاصطناعي على مستوى النظام، تسمح للمساعدين على مستوى النظام (مثل Gemini) باكتشاف إمكانات تطبيقك واستخدامها بشكل تلقائي. AppFunctions هي الطريقة الأساسية لتحقيق هذا الدمج، ما يتيح لتطبيقك المشاركة في منظومة Android المتكاملة الأوسع نطاقًا للذكاء الاصطناعي.
اختيار طريقة
عند دمج الذكاء الاصطناعي لتحسين تطبيق Android، عليك مراعاة ثلاثة أساليب أساسية، وهي: إجراء المعالجة على الجهاز فقط، أو الاستفادة من النماذج المستندة إلى السحابة الإلكترونية، أو إضافة وظائف تطبيقك إلى الذكاء الاصطناعي على مستوى النظام. تتيح أدوات مثل ML Kit وGemini Nano وLiteRT إمكانات على الأجهزة، بينما توفّر واجهات برمجة التطبيقات السحابية من Gemini مع Firebase AI Logic معالجة قوية مستندة إلى السحابة الإلكترونية. تمثّل AppFunctions مسارًا ثالثًا يتيح لك "إدخال تطبيقك إلى الذكاء الاصطناعي" من خلال إتاحة ميزاته للنظام بشكل مستقل.
يجب مراعاة العوامل التالية عند اختيار طريقة العرض:
| صيغة العوامل | حلول على الجهاز فقط | حلول السحابة الإلكترونية |
|---|---|---|
| إمكانية الاتصال والوظائف المتاحة بلا إنترنت | مثالية للاستخدام بلا إنترنت، وتعمل بدون اتصال بالشبكة. | يتطلّب اتصالاً بالشبكة للتواصل مع الخوادم البعيدة. |
| خصوصية البيانات | تعالج البيانات الحسّاسة وتخزّنها على الجهاز. | يتم نقل البيانات إلى السحابة الإلكترونية، ما يتطلّب الثقة في أمان مقدّم الخدمة. |
| قابلية العثور على المحتوى ومدى الوصول إلى الجمهور | يتيح الدمج المباشر مع نظام التشغيل (AppFunctions) للمساعدين اكتشاف الميزات. | عادةً ما يقتصر الاستكشاف على واجهة المستخدم الداخلية للتطبيق أو عمليات الدمج المحدّدة لواجهة برمجة التطبيقات. |
| إمكانات النموذج | تم تحسينها لتوفير وقت استجابة سريع وتنفيذ مهام معيّنة أقل استهلاكًا للموارد. | نماذج قوية قادرة على التعامل مع مستويات عالية من التعقيد والمدخلات الكبيرة |
| اعتبارات التكلفة | لا يتم فرض رسوم مباشرة على كل استخدام، بل يتم الاستفادة من أجهزة الجهاز الحالية. | عادةً ما يتضمّن التسعير المستند إلى الاستخدام أو تكاليف الاشتراك المستمرة. |
| مراجع عن الأجهزة | يستخدم مساحة التخزين المحلية وذاكرة الوصول العشوائي وعمر البطارية. | تأثير محلي ضئيل، ويتم تفويض العمليات المعقدة إلى الخادم. |
| ضبط النماذج | مرونة محدودة بسبب قيود إمكانات الأجهزة المحلية | مرونة أكبر للتخصيص الواسع النطاق والضبط على نطاق واسع |
| الاتّساق على عدّة منصات | قد يختلف مدى توفّر الميزة حسب نظام التشغيل ومدى توافق الأجهزة. | تجربة متسقة على أي منصة يمكن الوصول إليها من خلال الإنترنت |
من خلال التفكير مليًا في متطلبات حالة الاستخدام والخيارات المتاحة، يمكنك العثور على حلّ مثالي يستند إلى الذكاء الاصطناعي/تعلُّم الآلة لتحسين تطبيق Android وتقديم تجارب ذكية ومخصّصة للمستخدمين.
دليل حلول الذكاء الاصطناعي وتعلُّم الآلة
يمكن أن يساعدك دليل الحلول هذا في تحديد أدوات المطوّرين المناسبة لدمج تقنيات الذكاء الاصطناعي وتعلُّم الآلة في مشاريع Android.
ما هو الهدف الأساسي من ميزة الذكاء الاصطناعي؟
- أ) إنشاء محتوى جديد (نصوص، أوصاف صور)، أو تنفيذ معالجة بسيطة للنصوص (تلخيص أو تدقيق أو إعادة كتابة النص)؟ → الانتقال إلى الذكاء الاصطناعي التوليدي
- ب) هل يتم تحليل البيانات أو المدخلات الحالية لأغراض التوقّع أو التصنيف أو الرصد أو فهم الأنماط أو معالجة عمليات البث في الوقت الفعلي (مثل الفيديو أو الصوت)؟ → الانتقال إلى التعلم الآلي التقليدي والإدراك
- ج) تحسين وظائف تطبيقك لدمجها مع ميزات الذكاء الاصطناعي في النظام (إدراج تطبيقك في الذكاء الاصطناعي)؟ → الانتقال إلى إتاحة تطبيقك للذكاء الاصطناعي
تعلُّم الآلة التقليدي والإدراك
عندما تحتاج إلى تحليل البيانات المدخلة أو تحديد الميزات أو تقديم توقّعات استنادًا إلى الأنماط التي تم التعرّف عليها، بدلاً من إنشاء ناتج جديد تمامًا
ما هي المهمة المحدّدة التي تقوم بها؟
- أ) هل تحتاج إلى دمج سريع لميزات شائعة ومُعدّة مسبقًا لتعلُّم الآلة على الأجهزة الجوّالة؟
(مثل فحص الرموز الشريطية والتعرّف على النصوص (OCR) والتعرّف على الوجوه وتصنيف الصور ورصد العناصر وتتبُّعها وتحديد اللغة والردود السريعة الأساسية)
- → الاستخدام: حزمة تعلّم الآلة (واجهات برمجة التطبيقات التقليدية)
- السبب: يوفّر هذا الخيار أسهل عملية دمج للمهام الشائعة في تعلُّم الآلة على الأجهزة الجوّالة، وغالبًا ما يكون محسّنًا للاستخدام على الجهاز فقط (زمن استجابة منخفض، وإمكانية الاستخدام بلا إنترنت، والخصوصية).
- ب) هل تحتاج إلى معالجة بيانات البث المباشر (مثل الفيديو أو الصوت) لتنفيذ مهام الإدراك؟ (مثلاً، تتبُّع حركة اليد، وتقدير الوضعية، وشبكة الوجوه،
ورصد العناصر وتقسيمها في الوقت الفعلي في الفيديو)
- → الاستخدام: MediaPipe
- السبب: إطار عمل متخصص في خطوط نقل البيانات عالية الأداء وفي الوقت الفعلي على مختلف المنصات.
- ج) هل تحتاج إلى تشغيل نموذج تعلُّم الآلة المدرَّب والمخصّص بكفاءة (مثلاً، لأغراض التصنيف أو الانحدار أو الرصد) على الجهاز مع إعطاء الأولوية للأداء والاستخدام المنخفض للموارد؟
- → الاستخدام: LiteRT (وقت تشغيل TensorFlow Lite)
- السبب: توفير وقت تشغيل محسّن لنشر النماذج المخصّصة بكفاءة على الأجهزة الجوّالة وأجهزة الحافة (حجم صغير، واستدلال سريع، وتسريع الأجهزة).
- د) هل تحتاج إلى تدريب نموذج تعلُّم آلة مخصّص لأداء مهمة معيّنة؟
- ← الاستخدام: LiteRT (وقت تشغيل TensorFlow Lite) + تدريب النماذج المخصّصة
- السبب: توفّر هذه الخدمة الأدوات اللازمة لتدريب النماذج المخصّصة ونشرها، وهي نماذج محسّنة للأجهزة الجوّالة وأجهزة الحافة.
- هـ) هل تحتاج إلى تصنيف متقدّم للمحتوى أو تحليل المشاعر أو ترجمة العديد من اللغات التي تتضمّن دقة عالية؟
- حدِّد ما إذا كانت نماذج تعلُّم الآلة التقليدية (التي يمكن نشرها باستخدام LiteRT أو السحابة الإلكترونية) مناسبة، أو ما إذا كانت معالجة اللغة الطبيعية المتقدّمة تتطلّب نماذج توليدية (ارجع إلى "البداية"، واختَر "أ"). للتصنيف أو تحليل المشاعر أو الترجمة المستندة إلى السحابة الإلكترونية:
- ← الاستخدام: حلول مستندة إلى السحابة الإلكترونية (مثل Google Cloud Natural Language API وGoogle Cloud Translation API، التي يمكن الوصول إليها باستخدام خادم خلفي مخصّص أوVertex AI) (أولوية أقل من الخيارات المتاحة على الجهاز فقط إذا كان غير متصل بالإنترنت أو إذا كانت الخصوصية هي الأولوية).
- السبب: توفّر الحلول المستندة إلى السحابة الإلكترونية نماذج فعّالة وتتيح استخدام العديد من اللغات، ولكنها تتطلّب الاتصال بالإنترنت وقد تتكبّد تكاليف.
الذكاء الاصطناعي التوليدي
تحتاج إلى إنشاء محتوى جديد أو تلخيصه أو إعادة كتابته أو تنفيذ مهام معقّدة تتطلّب فهمًا أو تفاعلاً.
هل تحتاج إلى أن يعمل الذكاء الاصطناعي بلا إنترنت، أو إلى تحقيق أعلى مستوى من خصوصية البيانات (من خلال الاحتفاظ ببيانات المستخدم على الجهاز فقط)، أو هل تريد تجنُّب تكاليف الاستدلال على السحابة الإلكترونية؟
- أ) نعم، من المهم أن تكون إمكانية الوصول إلى البيانات غير متصلة بالإنترنت أو أن تكون الخصوصية في أعلى مستوياتها أو ألا تكون هناك تكلفة لاستخدام السحابة الإلكترونية.
- → الانتقال إلى الذكاء الاصطناعي التوليدي على الجهاز فقط
- ب) لا، الاتصال متاح ومقبول، أو أنّ إمكانات السحابة الإلكترونية وقابليتها للتوسّع أكثر أهمية، أو أنّ ميزات معيّنة تتطلّب السحابة الإلكترونية.
- → الانتقال إلى الذكاء الاصطناعي التوليدي على السحابة الإلكترونية
الذكاء الاصطناعي التوليدي على الجهاز فقط (باستخدام Gemini Nano)
ملاحظات: تتطلّب أجهزة Android متوافقة، وتتوفّر إمكانية محدودة لاستخدامها على أجهزة iOS، كما أنّ الموديلات أقل قوة من نظيراتها على السحابة الإلكترونية.
باستخدام Prompt API في ML Kit، يمكنك إرسال طلبات بلغة طبيعية مع إدخالات نصية فقط أو إدخالات نصية وصور لمجموعة متنوعة من حالات الاستخدام، مثل فهم الصور والترجمات القصيرة والملخّصات الموجّهة. إذا كانت حالات الاستخدام الخاصة بك تتوافق مع حدود الرموز المميزة هذه، ستكون واجهات برمجة التطبيقات المستندة إلى الذكاء الاصطناعي التوليدي في حزمة تعلّم الآلة هي الخيار الأفضل لك للاستفادة من الذكاء الاصطناعي التوليدي على الجهاز فقط. توفّر حزمة ML Kit أيضًا واجهات برمجة تطبيقات مبسطة للمهام الشائعة، مثل التلخيص والردود الذكية.
- → الاستخدام: واجهات برمجة تطبيقات الذكاء الاصطناعي التوليدي في حزمة تعلّم الآلة (تعمل من خلال Gemini Nano)
- السبب: هذه هي أسهل طريقة لدمج مهام الذكاء الاصطناعي التوليدي على الجهاز باستخدام طلبات باللغة الطبيعية، وهي الحلّ الأهم على الجهاز فقط.
الذكاء الاصطناعي التوليدي على السحابة الإلكترونية
تستخدم نماذج أكثر فعالية، وتتطلّب الاتصال بالإنترنت، وتتضمّن عادةً تكاليف استنتاج، وتوفّر نطاقًا أوسع من الأجهزة وتوافقًا أسهل بين الأنظمة الأساسية (Android وiOS).
ما هي أولويتك: سهولة الدمج في Firebase أو الحد الأقصى من المرونة والتحكّم؟
- أ) هل تفضّل عملية دمج أسهل وتجربة مُدارة لواجهة برمجة التطبيقات، وهل من المحتمل أنّك تستخدم Firebase حاليًا؟
- → الاستخدام: حزمة تطوير البرامج (SDK) الخاصة بخدمة Firebase AI Logic → الانتقال إلى Firebase AI Logic
- ب) هل تحتاج إلى أقصى قدر من المرونة والوصول إلى أكبر مجموعة من النماذج (بما في ذلك النماذج التابعة لجهات خارجية أو المخصّصة) وإمكانية الضبط الدقيق المتقدّم، وهل أنت على استعداد لإدارة عملية الدمج الخلفي (الأكثر تعقيدًا)؟
- → الاستخدام: واجهة Gemini API مع خادم سحابي مخصّص (باستخدام Google Cloud Platform)
- السبب: يوفّر هذا النموذج أعلى مستوى من التحكّم، وأوسع نطاق من إمكانية الوصول إلى النماذج، وخيارات التدريب المخصّص، ولكنّه يتطلّب جهدًا كبيرًا في تطوير الخلفية. مناسبة للاحتياجات المعقّدة أو الواسعة النطاق أو المخصّصة بشكل كبير
(لقد اخترت حزمة تطوير البرامج (SDK) الخاصة بـ Firebase AI Logic) ما هو نوع المهمة التوليدية وملف الأداء الذي تحتاجه؟
- أ) هل تحتاج إلى توازن بين الأداء والتكلفة، وهو مناسب لتطبيقات إنشاء النصوص العامة أو تلخيصها أو المحادثة التي تكون فيها السرعة مهمة؟
- → الاستخدام: حزمة تطوير البرامج (SDK) الخاصة بـ Firebase AI Logic مع Gemini Flash
- السبب: تم تحسينها لتوفير السرعة والكفاءة ضمن البيئة المُدارة في Vertex AI.
- ب) هل تحتاج إلى جودة وقدرات أعلى لإنشاء نصوص معقّدة أو الاستدلال أو فهم اللغة الطبيعية المتقدّم أو اتّباع التعليمات؟
- → الاستخدام: حزمة تطوير البرامج (SDK) الخاصة بـ Firebase AI Logic مع Gemini Pro
- السبب: نموذج نصي أكثر فعالية للمهام الصعبة، ويمكن الوصول إليه من خلال Firebase.
AppFunctions
عليك تحسين وظائف تطبيقك لدمجها مع ميزات الذكاء الاصطناعي في النظام (إضافة تطبيقك إلى الذكاء الاصطناعي).
- → الاستخدام: AppFunctions
- السبب: يتيح هذا الإذن ميزات الذكاء الاصطناعي في النظام، مثل "مساعد Google"، لاكتشاف إمكانات تطبيقك واستخدامها.