এই নির্দেশিকাটি আপনার অ্যাপ্লিকেশনগুলিতে Google-এর জেনারেটিভ কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং (AI/ML) সমাধানগুলিকে সংহত করতে সাহায্য করার জন্য ডিজাইন করা হয়েছে৷ এটি আপনাকে উপলব্ধ বিভিন্ন কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং সমাধানগুলি নেভিগেট করতে এবং আপনার প্রয়োজনের সাথে সবচেয়ে উপযুক্ত একটি চয়ন করতে সহায়তা করে। এই নথির লক্ষ্য হল আপনার প্রয়োজন এবং ব্যবহারের ক্ষেত্রে ফোকাস করে কোন টুল ব্যবহার করবেন এবং কেন তা নির্ধারণ করতে সাহায্য করা।
আপনার নির্দিষ্ট প্রয়োজনীয়তার জন্য সবচেয়ে উপযুক্ত AI/ML সমাধান নির্বাচন করতে আপনাকে সহায়তা করতে, এই নথিতে একটি সমাধান নির্দেশিকা অন্তর্ভুক্ত রয়েছে । আপনার প্রকল্পের লক্ষ্য এবং সীমাবদ্ধতা সম্পর্কে একাধিক প্রশ্নের উত্তর দিয়ে, গাইড আপনাকে সবচেয়ে উপযুক্ত সরঞ্জাম এবং প্রযুক্তির দিকে নির্দেশ করে।
এই নির্দেশিকা আপনাকে আপনার অ্যাপের জন্য সেরা AI সমাধান বেছে নিতে সাহায্য করে। এই বিষয়গুলি বিবেচনা করুন: ডেটার ধরন (টেক্সট, ছবি, অডিও, ভিডিও), টাস্কের জটিলতা (বিশেষ জ্ঞানের প্রয়োজন জটিল কাজগুলির সহজ সংক্ষিপ্তকরণ), এবং ডেটার আকার (বড় নথি বনাম ছোট ইনপুট)। এটি আপনাকে আপনার ডিভাইসে জেমিনি ন্যানো বা Firebase-এর ক্লাউড-ভিত্তিক AI (জেমিনি ফ্ল্যাশ, জেমিনি প্রো, বা ইমেজেন) ব্যবহার করার মধ্যে সিদ্ধান্ত নিতে সাহায্য করবে।
ডিভাইসে অনুমানের শক্তি ব্যবহার করুন
আপনি যখন আপনার অ্যান্ড্রয়েড অ্যাপে AI এবং ML বৈশিষ্ট্যগুলি যোগ করছেন, আপনি সেগুলি সরবরাহ করার বিভিন্ন উপায় বেছে নিতে পারেন - হয় ডিভাইসে বা ক্লাউড ব্যবহার করে৷
Gemini Nano-এর মতো অন-ডিভাইস সমাধানগুলি কোনও অতিরিক্ত খরচ ছাড়াই ফলাফল সরবরাহ করে, উন্নত ব্যবহারকারীর গোপনীয়তা প্রদান করে এবং নির্ভরযোগ্য অফলাইন কার্যকারিতা প্রদান করে কারণ ইনপুট ডেটা স্থানীয়ভাবে প্রক্রিয়া করা হয়। এই সুবিধাগুলি নির্দিষ্ট ব্যবহারের ক্ষেত্রে গুরুত্বপূর্ণ হতে পারে, যেমন বার্তা সংক্ষিপ্তকরণ, সঠিক সমাধানগুলি বেছে নেওয়ার সময় ডিভাইসে অগ্রাধিকার দেওয়া।
Gemini Nano আপনাকে Android-চালিত ডিভাইসে সরাসরি অনুমান চালাতে দেয়। আপনি যদি টেক্সট বা ইমেজ নিয়ে কাজ করে থাকেন, তাহলে ML Kit-এর GenAI API গুলি দিয়ে শুরু করুন অ-অফ-দ্য-বক্স সমাধানের জন্য। ML Kit GenAI API গুলি Gemini Nano দ্বারা চালিত এবং নির্দিষ্ট অন-ডিভাইস কাজের জন্য সূক্ষ্ম-টিউন করা হয়। ML Kit GenAI APIগুলি তাদের উচ্চ-স্তরের ইন্টারফেস এবং স্কেলেবিলিটির কারণে আপনার অ্যাপগুলির জন্য উত্পাদনের একটি আদর্শ পথ। এই APIগুলি আপনাকে সংক্ষিপ্তকরণ, প্রুফরিড এবং টেক্সট পুনঃলিখনের পাশাপাশি চিত্রের বর্ণনা তৈরি করতে ব্যবহারের ক্ষেত্রে প্রয়োগ করতে দেয়।
ML Kit GenAI API দ্বারা প্রদত্ত মৌলিক ব্যবহারের ক্ষেত্রের বাইরে যেতে, Gemini Nano Experimental Access বিবেচনা করুন। জেমিনি ন্যানো এক্সপেরিমেন্টাল অ্যাক্সেস আপনাকে জেমিনি ন্যানো সহ কাস্টম প্রম্পটিংয়ে আরও সরাসরি অ্যাক্সেস দেয়।
প্রথাগত মেশিন লার্নিং কাজের জন্য, আপনার নিজস্ব কাস্টম মডেলগুলি বাস্তবায়ন করার নমনীয়তা রয়েছে। আমরা আপনার ডেভেলপমেন্ট প্রক্রিয়াকে স্ট্রিমলাইন করতে ML Kit , MediaPipe , LiteRT এবং Google Play ডেলিভারি বৈশিষ্ট্যের মতো শক্তিশালী টুল সরবরাহ করি।
যে অ্যাপ্লিকেশনগুলির জন্য অত্যন্ত বিশেষায়িত সমাধান প্রয়োজন, আপনি আপনার নিজস্ব কাস্টম মডেল ব্যবহার করতে পারেন, যেমন জেমা বা আপনার নির্দিষ্ট ব্যবহারের ক্ষেত্রে উপযোগী অন্য মডেল। LiteRT এর সাথে ব্যবহারকারীর ডিভাইসে সরাসরি আপনার মডেল চালান, যা অপ্টিমাইজড পারফরম্যান্সের জন্য পূর্ব-পরিকল্পিত মডেল আর্কিটেকচার প্রদান করে।
আপনি অন-ডিভাইস এবং ক্লাউড মডেল উভয়ই ব্যবহার করে একটি হাইব্রিড সমাধান তৈরি করার কথা বিবেচনা করতে পারেন।
মোবাইল অ্যাপ্লিকেশনগুলি সাধারণত ছোট পাঠ্য ডেটার জন্য স্থানীয় মডেলগুলি ব্যবহার করে, যেমন চ্যাট কথোপকথন বা ব্লগ নিবন্ধগুলি। যাইহোক, বৃহত্তর ডেটা উত্সগুলির জন্য (যেমন পিডিএফ) বা অতিরিক্ত জ্ঞানের প্রয়োজন হলে, আরও শক্তিশালী জেমিনি মডেল সহ একটি ক্লাউড-ভিত্তিক সমাধান প্রয়োজন হতে পারে।
উন্নত মিথুন মডেলগুলিকে একীভূত করুন৷
Android ডেভেলপাররা Firebase AI Logic SDK ব্যবহার করে তাদের অ্যাপ্লিকেশনগুলিতে শক্তিশালী জেমিনি প্রো, জেমিনি ফ্ল্যাশ এবং ইমেজেন মডেল সহ Google-এর উন্নত জেনারেটিভ AI ক্ষমতাগুলিকে একীভূত করতে পারে৷ এই SDK বৃহত্তর ডেটা প্রয়োজনের জন্য ডিজাইন করা হয়েছে এবং এই উচ্চ-কার্যকারি, মাল্টিমডাল AI মডেলগুলিতে অ্যাক্সেস সক্ষম করে প্রসারিত ক্ষমতা এবং অভিযোজনযোগ্যতা প্রদান করে।
Firebase AI Logic SDK-এর সাহায্যে, ডেভেলপাররা ন্যূনতম প্রচেষ্টায় Google-এর AI মডেলগুলিতে ক্লায়েন্ট-সাইড কল করতে পারে। এই মডেলগুলি, যেমন জেমিনি প্রো এবং জেমিনি ফ্ল্যাশ, ক্লাউডে অনুমান চালায় এবং ছবি, অডিও, ভিডিও এবং পাঠ্য সহ বিভিন্ন ইনপুট প্রক্রিয়া করার জন্য Android অ্যাপগুলিকে ক্ষমতায়ন করে৷ জেমিনি প্রো জটিল সমস্যাগুলির উপর যুক্তি এবং বিস্তৃত ডেটা বিশ্লেষণে দক্ষতা অর্জন করে, যখন জেমিনি ফ্ল্যাশ সিরিজটি উচ্চতর গতি এবং বেশিরভাগ কাজের জন্য যথেষ্ট বড় একটি প্রসঙ্গ উইন্ডো সরবরাহ করে।
প্রথাগত মেশিন লার্নিং কখন ব্যবহার করবেন
যদিও জেনারেটিভ এআই টেক্সট, ইমেজ এবং কোডের মতো বিষয়বস্তু তৈরি এবং সম্পাদনা করার জন্য উপযোগী, অনেক বাস্তব-জগতের সমস্যা প্রথাগত মেশিন লার্নিং (এমএল) কৌশল ব্যবহার করে আরও ভালভাবে সমাধান করা হয়। এই প্রতিষ্ঠিত পদ্ধতিগুলি বিদ্যমান ডেটার মধ্যে ভবিষ্যদ্বাণী, শ্রেণীবিন্যাস, সনাক্তকরণ এবং বোঝার ধরণগুলি জড়িত কাজগুলিতে উৎকর্ষ সাধন করে, প্রায়শই বেশি দক্ষতা, কম গণনামূলক খরচ এবং জেনারেটিভ মডেলের তুলনায় সহজ বাস্তবায়নের সাথে।
ঐতিহ্যগত ML ফ্রেমওয়ার্কগুলি সম্পূর্ণ নতুন আউটপুট তৈরি করার পরিবর্তে ইনপুট বিশ্লেষণ, বৈশিষ্ট্য সনাক্তকরণ, বা শেখা নিদর্শনগুলির উপর ভিত্তি করে ভবিষ্যদ্বাণী করার উপর দৃষ্টি নিবদ্ধ করা অ্যাপ্লিকেশনগুলির জন্য দৃঢ়, অপ্টিমাইজ করা এবং প্রায়শই আরও ব্যবহারিক সমাধান সরবরাহ করে। Google-এর ML Kit, LiteRT, এবং MediaPipe-এর মতো টুলগুলি এই নন-জেনারেটিভ ব্যবহারের ক্ষেত্রে বিশেষ করে মোবাইল এবং এজ কম্পিউটিং পরিবেশের জন্য তৈরি শক্তিশালী ক্ষমতা প্রদান করে।
এমএল কিটের সাথে আপনার মেশিন লার্নিং ইন্টিগ্রেশন কিকস্টার্ট করুন
এমএল কিট সাধারণ মেশিন লার্নিং কাজের জন্য প্রোডাকশন-রেডি, মোবাইল-অপ্টিমাইজ করা সমাধান অফার করে, যার কোনো পূর্বে এমএল দক্ষতার প্রয়োজন নেই। এই সহজে ব্যবহারযোগ্য মোবাইল SDK Google এর ML দক্ষতা সরাসরি আপনার Android এবং iOS অ্যাপে নিয়ে আসে, যা আপনাকে মডেল প্রশিক্ষণ এবং অপ্টিমাইজেশানের পরিবর্তে বৈশিষ্ট্য বিকাশে ফোকাস করতে দেয়৷ ML কিট বারকোড স্ক্যানিং, টেক্সট রিকগনিশন (OCR), ফেস ডিটেকশন, ইমেজ লেবেলিং, অবজেক্ট ডিটেকশন এবং ট্র্যাকিং, ভাষা শনাক্তকরণ এবং স্মার্ট রিপ্লাই এর মত বৈশিষ্ট্যগুলির জন্য প্রি-বিল্ট API এবং রেডি-টু-ব্যবহারের মডেলগুলি প্রদান করে।
এই মডেলগুলি সাধারণত ডিভাইসে সঞ্চালনের জন্য অপ্টিমাইজ করা হয়, কম বিলম্বিতা, অফলাইন কার্যকারিতা এবং উন্নত ব্যবহারকারীর গোপনীয়তা নিশ্চিত করে কারণ ডেটা প্রায়শই ডিভাইসে থাকে। আপনার মোবাইল অ্যাপে দ্রুত প্রতিষ্ঠিত এমএল বৈশিষ্ট্য যোগ করতে ML কিট বেছে নিন মডেলদের প্রশিক্ষণের প্রয়োজন ছাড়াই বা জেনারেটিভ আউটপুটের প্রয়োজন ছাড়াই। এটি Google-এর অপ্টিমাইজ করা মডেলগুলি ব্যবহার করে বা কাস্টম টেনসরফ্লো লাইট মডেলগুলি স্থাপন করে "স্মার্ট" ক্ষমতা সহ অ্যাপ্লিকেশনগুলিকে দক্ষতার সাথে উন্নত করার জন্য আদর্শ৷
ML Kit ডেভেলপার সাইটে আমাদের ব্যাপক গাইড এবং ডকুমেন্টেশন দিয়ে শুরু করুন।
LiteRT এর সাথে কাস্টম ML স্থাপনা
বৃহত্তর নিয়ন্ত্রণের জন্য বা আপনার নিজস্ব ML মডেল স্থাপন করতে, LiteRT এবং Google Play পরিষেবাগুলিতে নির্মিত একটি কাস্টম ML স্ট্যাক ব্যবহার করুন৷ এই স্ট্যাক উচ্চ-কর্মক্ষমতা ML বৈশিষ্ট্য স্থাপনের জন্য প্রয়োজনীয়তা প্রদান করে। LiteRT হল একটি টুলকিট যা টেনসরফ্লো মডেলগুলিকে দক্ষতার সাথে রিসোর্স-সংবদ্ধ মোবাইল, এম্বেডেড এবং এজ ডিভাইসগুলিতে চালানোর জন্য অপ্টিমাইজ করা হয়েছে, যা আপনাকে উল্লেখযোগ্যভাবে ছোট এবং দ্রুত মডেলগুলি চালানোর ক্ষমতা দেয় যা কম মেমরি, শক্তি এবং স্টোরেজ খরচ করে৷ LiteRT রানটাইমটি প্রান্ত ডিভাইসে বিভিন্ন হার্ডওয়্যার এক্সিলারেটরের (GPUs, DSPs, NPUs) জন্য অত্যন্ত অপ্টিমাইজ করা হয়েছে, যা কম লেটেন্সি ইনফারেন্স সক্ষম করে।
স্মার্টফোন, IoT ডিভাইস বা মাইক্রোকন্ট্রোলারের মতো সীমিত কম্পিউটেশনাল পাওয়ার বা ব্যাটারি লাইফ সহ ডিভাইসগুলিতে প্রশিক্ষিত এমএল মডেল (সাধারণত শ্রেণিবিন্যাস, রিগ্রেশন বা সনাক্তকরণের জন্য) দক্ষতার সাথে মোতায়েন করার প্রয়োজন হলে LiteRT বেছে নিন। এটি প্রান্তে কাস্টম বা স্ট্যান্ডার্ড ভবিষ্যদ্বাণীমূলক মডেল স্থাপনের জন্য পছন্দসই সমাধান যেখানে গতি এবং সম্পদ সংরক্ষণ সর্বাগ্রে।
LiteRT এর সাথে ML স্থাপনা সম্পর্কে আরও জানুন।
MediaPipe দিয়ে আপনার অ্যাপে রিয়েল-টাইম উপলব্ধি তৈরি করুন
MediaPipe লাইভ এবং স্ট্রিমিং মিডিয়ার জন্য ডিজাইন করা ওপেন সোর্স, ক্রস-প্ল্যাটফর্ম এবং কাস্টমাইজযোগ্য মেশিন লার্নিং সমাধান প্রদান করে। হ্যান্ড ট্র্যাকিং, পোজ এস্টিমেশন, ফেস মেশ ডিটেকশন এবং অবজেক্ট ডিটেকশনের মতো জটিল কাজগুলির জন্য অপ্টিমাইজ করা, প্রি-বিল্ট টুলগুলি থেকে উপকৃত হন, সমস্ত উচ্চ-পারফরম্যান্স সক্ষম করে, এমনকি মোবাইল ডিভাইসেও রিয়েল-টাইম ইন্টারঅ্যাকশন।
MediaPipe-এর গ্রাফ-ভিত্তিক পাইপলাইনগুলি অত্যন্ত কাস্টমাইজযোগ্য, যা আপনাকে Android, iOS, ওয়েব, ডেস্কটপ এবং ব্যাকএন্ড অ্যাপ্লিকেশনের জন্য সমাধান তৈরি করতে দেয়। আপনার অ্যাপ্লিকেশানটি যখন ইঙ্গিত শনাক্তকরণ, AR প্রভাব, ফিটনেস ট্র্যাকিং, বা অবতার নিয়ন্ত্রণের মতো ব্যবহারের ক্ষেত্রে লাইভ সেন্সর ডেটা, বিশেষ করে ভিডিও স্ট্রীমগুলিতে তাৎক্ষণিকভাবে বুঝতে এবং প্রতিক্রিয়া জানাতে হবে তখন MediaPipe বেছে নিন—সবই ইনপুট বিশ্লেষণ এবং ব্যাখ্যার উপর দৃষ্টি নিবদ্ধ করে।
সমাধানগুলি অন্বেষণ করুন এবং MediaPipe দিয়ে তৈরি করা শুরু করুন৷
একটি পদ্ধতি বেছে নিন: অন-ডিভাইস বা ক্লাউড
আপনার অ্যান্ড্রয়েড অ্যাপে এআই/এমএল বৈশিষ্ট্যগুলিকে একীভূত করার সময়, একটি গুরুত্বপূর্ণ প্রাথমিক সিদ্ধান্ত হল ব্যবহারকারীর ডিভাইসে বা ক্লাউডে সরাসরি প্রক্রিয়াকরণ করা হবে কিনা। এমএল কিট, জেমিনি ন্যানো এবং টেনসরফ্লো লাইটের মতো সরঞ্জামগুলি ডিভাইসে সক্ষমতা সক্ষম করে, যখন ফায়ারবেস এআই লজিক সহ জেমিনি ক্লাউড এপিআই শক্তিশালী ক্লাউড-ভিত্তিক প্রক্রিয়াকরণ সরবরাহ করতে পারে। সঠিক পছন্দ করা আপনার ব্যবহারের ক্ষেত্রে এবং ব্যবহারকারীর চাহিদার জন্য নির্দিষ্ট বিভিন্ন কারণের উপর নির্ভর করে।
আপনার সিদ্ধান্তের জন্য নিম্নলিখিত দিকগুলি বিবেচনা করুন:
- কানেক্টিভিটি এবং অফলাইন কার্যকারিতা : যদি আপনার অ্যাপ্লিকেশনটিকে ইন্টারনেট সংযোগ ছাড়াই নির্ভরযোগ্যভাবে কাজ করতে হয়, তাহলে জেমিনি ন্যানো-এর মতো অন-ডিভাইস সমাধানগুলি আদর্শ৷ ক্লাউড-ভিত্তিক প্রক্রিয়াকরণ, তার প্রকৃতি দ্বারা, নেটওয়ার্ক অ্যাক্সেস প্রয়োজন।
- ডেটা গোপনীয়তা : ব্যবহারের ক্ষেত্রে যেখানে ব্যবহারকারীর ডেটা গোপনীয়তার কারণে ডিভাইসে থাকতে হবে, ডিভাইসে প্রক্রিয়াকরণ সংবেদনশীল তথ্য স্থানীয় রেখে একটি স্বতন্ত্র সুবিধা প্রদান করে।
- মডেলের ক্ষমতা এবং টাস্ক জটিলতা : ক্লাউড-ভিত্তিক মডেলগুলি প্রায়শই উল্লেখযোগ্যভাবে বড়, আরও শক্তিশালী এবং আরও ঘন ঘন আপডেট করা হয়, এগুলিকে অত্যন্ত জটিল AI কাজের জন্য উপযুক্ত করে তোলে বা বড় ইনপুটগুলি প্রক্রিয়া করার সময় যেখানে উচ্চতর আউটপুট গুণমান এবং ব্যাপক ক্ষমতা সর্বাগ্রে। সহজ কাজগুলি অন-ডিভাইস মডেল দ্বারা ভালভাবে পরিচালনা করা যেতে পারে।
- খরচের বিবেচনা : ক্লাউড এপিআই সাধারণত ব্যবহার-ভিত্তিক মূল্যের সাথে জড়িত থাকে, যার অর্থ অনুমানের সংখ্যা বা প্রক্রিয়াকৃত ডেটার পরিমাণের সাথে খরচ হতে পারে। ডিভাইসে অনুমান, সাধারণত সরাসরি প্রতি-ব্যবহারের চার্জ থেকে মুক্ত থাকাকালীন, বিকাশের খরচ বহন করে এবং ব্যাটারি লাইফ এবং সামগ্রিক কর্মক্ষমতার মতো ডিভাইসের সংস্থানগুলিকে প্রভাবিত করতে পারে।
- ডিভাইস রিসোর্স : অন-ডিভাইস মডেল ব্যবহারকারীর ডিভাইসে স্টোরেজ স্পেস ব্যবহার করে। আপনার টার্গেট শ্রোতারা বৈশিষ্ট্যগুলি ব্যবহার করতে পারে তা নিশ্চিত করার জন্য নির্দিষ্ট অন-ডিভাইস মডেল যেমন জেমিনি ন্যানোগুলির ডিভাইসের সামঞ্জস্যতা সম্পর্কে সচেতন হওয়াও গুরুত্বপূর্ণ৷
- ফাইন-টিউনিং এবং কাস্টমাইজেশন : আপনার নির্দিষ্ট ব্যবহারের ক্ষেত্রে মডেলগুলিকে সূক্ষ্ম-টিউন করার ক্ষমতার প্রয়োজন হলে, ক্লাউড-ভিত্তিক সমাধানগুলি সাধারণত কাস্টমাইজেশনের জন্য আরও বেশি নমনীয়তা এবং আরও বিস্তৃত বিকল্প সরবরাহ করে।
- ক্রস-প্ল্যাটফর্মের সামঞ্জস্যতা : iOS সহ একাধিক প্ল্যাটফর্মে সামঞ্জস্যপূর্ণ AI বৈশিষ্ট্যগুলি গুরুত্বপূর্ণ হলে, মনে রাখবেন যে কিছু অন-ডিভাইস সমাধান, যেমন জেমিনি ন্যানো, এখনও সমস্ত অপারেটিং সিস্টেমে উপলব্ধ নাও হতে পারে৷
আপনার ব্যবহারের ক্ষেত্রে প্রয়োজনীয়তা এবং উপলব্ধ বিকল্পগুলি সাবধানতার সাথে বিবেচনা করে, আপনি আপনার অ্যান্ড্রয়েড অ্যাপকে উন্নত করতে এবং আপনার ব্যবহারকারীদের বুদ্ধিমান এবং ব্যক্তিগতকৃত অভিজ্ঞতা প্রদানের জন্য নিখুঁত AI/ML সমাধান খুঁজে পেতে পারেন।
এআই/এমএল সমাধানের জন্য গাইড
এই সমাধান নির্দেশিকা আপনাকে আপনার অ্যান্ড্রয়েড প্রকল্পগুলিতে AI/ML প্রযুক্তি একীভূত করার জন্য উপযুক্ত বিকাশকারী সরঞ্জামগুলি সনাক্ত করতে সহায়তা করতে পারে।
AI বৈশিষ্ট্যের প্রাথমিক লক্ষ্য কি?
- ক) নতুন বিষয়বস্তু তৈরি করা (পাঠ্য, চিত্রের বিবরণ), বা সাধারণ পাঠ্য প্রক্রিয়াকরণ (সারসংক্ষেপ, প্রুফরিডিং বা পাঠ পুনঃলিখন) করা? → জেনারেটিভ এআই- এ যান
- খ) ভবিষ্যদ্বাণী, শ্রেণীবিভাগ, সনাক্তকরণ, প্যাটার্ন বোঝা বা রিয়েল-টাইম স্ট্রীম (যেমন ভিডিও/অডিও) প্রক্রিয়াকরণের জন্য বিদ্যমান ডেটা/ইনপুট বিশ্লেষণ করছেন? → প্রথাগত ML এবং উপলব্ধিতে যান
ঐতিহ্যগত এমএল এবং উপলব্ধি
সম্পূর্ণ নতুন আউটপুট তৈরি করার পরিবর্তে আপনাকে ইনপুট বিশ্লেষণ করতে হবে, বৈশিষ্ট্যগুলি সনাক্ত করতে হবে বা শেখা নিদর্শনগুলির উপর ভিত্তি করে ভবিষ্যদ্বাণী করতে হবে।
আপনি কি নির্দিষ্ট কাজ সম্পাদন করছেন?
- ক) পূর্ব-নির্মিত, সাধারণ মোবাইল এমএল বৈশিষ্ট্যগুলির দ্রুত একীকরণের প্রয়োজন? (যেমন, বারকোড স্ক্যানিং, টেক্সট রিকগনিশন (OCR), ফেস ডিটেকশন, ইমেজ লেবেলিং, অবজেক্ট ডিটেকশন এবং ট্র্যাকিং, ল্যাঙ্গুয়েজ আইডি, বেসিক স্মার্ট রিপ্লাই)
- → ব্যবহার করুন: ML কিট (ঐতিহ্যগত API)
- কেন : প্রতিষ্ঠিত মোবাইল এমএল টাস্কগুলির জন্য সবচেয়ে সহজ ইন্টিগ্রেশন, প্রায়শই অন-ডিভাইস ব্যবহারের জন্য অপ্টিমাইজ করা হয় (কম লেটেন্সি, অফলাইন, গোপনীয়তা)।
- খ) উপলব্ধি কাজের জন্য রিয়েল-টাইম স্ট্রিমিং ডেটা (যেমন ভিডিও বা অডিও) প্রক্রিয়া করতে হবে? (যেমন, হ্যান্ড ট্র্যাকিং, পোজ এস্টিমেশন, ফেস মেশ, রিয়েল-টাইম অবজেক্ট ডিটেকশন এবং ভিডিওতে সেগমেন্টেশন)
- → ব্যবহার করুন: মিডিয়াপাইপ
- কেন : বিভিন্ন প্ল্যাটফর্মে উচ্চ-কর্মক্ষমতা, রিয়েল-টাইম উপলব্ধি পাইপলাইনের জন্য ফ্রেমওয়ার্ক বিশেষ।
- গ) দক্ষতার সাথে আপনার নিজস্ব কাস্টম-প্রশিক্ষিত এমএল মডেল (যেমন, শ্রেণীবিভাগ, রিগ্রেশন, সনাক্তকরণের জন্য) ডিভাইসে চালানোর প্রয়োজন, কর্মক্ষমতা এবং কম সম্পদ ব্যবহারকে অগ্রাধিকার দেওয়া?
- → ব্যবহার করুন: LiteRT (টেনসরফ্লো লাইট রানটাইম)
- কেন : মোবাইল এবং প্রান্ত ডিভাইসে (ছোট আকার, দ্রুত অনুমান, হার্ডওয়্যার ত্বরণ) দক্ষতার সাথে কাস্টম মডেল স্থাপনের জন্য অপ্টিমাইজ করা রানটাইম।
- ঘ) একটি নির্দিষ্ট কাজের জন্য আপনার নিজস্ব কাস্টম এমএল মডেল প্রশিক্ষণ প্রয়োজন?
- → ব্যবহার করুন: LiteRT (টেনসরফ্লো লাইট রানটাইম) + কাস্টম মডেল প্রশিক্ষণ
- কেন : মোবাইল এবং এজ ডিভাইসের জন্য অপ্টিমাইজ করা কাস্টম মডেলগুলিকে প্রশিক্ষণ এবং স্থাপন করার জন্য সরঞ্জামগুলি প্রদান করে৷
- E) উন্নত বিষয়বস্তু শ্রেণীবিভাগ, অনুভূতি বিশ্লেষণ, বা উচ্চ সূক্ষ্মতা সহ অনেক ভাষার অনুবাদ প্রয়োজন?
- বিবেচনা করুন প্রথাগত ML মডেলগুলি (সম্ভাব্যভাবে LiteRT বা ক্লাউড ব্যবহার করে স্থাপন করা হয়েছে) উপযুক্ত কিনা, অথবা যদি উন্নত NLU-এর জন্য জেনারেটিভ মডেলের প্রয়োজন হয় (শুরুতে ফিরে যান, A চয়ন করুন)। ক্লাউড-ভিত্তিক শ্রেণিবিন্যাস, অনুভূতি বা অনুবাদের জন্য:
- → ব্যবহার করুন: ক্লাউড-ভিত্তিক সমাধান (যেমন, Google ক্লাউড ন্যাচারাল ল্যাঙ্গুয়েজ API , Google ক্লাউড অনুবাদ API , সম্ভাব্যভাবে একটি কাস্টম ব্যাকএন্ড বা Vertex AI ব্যবহার করে অ্যাক্সেস করা হয়েছে) । (অফলাইন বা গোপনীয়তা মুখ্য হলে অন-ডিভাইস বিকল্পের চেয়ে কম অগ্রাধিকার)।
- কেন : ক্লাউড সমাধানগুলি শক্তিশালী মডেল এবং ব্যাপক ভাষা সমর্থন অফার করে, তবে সংযোগের প্রয়োজন হয় এবং খরচ হতে পারে৷
জেনারেটিভ এআই
আপনাকে নতুন বিষয়বস্তু তৈরি করতে হবে, সংক্ষিপ্ত করতে হবে, পুনরায় লিখতে হবে বা জটিল বোঝাপড়া বা ইন্টারঅ্যাকশন কাজ করতে হবে।
অফলাইনে কাজ করার জন্য আপনার কি এআই প্রয়োজন, সর্বাধিক ডেটা গোপনীয়তা প্রয়োজন (ডিভাইসে ব্যবহারকারীর ডেটা রাখা), নাকি ক্লাউড ইনফারেন্স খরচ এড়াতে চান?
- ক) হ্যাঁ , অফলাইন, সর্বাধিক গোপনীয়তা, বা কোনও ক্লাউড খরচ গুরুত্বপূর্ণ নয়৷
- → অন-ডিভাইস জেনারেটিভ এআই- এ যান
- খ) না , সংযোগ উপলব্ধ এবং গ্রহণযোগ্য, ক্লাউড ক্ষমতা এবং মাপযোগ্যতা আরও গুরুত্বপূর্ণ, বা নির্দিষ্ট বৈশিষ্ট্যগুলির জন্য ক্লাউড প্রয়োজন।
- → ক্লাউড জেনারেটিভ এআই- এ যান
অন-ডিভাইস জেনারেটিভ এআই (জেমিনি ন্যানো ব্যবহার করে)
সতর্কতা : সামঞ্জস্যপূর্ণ অ্যান্ড্রয়েড ডিভাইস, সীমিত iOS সমর্থন, নির্দিষ্ট টোকেন সীমা (1024 প্রম্পট, 4096 প্রসঙ্গ), মডেলগুলি ক্লাউড সমকক্ষের তুলনায় কম শক্তিশালী।
আপনার ব্যবহারের ক্ষেত্রে কি বিশেষভাবে ML Kit GenAI API দ্বারা প্রদত্ত সুবিন্যস্ত কাজগুলির সাথে মেলে? (টেক্সট সংক্ষিপ্ত করুন, প্রুফরিড পাঠ্য, পাঠ্য পুনঃলিখন, চিত্রের বিবরণ তৈরি করুন) এবং টোকেন সীমা কি যথেষ্ট?
- ক) হ্যাঁ :
- → ব্যবহার করুন: ML Kit GenAI APIs (জেমিনি ন্যানো দ্বারা চালিত)
- কেন : ডিভাইসে নির্দিষ্ট, সাধারণ জেনারেটিভ কাজগুলিকে একীভূত করার সবচেয়ে সহজ উপায়, সর্বোচ্চ অগ্রাধিকার অন-ডিভাইস সমাধান।
- খ) না (আপনাকে নির্দিষ্ট ML Kit GenAI API-এর বাইরে আরও নমনীয় প্রম্পটিং বা কাজগুলির প্রয়োজন, তবে এখনও ন্যানো-এর ক্ষমতার মধ্যে ডিভাইসে কার্যকর করতে চান):
- → ব্যবহার করুন: জেমিনি ন্যানো পরীক্ষামূলক অ্যাক্সেস
- কেন : ন্যানো-এর সীমাবদ্ধতাকে সম্মান করে কাঠামোগত ML Kit GenAI API-এর বাইরে ব্যবহারের ক্ষেত্রে ডিভাইসে খোলা প্রম্পট করার ক্ষমতা প্রদান করে।
ক্লাউড জেনারেটিভ এআই
আরও শক্তিশালী মডেল ব্যবহার করে, কানেক্টিভিটি প্রয়োজন, সাধারণত অনুমান খরচ জড়িত, বৃহত্তর ডিভাইসের নাগাল এবং সহজ ক্রস-প্ল্যাটফর্ম (Android এবং iOS) ধারাবাহিকতা অফার করে।
আপনার অগ্রাধিকার কি: ফায়ারবেসের মধ্যে একীকরণের সহজতা বা সর্বাধিক নমনীয়তা/নিয়ন্ত্রণ?
- ক) সহজ ইন্টিগ্রেশন, একটি পরিচালিত API অভিজ্ঞতা পছন্দ করেন এবং সম্ভবত ইতিমধ্যেই Firebase ব্যবহার করছেন?
- → ব্যবহার করুন: Firebase AI লজিক SDK → Firebase AI লজিকে যান
- খ) সর্বাধিক নমনীয়তা প্রয়োজন, মডেলগুলির বিস্তৃত পরিসরে অ্যাক্সেস (তৃতীয়-পক্ষ/কাস্টম সহ), উন্নত ফাইন-টিউনিং এবং আপনার নিজস্ব ব্যাকএন্ড ইন্টিগ্রেশন (আরও জটিল) পরিচালনা করতে ইচ্ছুক?
- → ব্যবহার করুন: একটি কাস্টম ক্লাউড ব্যাকএন্ড সহ জেমিনি API (গুগল ক্লাউড প্ল্যাটফর্ম ব্যবহার করে)
- কেন : সর্বাধিক নিয়ন্ত্রণ, বিস্তৃত মডেল অ্যাক্সেস এবং কাস্টম প্রশিক্ষণের বিকল্পগুলি অফার করে তবে উল্লেখযোগ্য ব্যাকএন্ড বিকাশ প্রচেষ্টার প্রয়োজন৷ জটিল, বড় মাপের, বা অত্যন্ত কাস্টমাইজড প্রয়োজনের জন্য উপযুক্ত।
( আপনি Firebase AI Logic SDK বেছে নিয়েছেন) আপনার কি ধরনের জেনারেটিভ টাস্ক এবং পারফরম্যান্স প্রোফাইল প্রয়োজন?
- ক) কর্মক্ষমতা এবং খরচের ভারসাম্য প্রয়োজন, সাধারণ পাঠ্য তৈরির জন্য উপযুক্ত, সংক্ষিপ্তকরণ বা চ্যাট অ্যাপ্লিকেশন যেখানে গতি গুরুত্বপূর্ণ?
- → ব্যবহার করুন: Gemini Flash সহ Firebase AI লজিক SDK
- কেন : ভার্টেক্স এআই পরিচালিত পরিবেশের মধ্যে গতি এবং দক্ষতার জন্য অপ্টিমাইজ করা হয়েছে।
- খ) জটিল পাঠ্য তৈরি, যুক্তি, উন্নত NLU, বা নির্দেশ অনুসরণের জন্য উচ্চ মানের এবং ক্ষমতা প্রয়োজন?
- → ব্যবহার করুন: Gemini Pro এর সাথে Firebase AI Logic SDK
- কেন : ফায়ারবেসের মাধ্যমে অ্যাক্সেস করা কাজের চাহিদার জন্য আরও শক্তিশালী পাঠ্য মডেল।
- গ) পরিশীলিত ইমেজ জেনারেশন বা টেক্সট প্রম্পটের উপর ভিত্তি করে উন্নত ইমেজ বোঝার বা ম্যানিপুলেশন প্রয়োজন?
- → ব্যবহার করুন: Imagen 3 সহ Firebase AI লজিক SDK
- কেন : পরিচালিত ফায়ারবেস পরিবেশ ব্যবহার করে অত্যাধুনিক ইমেজ জেনারেশন মডেল অ্যাক্সেস করা হয়েছে।