ইমেজ অ্যানালাইসিস ইউজ কেস আপনার অ্যাপকে একটি CPU- অ্যাক্সেসযোগ্য ইমেজ প্রদান করে যার উপর আপনি ইমেজ প্রসেসিং, কম্পিউটার ভিশন বা মেশিন লার্নিং ইনফারেন্স করতে পারবেন। অ্যাপ্লিকেশনটি একটি analyze() পদ্ধতি প্রয়োগ করে যা প্রতিটি ফ্রেমে চালানো হয়।
কিভাবে আপনার CameraX অ্যাপের সাথে Google-এর ML কিট সংহত করতে হয় তা জানতে, ML Kit Analyzer দেখুন।
অপারেটিং মোড
যখন অ্যাপ্লিকেশানের বিশ্লেষণ পাইপলাইন CameraX এর ফ্রেম হারের প্রয়োজনীয়তাগুলি মেনে চলতে পারে না, তখন CameraX নিম্নলিখিত উপায়গুলির মধ্যে একটিতে ফ্রেম ড্রপ করার জন্য কনফিগার করা যেতে পারে:
নন-ব্লকিং (ডিফল্ট): এই মোডে, এক্সিকিউটর সর্বদা লেটেস্ট ইমেজটিকে একটি ইমেজ বাফারে ক্যাশে করে (একটির গভীরতা সহ একটি সারির অনুরূপ) যখন অ্যাপ্লিকেশনটি পূর্ববর্তী চিত্রটি বিশ্লেষণ করে। অ্যাপ্লিকেশান প্রক্রিয়াকরণ শেষ হওয়ার আগে CameraX একটি নতুন চিত্র গ্রহণ করলে, নতুন চিত্রটি একই বাফারে সংরক্ষণ করা হয়, পূর্ববর্তী চিত্রটি ওভাররাইট করে। মনে রাখবেন
ImageAnalysis.Builder.setImageQueueDepth()এই পরিস্থিতিতে কোন প্রভাব নেই, এবং বাফার বিষয়বস্তু সবসময় ওভাররাইট করা হয়। আপনিSTRATEGY_KEEP_ONLY_LATESTএর সাথেsetBackpressureStrategy()এ কল করে এই নন-ব্লকিং মোড সক্ষম করতে পারেন। নির্বাহক প্রভাব সম্পর্কে আরও তথ্যের জন্য,STRATEGY_KEEP_ONLY_LATESTএর রেফারেন্স ডকুমেন্টেশন দেখুন।ব্লক করা : এই মোডে, অভ্যন্তরীণ নির্বাহক অভ্যন্তরীণ চিত্র সারিতে একাধিক ছবি যোগ করতে পারে এবং সারিতে পূর্ণ হলেই ফ্রেম ড্রপ করা শুরু করে। ব্লকিং সম্পূর্ণ ক্যামেরা ডিভাইস স্কোপ জুড়ে ঘটে: ক্যামেরা ডিভাইসের একাধিক বাউন্ড ইউজ কেস থাকলে, ক্যামেরাএক্স এই ইমেজগুলি প্রক্রিয়া করার সময় সেই সমস্ত ব্যবহারের কেসগুলি ব্লক করা হবে। উদাহরণস্বরূপ, যখন পূর্বরূপ এবং চিত্র বিশ্লেষণ উভয়ই একটি ক্যামেরা ডিভাইসের সাথে আবদ্ধ থাকে, তখন ক্যামেরাএক্স চিত্রগুলি প্রক্রিয়া করার সময় পূর্বরূপও ব্লক করা হবে। আপনি
STRATEGY_BLOCK_PRODUCERsetBackpressureStrategy()এ পাস করে ব্লকিং মোড সক্ষম করতে পারেন। এছাড়াও আপনি ImageAnalysis.Builder.setImageQueueDepth() ব্যবহার করে ছবির সারির গভীরতা কনফিগার করতে পারেন।
একটি কম লেটেন্সি এবং উচ্চ পারফরম্যান্স বিশ্লেষকের সাথে যেখানে একটি ছবি বিশ্লেষণ করার মোট সময় একটি CameraX ফ্রেমের সময়কালের চেয়ে কম (উদাহরণস্বরূপ 60fps এর জন্য 16ms), হয় অপারেটিং মোড একটি মসৃণ সামগ্রিক অভিজ্ঞতা প্রদান করে। ব্লকিং মোড এখনও কিছু পরিস্থিতিতে সহায়ক হতে পারে, যেমন খুব সংক্ষিপ্ত সিস্টেম জিটারগুলির সাথে ডিল করার সময়।
একটি উচ্চ লেটেন্সি এবং উচ্চ কার্যক্ষমতা বিশ্লেষক সহ, দীর্ঘ সারির সাথে ব্লকিং মোডটি বিলম্বের জন্য ক্ষতিপূরণের জন্য প্রয়োজনীয়। নোট করুন, যাইহোক, অ্যাপ্লিকেশনটি এখনও সমস্ত ফ্রেম প্রক্রিয়া করতে পারে।
একটি উচ্চ লেটেন্সি এবং সময়-সাপেক্ষ বিশ্লেষক (বিশ্লেষক সমস্ত ফ্রেম প্রক্রিয়া করতে অক্ষম) সহ, একটি নন-ব্লকিং মোড একটি আরও উপযুক্ত পছন্দ হতে পারে, কারণ বিশ্লেষণের পথের জন্য ফ্রেমগুলি বাদ দিতে হবে, তবে অন্যান্য সমসাময়িক আবদ্ধ ব্যবহারের ক্ষেত্রে এখনও দেখা যেতে পারে। সমস্ত ফ্রেম
বাস্তবায়ন
আপনার অ্যাপ্লিকেশনে চিত্র বিশ্লেষণ ব্যবহার করতে, এই পদক্ষেপগুলি অনুসরণ করুন:
- একটি
ImageAnalysisব্যবহার কেস তৈরি করুন। - একটি
ImageAnalysis.Analyzerতৈরি করুন। - আপনার
ImageAnalysisআপনার বিশ্লেষক সেট করুন । - আপনার লাইফসাইকেলের মালিক, ক্যামেরা নির্বাচক এবং
ImageAnalysisব্যবহার কেসকে লাইফসাইকেলে আবদ্ধ করুন ।
বাঁধাই করার পরপরই, CameraX আপনার নিবন্ধিত বিশ্লেষকের কাছে ছবি পাঠায়। বিশ্লেষণ শেষ করার পর, ImageAnalysis.clearAnalyzer() কল করুন বা বিশ্লেষণ বন্ধ করতে ImageAnalysis ব্যবহারের ক্ষেত্রের আবদ্ধতা মুক্ত করুন।
ইমেজ অ্যানালাইসিস ব্যবহার কেস তৈরি করুন
ImageAnalysis আপনার বিশ্লেষককে (একটি ইমেজ ভোক্তা) CameraX এর সাথে সংযুক্ত করে, যা একটি ইমেজ প্রযোজক। অ্যাপ্লিকেশন একটি ImageAnalysis অবজেক্ট তৈরি করতে ImageAnalysis.Builder ব্যবহার করতে পারে। ImageAnalysis.Builder এর সাথে, অ্যাপ্লিকেশন নিম্নলিখিতগুলি কনফিগার করতে পারে:
- চিত্র আউটপুট পরামিতি:
- বিন্যাস: CameraX
setOutputImageFormat(int)এর মাধ্যমেYUV_420_888এবংRGBA_8888সমর্থন করে। ডিফল্ট ফরম্যাট হলYUV_420_888। - রেজোলিউশন এবং অ্যাস্পেক্ট রেশিও : আপনি এই প্যারামিটারগুলির যে কোনও একটি সেট করতে পারেন, তবে মনে রাখবেন যে আপনি একই সময়ে উভয় মান সেট করতে পারবেন না।
- ঘূর্ণন ।
- টার্গেট নাম : ডিবাগিং উদ্দেশ্যে এই প্যারামিটার ব্যবহার করুন।
- বিন্যাস: CameraX
- চিত্র প্রবাহ নিয়ন্ত্রণ:
অ্যাপ্লিকেশনগুলি রেজোলিউশন বা আকৃতির অনুপাত সেট করতে পারে, তবে উভয়ই নয়। সঠিক আউটপুট রেজোলিউশন অ্যাপ্লিকেশনটির অনুরোধকৃত আকার (বা আকৃতির অনুপাত) এবং হার্ডওয়্যার ক্ষমতার উপর নির্ভর করে এবং অনুরোধকৃত আকার বা অনুপাত থেকে ভিন্ন হতে পারে। রেজোলিউশন ম্যাচিং অ্যালগরিদম সম্পর্কে তথ্যের জন্য, setTargetResolution() এর জন্য ডকুমেন্টেশন দেখুন
একটি অ্যাপ্লিকেশন YUV (ডিফল্ট) বা RGBA কালার স্পেসে আউটপুট ইমেজ পিক্সেল কনফিগার করতে পারে। একটি RGBA আউটপুট বিন্যাস সেট করার সময়, CameraX অভ্যন্তরীণভাবে চিত্রগুলিকে YUV থেকে RGBA কালার স্পেসে রূপান্তর করে এবং ইমেজপ্রক্সির প্রথম প্লেনের ByteBuffer চিত্র বিটগুলি প্যাক করে (অন্য দুটি প্লেন ব্যবহার করা হয় না) নিম্নলিখিত ক্রম অনুসারে:
ImageProxy.getPlanes()[0].buffer[0]: alpha
ImageProxy.getPlanes()[0].buffer[1]: red
ImageProxy.getPlanes()[0].buffer[2]: green
ImageProxy.getPlanes()[0].buffer[3]: blue
...
জটিল চিত্র বিশ্লেষণ করার সময় যেখানে ডিভাইসটি ফ্রেম রেট ধরে রাখতে পারে না, আপনি এই বিষয়ের অপারেটিং মোড বিভাগে বর্ণিত কৌশলগুলির সাথে ফ্রেম ড্রপ করার জন্য CameraX কনফিগার করতে পারেন।
আপনার বিশ্লেষক তৈরি করুন
অ্যাপ্লিকেশনগুলি ImageAnalysis.Analyzer ইন্টারফেস এবং ওভাররাইডিং analyze(ImageProxy image) প্রয়োগ করে বিশ্লেষক তৈরি করতে পারে। প্রতিটি বিশ্লেষক, অ্যাপ্লিকেশন একটি ImageProxy পায়, যা Media.Image- এর জন্য একটি মোড়ক। ইমেজ ফরম্যাটটি ImageProxy.getFormat() দিয়ে জিজ্ঞাসা করা যেতে পারে। বিন্যাসটি নিম্নলিখিত মানগুলির মধ্যে একটি যা অ্যাপ্লিকেশনটি ImageAnalysis.Builder দিয়ে প্রদান করে:
-
ImageFormat.RGBA_8888যদি অ্যাপটিOUTPUT_IMAGE_FORMAT_RGBA_8888অনুরোধ করে। -
ImageFormat.YUV_420_888যদি অ্যাপটিOUTPUT_IMAGE_FORMAT_YUV_420_888অনুরোধ করে।
কালার স্পেস কনফিগারেশনের জন্য বিল্ড ইমেজ অ্যানালাইসিস ব্যবহার কেস দেখুন এবং যেখানে পিক্সেল বাইটগুলি পুনরুদ্ধার করা যেতে পারে।
একটি বিশ্লেষকের ভিতরে, অ্যাপ্লিকেশনটি নিম্নলিখিতগুলি করা উচিত:
- একটি প্রদত্ত ফ্রেম যত তাড়াতাড়ি সম্ভব বিশ্লেষণ করুন, বিশেষত প্রদত্ত ফ্রেম রেট সময়সীমার মধ্যে (উদাহরণস্বরূপ, 30 fps ক্ষেত্রের জন্য 32ms এর কম)। যদি অ্যাপ্লিকেশনটি একটি ফ্রেমকে যথেষ্ট দ্রুত বিশ্লেষণ করতে না পারে, তাহলে সমর্থিত ফ্রেম ড্রপিং প্রক্রিয়াগুলির একটি বিবেচনা করুন৷
-
ImageProxy.close()কল করে CameraX-এImageProxyছেড়ে দিন। মনে রাখবেন যে আপনি আবৃত Media.Image এর ক্লোজ ফাংশন (Media.Image.close()) কল করবেন না।
অ্যাপ্লিকেশন সরাসরি ImageProxy ভিতরে আবৃত Media.Image ব্যবহার করতে পারে. শুধু আবৃত ছবিতে Media.Image.close() কল করবেন না কারণ এটি CameraX-এর ভিতরে ইমেজ শেয়ারিং মেকানিজম ভেঙে দেবে; পরিবর্তে, CameraX-এ অন্তর্নিহিত Media.Image প্রকাশ করতে ImageProxy.close() ব্যবহার করুন।
ইমেজ অ্যানালাইসিসের জন্য আপনার বিশ্লেষক কনফিগার করুন
একবার আপনি একটি বিশ্লেষক তৈরি করার পরে, বিশ্লেষণ শুরু করতে এটি নিবন্ধন করতে ImageAnalysis.setAnalyzer() ব্যবহার করুন। একবার আপনার বিশ্লেষণ শেষ হলে, নিবন্ধিত বিশ্লেষকটি সরাতে ImageAnalysis.clearAnalyzer() ব্যবহার করুন।
শুধুমাত্র একটি সক্রিয় বিশ্লেষক ইমেজ বিশ্লেষণের জন্য কনফিগার করা যেতে পারে. ImageAnalysis.setAnalyzer() কল করা নিবন্ধিত বিশ্লেষককে প্রতিস্থাপন করে যদি এটি ইতিমধ্যে বিদ্যমান থাকে। অ্যাপ্লিকেশনগুলি ব্যবহারের ক্ষেত্রে বাঁধাই করার আগে বা পরে যে কোনও সময় একটি নতুন বিশ্লেষক সেট করতে পারে।
একটি জীবনচক্রে চিত্র বিশ্লেষণ আবদ্ধ করুন
ProcessCameraProvider.bindToLifecycle() ফাংশনের সাথে একটি বিদ্যমান AndroidX লাইফসাইকেলে আপনার ImageAnalysis আবদ্ধ করার জন্য এটি অত্যন্ত সুপারিশ করা হয়। মনে রাখবেন bindToLifecycle() ফাংশন নির্বাচিত Camera ডিভাইস ফেরত দেয়, যা এক্সপোজার এবং অন্যান্যের মতো উন্নত সেটিংস ঠিক করতে ব্যবহার করা যেতে পারে। ক্যামেরা আউটপুট নিয়ন্ত্রণ সম্পর্কে আরও তথ্যের জন্য এই নির্দেশিকা দেখুন।
নিম্নলিখিত উদাহরণটি পূর্ববর্তী পদক্ষেপগুলি থেকে সমস্ত কিছুকে একত্রিত করে, ক্যামেরাএক্স ImageAnalysis এবং Preview ব্যবহারের ক্ষেত্রে lifeCycle মালিকের সাথে আবদ্ধ করে:
কোটলিন
val imageAnalysis = ImageAnalysis.Builder() // enable the following line if RGBA output is needed. // .setOutputImageFormat(ImageAnalysis.OUTPUT_IMAGE_FORMAT_RGBA_8888) .setTargetResolution(Size(1280, 720)) .setBackpressureStrategy(ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST) .build() imageAnalysis.setAnalyzer(executor, ImageAnalysis.Analyzer { imageProxy -> val rotationDegrees = imageProxy.imageInfo.rotationDegrees // insert your code here. ... // after done, release the ImageProxy object imageProxy.close() }) cameraProvider.bindToLifecycle(this as LifecycleOwner, cameraSelector, imageAnalysis, preview)
জাভা
ImageAnalysis imageAnalysis = new ImageAnalysis.Builder() // enable the following line if RGBA output is needed. //.setOutputImageFormat(ImageAnalysis.OUTPUT_IMAGE_FORMAT_RGBA_8888) .setTargetResolution(new Size(1280, 720)) .setBackpressureStrategy(ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST) .build(); imageAnalysis.setAnalyzer(executor, new ImageAnalysis.Analyzer() { @Override public void analyze(@NonNull ImageProxy imageProxy) { int rotationDegrees = imageProxy.getImageInfo().getRotationDegrees(); // insert your code here. ... // after done, release the ImageProxy object imageProxy.close(); } }); cameraProvider.bindToLifecycle((LifecycleOwner) this, cameraSelector, imageAnalysis, preview);
অতিরিক্ত সম্পদ
CameraX সম্পর্কে আরও জানতে, নিম্নলিখিত অতিরিক্ত সংস্থানগুলি দেখুন৷