मीडिया को बेहतर बनाने की सुविधाओं के बारे में जानकारी

आजकल के मोबाइल ऐप्लिकेशन, लोगों को वीडियो के साथ जोड़े रखने और उनकी दिलचस्पी बढ़ाने के लिए, उपयोगकर्ता जनरेट किए गए मीडिया पर काफ़ी हद तक निर्भर करते हैं. डिवाइस की अलग-अलग क्षमताओं, रोशनी की स्थितियों, और उपयोगकर्ता अनुभव की वजह से, ऐप्लिकेशन में कॉन्टेंट की क्वालिटी में स्वाभाविक तौर पर अंतर दिखता है. ऐसे ऐप्लिकेशन जो अलग-अलग सोर्स से मिली बड़ी संख्या में फ़ोटो और वीडियो मैनेज करते हैं उनके पास, उपयोगकर्ता जनरेट किए गए इस कॉन्टेंट की क्वालिटी को बेहतर बनाने का विकल्प होता है. क्वालिटी को ऑप्टिमाइज़ करने के लिए, एडिटिंग, अपलोड करने, और डाउनलोड करने जैसी कार्रवाइयों के लिए ज़रूरी कंप्रेस करने की सुविधा और हाई-फ़िडेलिटी कॉन्टेंट देखने के लिए ज़रूरी जानकारी के बीच सही संतुलन बनाए रखना ज़रूरी है.

Media Enhancement API की खास जानकारी

Google Play services में मौजूद Media Enhancement API, इस अंतर को पाटने के लिए, डिवाइस पर काम करने वाला एक ऐसा एआई सलूशन उपलब्ध कराता है जिसमें सभी सुविधाएं मौजूद हैं. यह इमेज और वीडियो की क्वालिटी बेहतर बनाने और उन्हें तेज़ी से लोड करने के लिए, डिवाइस पर मौजूद ग्राफ़िक्स प्रोसेसिंग यूनिट (जीपीयू) से तेज़ी लाने की सुविधा का इस्तेमाल करता है. यह सुविधा, टोन मैपिंग, डीब्लरिंग, डीनॉइज़िंग, और अपस्केलिंग जैसी सुविधाओं की मदद से, इमेज और वीडियो की क्वालिटी को बेहतर बनाती है.

Google Play services के ज़रिए, यह API, इमेज और वीडियो को बेहतर बनाने के लिए, ज़्यादा प्रोसेसिंग पावर की ज़रूरत वाली कार्रवाइयों को सीधे होस्ट डिवाइस के नेटिव जीपीयू और न्यूरल प्रोसेसिंग यूनिट (एनपीयू) पर ऑफ़लोड करता है. यह API, कम समय में प्रोसेस होने वाली, निजता बनाए रखने वाली पाइपलाइन उपलब्ध कराता है. साथ ही, यह एपीके ब्लोट से भी बचाता है. यह मॉडल को सिर्फ़ तब डाउनलोड करता है, जब उनकी ज़रूरत होती है, ताकि डिवाइस की डिस्क स्पेस को बचाया जा सके.

मुख्य सुविधाएं और इस्तेमाल के उदाहरण

फ़्रेमवर्क, मशीन लर्निंग की तीन मुख्य सुविधाओं की मदद से, मीडिया से जुड़ी खास समस्याओं को टारगेट करता है. इन सुविधाओं को अलग-अलग या एक साथ कॉन्फ़िगर किया जा सकता है:

सुविधा एल्गोरिदम से जुड़ा फ़ंक्शन ऐप्लिकेशन के लिए ऑप्टिमाइज़ किया गया इस्तेमाल का उदाहरण
टोनमैप यह एसडीआर-टू-एसडीआर लोकल टोन मैपिंग एल्गोरिदम है. यह स्टैंडर्ड डाइनैमिक रेंज (एसडीआर) वाली इमेज की क्वालिटी को बेहतर बनाता है, ताकि वे एचडीआर जैसी दिखें. जैसे, बेहतर लोकल कंट्रास्ट और ब्राइट शैडो. हालांकि, यह एसडीआर रेंज में ही काम करता है. यह रीयल टाइम में काम करने वाला, कम बैटरी खर्च करने वाला एल्गोरिदम है, जिसे मोबाइल पर बेहतर परफ़ॉर्मेंस के लिए ऑप्टिमाइज़ किया गया है. धुंधली, बादल वाली लैंडस्केप फ़ोटो या खराब बैकलाइट वाली इंडोर पोर्ट्रेट को बेहतर बनाना.
डीब्लर यह सब्जेक्ट की मोशन या कैमरे के हिलने की वजह से धुंधली हुई इमेज के शार्प किनारों को फिर से बनाता है. इसके लिए, यह धुंधलेपन की वजह का अनुमान लगाता है. यह क्रोमैटिक ग्रेन को स्मूद बनाने के लिए, स्पैटियल फ़िल्टरिंग का इस्तेमाल करता है. साथ ही, यह डीब्लॉकिंग फ़िल्टर के तौर पर काम करता है, ताकि शार्प किनारों के पास कंप्रेस करने से होने वाली समस्याओं को कम किया जा सके. धुंधली या हिलती हुई फ़ोटो को बेहतर बनाना, कम रोशनी में ली गई ग्रेनी इमेज की क्वालिटी को बेहतर बनाना, और कंप्रेस की गई JPEG इमेज और वीडियो स्ट्रीम से ब्लॉक वाले आर्टफ़ैक्ट हटाना.
अपस्केल यह पिक्सल की संख्या बढ़ाने और हाई-फ़्रीक्वेंसी की जानकारी को फिर से बनाने के लिए, सुपर-रिज़ॉल्यूशन जनरेटिव मॉडल का इस्तेमाल करता है. छोटी थंबनेल या स्टैंडर्ड-डेफ़िनिशन वाली वीडियो फ़ाइलों को फ़ुल-स्क्रीन पर दिखाने के लिए, उनकी क्वालिटी को बेहतर बनाना.

हार्डवेयर की ज़रूरी शर्तें

मशीन लर्निंग या डीप लर्निंग मॉडल की मदद से, डिवाइस पर इन्फ़रेंस चलाने में समय लगता है. साथ ही, परफ़ॉर्मेंस इस बात पर निर्भर करती है कि डिवाइस, किन हार्डवेयर ऐक्सेलरेटर का इस्तेमाल करता है. Media Enhancement API को प्रीमियम-टियर वाले उन डिवाइसों के लिए ऑप्टिमाइज़ किया गया है जिनमें खास टेंसर कोर और हाई-बैंडविड्थ मेमोरी मौजूद है. जैसे, Pixel 10 Pro या Samsung Galaxy S26 Ultra.

अगर किसी डिवाइस का हार्डवेयर, परफ़ॉर्मेंस के लिए तय की गई ज़रूरी शर्तों को पूरा नहीं करता है, तो इनिशियलाइज़ेशन की प्रोसेस रुक जाती है. साथ ही, यह प्रोसेस, फ़्रेम ड्रॉप या थर्मल थ्रॉटलिंग को रोकने के लिए, 'सपोर्ट नहीं करता' वाला स्टेटस दिखाती है.