गूगल की नई एआई तकनीक खराब फोटो को भी बनाए साफ

यह ठीक वैसा ही है जैसे हम इंस्टाग्राम या वॉट्स ऐप स्टेटस को अपडेट करने से पहले उन्हें एडिट और एन्हांस करते हैं।

By: Mohmad Imran

Published: 12 Sep 2021, 07:18 PM IST

साइंस-फिक्शन फिल्मों की तर्ज पर गूगल ने दो नए टूल इंजन लॉन्च किए हैं। जेम्स बांड जैसी जासूसी फिल्मों में hero जिस तरह से किसी धुंधली तस्वीर या कार की नंबर प्लेट को तकनीक की मदद से एन्हांस कर के देखता है, अब आप भी अपनी ब्लर और बेहद खराब क्वालिटी की फोटो को ऐसे ही साफ कर सकेंगे यानी उसकी क्वालिटी को इम्प्रूव कर सकेंगे। गूगल के इस नवीनतम आर्टिफिशियल इंटेलिजेंस आधारित इंजन जिसे डिफ्यूजन मॉडल प्रसार मॉडल के रूप में जाना जाता है, यह सब करने में सक्षम हैं।

यह तकनीक वासतव में एक जटिल प्रक्रिया है क्योंकि खींची गई तस्वीर या वीडियो डिटेल में डिफ्यूजन मॉडल जो कुछ भी नया जोड़ता है वह कैमरे के द्वारा कभी खींचा ही नहीं गया। यह तकनीक दरअसल, आर्टिफिशियल इंटेलिजेंस आधारित इंजन की मदद से कुछ सुपर-स्मार्ट अनुमानों का उपयोग करके तस्वीरों को एन्हांस करने का करमी है। गूगल अपनी इस तकनीक को 'नेचुरल इमेज सिंथेसिस' कहता है जो खबरा से खराब तस्वीर को भी अच्छी क्वालिटी के साथ सुपर-रेजोल्यूशन में पेश करती है। यह बेहद खराब पिक्सल वाली तस्वीर को भी शार्प, क्रिस्टल क्लियर और नेचुरल फोटोग्राफ में तब्दील कर देती है। हालांकि, यह मूल तस्वीर से थोड़ी अलग हो सकती है लेकिन यह उसकी हूबहू कॉपी ही नजर आती है।

गूगल ने हाल ही दो नए एआइ टूल पेश किए हैं। पहला है सुपर रेजोल्यूशन या SR3 जो रिपीटेड रिफउइनमेंट की मदद से किसी फोटो की कमियोंं को दूर करने के लिए जरूरी तत्वों का समावेश करता है और फिर इस प्रक्रिया को उलट देता है। यह ठीक वैसा ही है जैसे आप अपने इंस्टाग्राम या वॉट्स ऐप स्टेटस को अपडेट करने से पहले उन्हें एडिट और एन्हांस करते हैं। गूगल के रिसर्च टीम के वैज्ञानिक जोनाथन हो और सॉफ्टवेयर इंजीनियर चितवन सहरिया बताते हैं कि एसआर३ फोटो के एक विशाल डेटाबेस और गूगल की अन्य मशीन लर्निंग तकनीकों की मदद से एक लो-रेजोल्यूशन फोटो को उसके हाई-रेजोल्यूशन वर्जन में पेश करता है।

वहीं गूगल का दूसरा टूल है, सीडीएमए या कैस्केडेड डिफ्यूजन मॉडल है। चितवन के अनुसार, यह किसी पाइपलाइन की तरह काम करता है, जिसका इस्तेमाल कर एसआर३ समेत अन्य डिफ्यूजन मॉडल्स हाई क्वालिटी इमेज रेजोल्यूशन अपग्रेड करते हैं। गूगल ने इन दोनों टूल्स पर पेपर भी प्रकाशित किए हैं। गूगल के दोनों नए एआई इंजन का परीक्षण इमेजनेट पर किया गया, जो आमतौर पर विजुअल ऑब्जेक्ट रिकग्निशन रिसर्च के लिए उपयोग की जाने वाली प्रशिक्षण छवियों का एक विशाल डेटाबेस है। परीक्षण में दोनों ही टूल ने अपनी ५० फीसदी गणनाएं बिल्कुल सटीक कीं। गूगल का कहना है कि उसके डिफ्यूजन मॉडल्स वैकल्पिक विकल्पों की तुलना में बेहतर परिणाम देते हैं, जिसमें जनरेटिव एडवरसैरियल नेटवर्क (जीएएन) भी शामिल हैं।

Show More
Mohmad Imran
और पढ़े
हमारी वेबसाइट पर कंटेंट का प्रयोग जारी रखकर आप हमारी गोपनीयता नीति और कूकीज नीति से सहमत होते हैं।
OK
Ad Block is Banned