Apple ने इस साल कई ओपन सोर्स आर्टिफिशियल इंटेलिजेंस (AI) मॉडल जारी किए। ये मुख्य रूप से छोटे भाषा मॉडल हैं जो विशेष रूप से विशिष्ट कार्यों के लिए डिज़ाइन किए गए हैं। इसके अतिरिक्त, क्यूपर्टिनो-आधारित टेक दिग्गज ने अब डेप्थ प्रो नामक एक नया एआई मॉडल जारी किया है। यह एक दृश्य मॉडल है जो किसी भी छवि का एकल-आंख गहराई मानचित्र उत्पन्न कर सकता है। इस तकनीक का उपयोग 3 डी बनावट, संवर्धित वास्तविकता (एआर), और बहुत कुछ उत्पन्न करने के लिए किया जा सकता है। परियोजना के पीछे शोधकर्ताओं का दावा है कि एआई कई कैमरों की मदद से उत्पादित लोगों की तुलना में बेहतर गहराई के नक्शे का उत्पादन करता है।

Apple गहरे समर्थक एआई मॉडल जारी करता है

3 डी मॉडलिंग और विभिन्न अन्य प्रौद्योगिकियों (जैसे एआर, स्वायत्त ड्राइविंग सिस्टम, रोबोटिक्स, आदि) में गहराई का अनुमान एक महत्वपूर्ण प्रक्रिया है। मानव आंख एक जटिल लेंस प्रणाली है जो किसी वस्तु की गहराई का सही मूल्यांकन करती है, यहां तक कि एक बिंदु के नजरिए से उन्हें देखने पर भी। हालांकि, कैमरे इसमें अच्छे नहीं हैं। एक एकल कैमरे के साथ ली गई छवियां इसे दो-आयामी दिखाई देती हैं, समीकरण से गहराई को दूर करती हैं।

इसलिए, प्रौद्योगिकी में कई कैमरों का उपयोग किया जाता है जो किसी वस्तु की गहराई में महत्वपूर्ण भूमिका निभाता है। हालाँकि, इस तरह की वस्तु मॉडलिंग समय लेने वाली और संसाधन-गहन हो सकती है। इसके बजाय, एक शोध पत्र में “डेप्थ प्रो: शार्प मोनोक्यूलर मापने की गहराई एक सेकंड से भी कम समय में,” Apple पर प्रकाश डाला गया है कि यह ऑब्जेक्ट मोनोक्यूलर छवियों के शून्य-शूट गहराई के नक्शे उत्पन्न करने के लिए विज़न-आधारित एआई मॉडल का उपयोग कैसे करता है।

सेब की गहराई समर्थक github सेब की गहराई प्रो

गहराई प्रो एआई मॉडल के साथ गहराई के नक्शे कैसे उत्पन्न करें
छवि स्रोत: सेब

एआई मॉडल विकसित करने के लिए, शोधकर्ताओं ने एक विज़न ट्रांसफार्मर-आधारित (वीआईटी) आर्किटेक्चर का उपयोग किया। 384 x 384 के आउटपुट रिज़ॉल्यूशन को चुना गया था, लेकिन इनपुट और प्रोसेसिंग रिज़ॉल्यूशन को 1536 x 1536 पर रखा गया था, जिससे एआई मॉडल को विवरणों को समझने के लिए और अधिक कमरा मिला।

इस लेख के एक प्रीप्रिंट संस्करण में, वर्तमान में ऑनलाइन दैनिक Arxiv में प्रकाशित, शोधकर्ताओं का दावा है कि AI मॉडल अब नेत्रहीन जटिल वस्तुओं जैसे कि पिंजरों, प्यारे बिल्ली निकायों और मूंछों, आदि के गहराई से नक्शे उत्पन्न कर सकते हैं, यह कहा जाता है कि एक सेकंड एक सेकंड है। वर्तमान में, ओपन सोर्स एआई मॉडल का वजन GitHub सूची में है। इच्छुक लोग एक एकल GPU से निष्कर्षों के खिलाफ मॉडल चला सकते हैं।



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here