Apple आर्टिफिशियल इंटेलिजेंस के प्रदर्शन की गति (AI) मॉडल को बेहतर बनाने के लिए NVIDIA के साथ काम कर रहा है। क्यूपर्टिनो-आधारित टेक दिग्गज ने बुधवार को घोषणा की कि यह एनवीडिया प्लेटफॉर्म पर अनुमानित त्वरण का अध्ययन कर रहा है कि क्या यह एक साथ बड़ी भाषा मॉडल (एलएलएम) की दक्षता और विलंबता में सुधार कर सकता है। iPhone निर्माता एक तकनीक का उपयोग करते हैं जिसे आवर्तक Frafter (Redrafter) कहा जाता है, जो इस साल की शुरुआत में एक शोध पत्र में प्रकाशित हुआ था। इस तकनीक का उपयोग NVIDIA TENSORRT-LLM Inference त्वरण फ्रेमवर्क के साथ संयोजन में किया जाता है।

Apple AI प्रदर्शन को बेहतर बनाने के लिए NVIDIA प्लेटफॉर्म का उपयोग करता है

एक ब्लॉग पोस्ट में, Apple के शोधकर्ताओं ने LLM प्रदर्शन और इससे प्राप्त परिणामों के संबंध में NVIDIA के साथ नए सहयोग को विस्तृत किया। कंपनी ने जोर देकर कहा कि वह उन मुद्दों की जांच कर रही है जो एआई मॉडल में विलंबता बनाए रखते हुए निष्क्रियता दक्षता में सुधार करते हैं।

मशीन लर्निंग में अनुमान एक प्रशिक्षित मॉडल का उपयोग करते समय किसी दिए गए डेटा या इनपुट के आधार पर भविष्यवाणियों, निर्णयों या निष्कर्षों को बनाने की प्रक्रिया को संदर्भित करता है। संक्षेप में, यह एआई मॉडल के लिए एक प्रसंस्करण कदम है, जो कच्चे डेटा को संसाधित अनदेखी जानकारी में परिवर्तित करता है और परिवर्तित करता है।

इस साल की शुरुआत में, Apple ने प्रकाशित किया और डेटा के सट्टा डिकोडिंग के लिए नए तरीके लाए, जो कि redrafter तकनीक को खोल दिया था। आवर्तक तंत्रिका नेटवर्क (आरएनएन) के एक ड्राफ्ट मॉडल का उपयोग करते हुए, यह बीम खोज (वह तंत्र जिसके द्वारा एआई समाधान की कई संभावनाओं की पड़ताल करता है) और गतिशील पेड़ों से ध्यान आकर्षित करता है (पेड़ संरचना डेटा को संसाधित करने के लिए ध्यान तंत्र का उपयोग करके)। शोधकर्ताओं का कहना है कि यह एलएलएम टोकन पीढ़ी को गति दे सकता है, प्रति पीढ़ी के 3.5 टोकन तक।

हालांकि कंपनी दो प्रक्रियाओं के संयोजन से कुछ हद तक प्रदर्शन में सुधार करने में सक्षम थी, Apple ने जोर देकर कहा कि गति में काफी सुधार नहीं हुआ है। इस समस्या को हल करने के लिए, शोधकर्ताओं ने NVIDIA TENSORRT-LLM Inference त्वरण ढांचे में Redrafter को एकीकृत किया।

सहयोग के हिस्से के रूप में, NVIDIA ने नए ऑपरेटरों को जोड़ा है और सट्टा डिकोडिंग प्रक्रिया में सुधार करने के लिए मौजूदा लोगों का अनावरण किया है। द पोस्ट का दावा है कि Redrafter के साथ NVIDIA प्लेटफॉर्म का उपयोग करते समय, उन्होंने पाया कि प्रति सेकंड उत्पन्न टोकन में लालची डिकोडिंग के लिए 2.7 बार का त्वरण था (अनुक्रम पीढ़ी कार्य में उपयोग की जाने वाली एक डिकोडिंग रणनीति)।

Apple ने जोर देकर कहा कि कम GPU का उपयोग करते हुए और कम बिजली का सेवन करते हुए AI प्रसंस्करण में विलंबता को कम करने के लिए तकनीक का उपयोग किया जा सकता है।

नवीनतम तकनीकी समाचार और टिप्पणियों के लिए, कृपया गैजेट 360 का पालन करें एक्सफेसबुक, व्हाट्सएप, थ्रेडिंग और गूगल न्यूज। गैजेट और प्रौद्योगिकियों पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल की सदस्यता लें। यदि आप शीर्ष प्रभावकों के बारे में सभी जानना चाहते हैं, तो हमें Instagram और YouTube पर उस 360 के अंदर का पालन करें।

सैमसंग गैलेक्सी रिंग्स को दो नए आकार के विकल्पों में लॉन्च किया जा सकता है





Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here