WEKA ने अपने NeuralMesh प्लेटफॉर्म को NVIDIA STX संदर्भ वास्तुकला के साथ एकीकरण की घोषणा की है,अपनी संवर्धित स्मृति ग्रिड को अगली पीढ़ी के एआई बुनियादी ढांचे के लिए एक प्रमुख बिल्डिंग ब्लॉक के रूप में स्थापित करने के लिएसंयुक्त समाधान बड़े पैमाने पर निष्कर्ष वातावरण में सबसे महत्वपूर्ण बाधाओं में से एक को संबोधित करता हैः प्रदर्शन को सीधे प्रभावित करने वाले मेमोरी प्रतिबंध, स्वामित्व की कुल लागत,और स्केलेबल वृद्धि.
न्यूरलमेश के माध्यम से काम करते हुए, WEKA की ऑगमेंटेड मेमोरी ग्रिड बाहरीकरण और स्थायी कुंजी-मूल्य कैश द्वारा GPU मेमोरी का विस्तार करती है। जब NVIDIA STX के साथ तैनात किया जाता है,यह आर्किटेक्चर एजेंटिक एआई वर्कलोड के लिए उच्च-थ्रूपुट संदर्भ मेमोरी स्टोरेज प्रदान करता है, सत्रों, उपकरणों और एंड-टू-एंड वर्कफ़्लो में लंबे संदर्भ तर्क का समर्थन करता है। कंपनी के अनुसार, एनवीआईडीआईए वेरा रूबिन एनवीएल 72 सिस्टम, ब्लूफील्ड -4 डीपीयू,और स्पेक्ट्रम-एक्स ईथरनेट संदर्भ स्मृति टोकन थ्रूपुट को 4x से 10x तक बढ़ा सकता हैयह प्लेटफॉर्म कम से कम 320 जीबी/सेकंड रीड और 150 जीबी/सेकंड राइट थ्रूपुट प्रदान करने का भी अनुमान है, जो पारंपरिक एआई स्टोरेज आर्किटेक्चर के प्रदर्शन को दोगुना से अधिक है।
मेमोरी इन्फ्रास्ट्रक्चर इन्फर्मेशन की बाधा बन जाता है
WEKA इस एकीकरण को आधुनिक एआई तैनाती में बढ़ती स्मृति दीवार चुनौती पर केंद्रित करता है। आज के निष्कर्ष पाइपलाइनों के भीतर, सीमित उच्च बैंडविड्थ जीपीयू मेमोरी अक्सर केवी कैश निकासी को मजबूर करती है,बार-बार पुनः गणना और कम परिचालन दक्षता के लिए अग्रणीजैसे-जैसे सिस्टम समवर्तीता बढ़ती है, ये अक्षमताएं गुणा होती हैं, जिससे बुनियादी ढांचे के खर्च बढ़ते हैं और प्रदर्शन की पूर्वानुमान्यता कम होती है।
कंपनी समाधान के रूप में साझा केवी कैश बुनियादी ढांचे को बढ़ावा देती है। उपयोगकर्ताओं और सत्रों के बीच निरंतर संदर्भ को संरक्षित करके,साझा कैशिंग अतिरेक प्रसंस्करण को समाप्त करता है और टोकन थ्रूपुट को स्थिर करता है. NVIDIA STX इस मॉडल के लिए मान्य संदर्भ वास्तुकला प्रदान करता है, जबकि WEKA भंडारण और मेमोरी विस्तार परत प्रदान करता है।
न्यूरलमेश और ऑगमेंटेड मेमोरी ग्रिड आर्किटेक्चर
न्यूरलमेश WEKA के वितरित भंडारण मंच के रूप में कार्य करता है, जिसे पूरे NVIDIA STX स्टैक में निर्बाध रूप से एकीकृत करने के लिए बनाया गया है। यह AI वर्कलोड के लिए अनुकूलित उच्च प्रदर्शन डेटा सेवाएं प्रदान करता है,जबकि संवर्धित मेमोरी ग्रिड एक समर्पित मेमोरी विस्तार परत के रूप में कार्य करता है जो GPU मेमोरी के बाहर केवी कैश को समेकित करता है.
यह डिज़ाइन अनुमेय वातावरण को GPU संसाधनों को अधिभारित किए बिना लंबे संदर्भ सत्रों को बनाए रखने की अनुमति देता है। कैश स्थिति को बनाए रखकर और कार्यभारों में पुनः उपयोग को सक्षम करके,मंच उच्च उपयोग और निरंतर प्रदर्शन को बनाए रखता है क्योंकि तैनाती पैमाने.
WEKA नोट करता है कि ऑगमेंटेड मेमोरी ग्रिड, पहली बार GTC 2025 में अनावरण किया गया और अब आम तौर पर उपलब्ध है, को ब्लूफील्ड डीपीयू के साथ जोड़े गए एनवीआईडीआईए ग्रेस सीपीयू प्लेटफार्मों पर मान्य किया गया है।वास्तुकला निष्कर्षण दक्षता में मापनीय लाभ प्रदान करती है, जिसमें तेजी से तेज़ टाइम-टू-फर्स्ट-टोकन, उच्च प्रति-जीपीयू टोकन थ्रूपुट, और बढ़ी हुई समवर्तीता के तहत स्थिर प्रदर्शन शामिल है।ब्लूफील्ड-4 के लिए डेटा पथ को ऑफलोड करने से सीपीयू ओवरहेड भी कम होता है और आई/ओ की बाधाएं कम होती हैं.
प्रदर्शन और दक्षता में वृद्धि
उत्पादन जैसे वातावरण में, मंच को प्रतिक्रियाशीलता और बुनियादी ढांचे की दक्षता बढ़ाने के लिए इंजीनियर किया गया है।WEKA का कहना है कि संवर्धित मेमोरी ग्रिड 4x से 20x तक पहले टोकन के समय को कम कर सकता है, जबकि प्रति-जीपीयू टोकन आउटपुट को 6.5 गुना तक बढ़ाता है। ये सुधार उच्च KV कैश हिट दरों और कम पुनः गणना चक्रों से उत्पन्न होते हैं,संदर्भ के आकार और उपयोगकर्ता संख्या के विस्तार के साथ सिस्टम को प्रदर्शन बनाए रखने में सक्षम बनाना.
एआई बुनियादी ढांचे के प्रदाता फर्मस को एनवीआईडीआईए-आधारित बुनियादी ढांचे के साथ न्यूरलमेश का लाभ उठाने वाले शुरुआती अपनाने वाले के रूप में उजागर किया गया है। फर्म बेहतर टोकन थ्रूपुट और पैमाने पर कम विलंबता की रिपोर्ट करती है।,अतिरिक्त हार्डवेयर की तैनाती के बजाय मौजूदा जीपीयू के अधिक कुशल उपयोग से प्राप्त लाभ के साथ।
एआई बुनियादी ढांचे के डिजाइन के लिए प्रभाव
यह एकीकरण एआई प्रणाली डिजाइन में बदलाव को उजागर करता है, जहां मेमोरी और स्टोरेज रणनीतियां तेजी से समग्र प्रदर्शन और लागत दक्षता को परिभाषित करती हैं।जैसे-जैसे एजेंटिक एआई वर्कलोड बढ़ता है और संदर्भ खिड़कियां व्यापक होती हैं, DRAM-केवल दृष्टिकोण बढ़ी हुई पुनर्गणना लागत और कम उपयोग किए गए GPU के कारण अस्थिर हो जाते हैं।
WEKA स्थायी, साझा KV कैश को एआई कारखानों के लिए एक मौलिक क्षमता के रूप में स्थान देता है। इस मॉडल को अपनाने वाले संगठन उच्च जीपीयू उपयोग प्राप्त कर सकते हैं,निष्कर्षण कार्य प्रति कम ऊर्जा खपतइसके विपरीत, स्थानीय जीपीयू मेमोरी पर पूरी तरह से निर्भर वातावरणों को कार्यभार बढ़ने के साथ परिचालन लागत में वृद्धि और कम होने वाले रिटर्न का सामना करना पड़ेगा।
बीजिंग कियानक्सिंग जीएटोंग टेक्नोलॉजी कं, लिमिटेड
सैंडी यांग/वैश्विक रणनीति निदेशक
व्हाट्सएप / वीचैटः +86 13426366826
ईमेलः yangyd@qianxingdata.com
वेबसाइटः www.qianxingdata.com/www.storagesserver.com
व्यापार फोकसः
आईसीटी उत्पाद वितरण/सिस्टम एकीकरण और सेवाएं/पूर्वाधार समाधान
20+ वर्षों के आईटी वितरण अनुभव के साथ, हम विश्वसनीय उत्पादों और पेशेवर सेवाओं को वितरित करने के लिए अग्रणी वैश्विक ब्रांडों के साथ साझेदारी करते हैं।
एक बुद्धिमान दुनिया के निर्माण के लिए प्रौद्योगिकी का उपयोग करना आपका विश्वसनीय आईसीटी उत्पाद सेवा प्रदाता!
सैंडी यांग/वैश्विक रणनीति निदेशक
व्हाट्सएप / वीचैटः +86 13426366826
ईमेलः yangyd@qianxingdata.com
वेबसाइटः www.qianxingdata.com/www.storagesserver.com
व्यापार फोकसः
आईसीटी उत्पाद वितरण/सिस्टम एकीकरण और सेवाएं/पूर्वाधार समाधान
20+ वर्षों के आईटी वितरण अनुभव के साथ, हम विश्वसनीय उत्पादों और पेशेवर सेवाओं को वितरित करने के लिए अग्रणी वैश्विक ब्रांडों के साथ साझेदारी करते हैं।
एक बुद्धिमान दुनिया के निर्माण के लिए प्रौद्योगिकी का उपयोग करना आपका विश्वसनीय आईसीटी उत्पाद सेवा प्रदाता!



