मिनियो ने मेमकेवी जारी किया है, जो बड़े पैमाने पर एआई निष्कर्ष पाइपलाइनों के भीतर एक महत्वपूर्ण बाधा को हल करने के लिए बनाया गया एक समर्पित संदर्भ मेमोरी स्टोर है।AIStor के साथ MinIO के दूसरे प्रमुख समाधान के रूप में कार्य करना, MemKV फर्म के डेटा बुनियादी ढांचे को मेमोरी स्तर में विस्तारित करता है। इसे वितरित GPU क्लस्टर पर चलने वाले एजेंटिक AI वर्कलोड के लिए स्थायी, साझा संदर्भ डेटा वितरित करने के लिए इंजीनियर किया गया है।
मिनियो एआईस्टोर
जैसे-जैसे एआई सिस्टम एक बार के जवाब से लेकर बहु-चक्र तर्क और स्वचालित कार्य निष्पादन तक आगे बढ़ते हैं, निष्कर्ष चक्रों में निरंतर संदर्भ बनाए रखना तेजी से आवश्यक हो गया है।मौजूदा वास्तुकलाओं के तहत, संदर्भ डेटा को अक्सर एचबीएम और डीआरएएम सहित जीपीयू-पड़ोसी मेमोरी स्तरों की सीमित क्षमता के कारण खारिज कर दिया जाता है। इससे जीपीयू को मौजूदा संदर्भ को बार-बार पुनः गणना करने के लिए मजबूर किया जाता है, जिससे विलंबता बढ़ जाती है,गणना उपयोग और बिजली की खपत. MinIO इस अतिरिक्त कार्यभार को "पुनः गणना कर" के रूप में परिभाषित करता है, एक अक्षमता जो हाइपरस्केल क्लाउड वातावरण में घातीय रूप से खराब होती है।
MemKV को एक साझा, स्थायी मेमोरी परत के माध्यम से इस दर्द बिंदु को कम करने के लिए इंजीनियर किया गया है जो माइक्रोसेकंड स्तर के एक्सेस विलंबता के साथ पेटाबाइट पैमाने पर भंडारण करने में सक्षम है।निष्कर्ष कार्यप्रवाहों के दौरान संदर्भ डेटा को बनाए रखकर, यह प्लेटफॉर्म रिडंडेंट कंप्यूटिंग को कम करता है और समग्र बुनियादी ढांचे की दक्षता को बढ़ाता है।MinIO के आंतरिक बेंचमार्क डेटा उत्पादन-ग्रेड समवर्ती के तहत समय-से-पहले टोकन विलंबता में सुधार की पुष्टि करते हैं. 128 GPU और 128K-टोकन संदर्भ विंडो से लैस एक विशिष्ट तैनाती में, GPU उपयोग लगभग 50% से 90% से अधिक हो गया, जिससे वार्षिक कंप्यूटिंग लागत में काफी कमी आई।
MinIO के अधिकारियों ने कहा कि पुनः गणना ओवरहेड छोटे पैमाने पर तैनाती में ध्यान देने योग्य नहीं है, फिर भी उद्यम पैमाने पर एक मौलिक संरचनात्मक दोष में बदल जाता है।बार-बार संदर्भ पुनरुद्धार से बिजली की खपत और बुनियादी ढांचे के खर्च में वृद्धि होती है, जो विशेष स्मृति प्रणालियों को स्थायी एआई संचालन के लिए अपरिहार्य बनाता है।
मेमोरी-स्केल-कॉमर्स ऑफ को संबोधित करना
विरासत एआई बुनियादी ढांचा डेवलपर्स को एक्सेस गति और भंडारण क्षमता के बीच समझौता करने के लिए मजबूर करता है।एचबीएम और डीआरएएम जैसे उच्च प्रदर्शन वाले मेमोरी स्तर माइक्रोसेकंड विलंबता प्रदान करते हैं लेकिन सख्त क्षमता सीमाओं और उच्च लागतों के साथ आते हैंइसके विपरीत, पारंपरिक भंडारण प्रणालियां विशाल स्केलेबिलिटी प्रदान करती हैं, लेकिन मिलीसेकंड स्तर के विलंब से पीड़ित होती हैं, जिससे वे वास्तविक समय निष्कर्षण और लंबे संदर्भ तर्क कार्यों के साथ असंगत हो जाती हैं।
माइक्रोन एचबीएम4
मेमकेवी एक मध्यवर्ती साझा मेमोरी लेयर पेश करके इस उद्योग के अंतर को पाटता है जो अल्ट्रा-लो लेटेंसी और बड़े स्टोरेज स्केलेबिलिटी को संतुलित करता है।NVIDIA ब्लूफील्ड-4 STX के साथ मूल रूप से संगत और NIXL टूल के साथ NVIDIA Dynamo के साथ एकीकृत, समाधान पूरे जीपीयू समूहों को निष्कर्षण-संरेखित संचरण गति पर एकीकृत संदर्भ डेटा पूल तक पहुंचने में सक्षम बनाता है।यह डिज़ाइन अलग-अलग मेमोरी और भंडारण परतों के बीच लगातार संदर्भ डेटा माइग्रेशन को समाप्त करता है, विलंबता को कम करने और सिस्टम थ्रूपुट को बढ़ाने के लिए।
एनवीडिया ब्लूफील्ड-4
अनुमान कार्यभार के लिए अनुकूलित वास्तुकला
विशेष रूप से निष्कर्ष डेटा पाइपलाइन के लिए अनुकूलित, मेमकेवी MinIO के GPU मेमोरी पदानुक्रम ढांचे की G3.5 परत में फिट बैठता है।यह माइक्रोसेकंड एक्सेस विलंबता बनाए रखते हुए पेटाबाइट स्तर की क्षमता प्राप्त करता है, सफलतापूर्वक GPU कंप्यूटिंग संसाधनों से मेमोरी स्केलेबिलिटी को अलग करना।
यह प्रणाली बोझिल पारंपरिक भंडारण अमूर्तताओं को छोड़ देती है, एंड-टू-एंड आरडीएमए ट्रांसमिशन के माध्यम से एनवीएम ड्राइव से सीधे एआई डेटा पाइपलाइन में डेटा स्थानांतरित करती है।यह HTTP प्रोटोकॉल द्वारा लाए गए प्रदर्शन ओवरहेड को काटता है, फ़ाइल सिस्टम रूपांतरण और मध्यवर्ती भंडारण सर्वर वस्तु और फ़ाइल-आधारित भंडारण वास्तुकला में आम बाधाएं।
स्रोत: गूगल
प्रमुख वास्तुकला अनुकूलन में NVIDIA ब्लूफील्ड-4 STX पर मूल ARM64 बाइनरी निष्पादन शामिल है, जो बाहरी x86 स्टोरेज नोड्स पर निर्भरता को कम करने के लिए स्टोरेज परत के भीतर सीधे एम्बेडेड है।GPU मेमोरी और NVMe स्टोरेज के बीच सभी डेटा ट्रांसफर RDMA ट्रांसमिशन को अपनाते हैंइसके अतिरिक्त, मेमकेवी 2 एमबी से 16 एमबी तक के विस्तारित ब्लॉक आकारों का उपयोग करता है,जो पुराने 4 केबी स्टोरेज ब्लॉक के बजाय GPU थ्रूपुट विशेषताओं के लिए अनुकूलित हैंयह अत्याधुनिक हाई-स्पीड इंटरकनेक्शन फैब्रिक जैसे एनवीआईडीआईए स्पेक्ट्रम-एक्स ईथरनेट और पीसीआईई जेन 6 का समर्थन करता है, जिससे क्लस्टरों में वायर-स्पीड डेटा ट्रांसमिशन की सुविधा मिलती है।
उपलब्धता
मिनियो मेमकेवी अब व्यावसायिक रूप से उद्यम की तैनाती के लिए उपलब्ध है।
बीजिंग कियानक्सिंग जीएटोंग टेक्नोलॉजी कं, लिमिटेड
सैंडी यांग/वैश्विक रणनीति निदेशक
व्हाट्सएप / वीचैटः +86 13426366826
ईमेलः yangyd@qianxingdata.com
वेबसाइटः www.qianxingdata.com/www.storagesserver.com
व्यापार फोकसः
आईसीटी उत्पाद वितरण/सिस्टम एकीकरण और सेवाएं/पूर्वाधार समाधान
20+ वर्षों के आईटी वितरण अनुभव के साथ, हम विश्वसनीय उत्पादों और पेशेवर सेवाओं को वितरित करने के लिए अग्रणी वैश्विक ब्रांडों के साथ साझेदारी करते हैं।
एक बुद्धिमान दुनिया के निर्माण के लिए प्रौद्योगिकी का उपयोग करना आपका विश्वसनीय आईसीटी उत्पाद सेवा प्रदाता!
सैंडी यांग/वैश्विक रणनीति निदेशक
व्हाट्सएप / वीचैटः +86 13426366826
ईमेलः yangyd@qianxingdata.com
वेबसाइटः www.qianxingdata.com/www.storagesserver.com
व्यापार फोकसः
आईसीटी उत्पाद वितरण/सिस्टम एकीकरण और सेवाएं/पूर्वाधार समाधान
20+ वर्षों के आईटी वितरण अनुभव के साथ, हम विश्वसनीय उत्पादों और पेशेवर सेवाओं को वितरित करने के लिए अग्रणी वैश्विक ब्रांडों के साथ साझेदारी करते हैं।
एक बुद्धिमान दुनिया के निर्माण के लिए प्रौद्योगिकी का उपयोग करना आपका विश्वसनीय आईसीटी उत्पाद सेवा प्रदाता!



