logo
होम मामले

आईबीएम ने आरएजी वर्कलोड के लिए कंटेंट-अवेयर-स्टोरेज पेश किया

प्रमाणन
चीन Beijing Qianxing Jietong Technology Co., Ltd. प्रमाणपत्र
चीन Beijing Qianxing Jietong Technology Co., Ltd. प्रमाणपत्र
ग्राहक समीक्षा
बीजिंग Qianxing Jietong प्रौद्योगिकी कं, लिमिटेड के बिक्री कर्मचारी बहुत ही पेशेवर और धैर्यवान हैं। वे जल्दी से कोटेशन प्रदान कर सकते हैं। उत्पादों की गुणवत्ता और पैकेजिंग भी बहुत अच्छी है। हमारा सहयोग बहुत सहज है।

—— फेस्टफिंग डीवी》एलएलसी

जब मैं तत्काल इंटेल सीपीयू और तोशिबा एसएसडी की तलाश कर रहा था, बीजिंग कियानक्सिंग जिएटोंग टेक्नोलॉजी कंपनी लिमिटेड के सैंडी ने मुझे बहुत मदद दी और मुझे वे उत्पाद मिले जिनकी मुझे जल्दी जरूरत थी। मैं वास्तव में उसकी सराहना करता हूं।

—— किट्टी येन

बीजिंग Qianxing Jietong Technology Co., Ltd के सैंडी एक बहुत ही सावधान सेल्समैन हैं, जो मुझे सर्वर खरीदते समय कॉन्फ़िगरेशन त्रुटियों की याद दिला सकते हैं। इंजीनियर भी बहुत पेशेवर हैं और परीक्षण प्रक्रिया को जल्दी से पूरा कर सकते हैं।

—— स्ट्रेलकिन मिखाइल व्लादिमीरोविच

हमें बीजिंग क्वानक्सिंग जिटोंग के साथ काम करने का अनुभव बहुत अच्छा लगा। उत्पाद की गुणवत्ता उत्कृष्ट है, और डिलीवरी हमेशा समय पर होती है। उनकी बिक्री टीम पेशेवर, धैर्यवान और हमारे सभी सवालों के साथ बहुत मददगार है। हम वास्तव में उनके समर्थन की सराहना करते हैं और एक दीर्घकालिक साझेदारी की प्रतीक्षा करते हैं। अत्यधिक अनुशंसित!

—— अहमद नवीद

गुणवत्ता: ️मेरे आपूर्तिकर्ता के साथ महान अनुभव। MikroTik RB3011 पहले से ही इस्तेमाल किया गया था, लेकिन यह बहुत अच्छी स्थिति में था और सब कुछ सही ढंग से काम करता है। संचार तेज और चिकनी था,और मेरी सभी चिंताओं को जल्दी से संबोधित किया गया था. बहुत विश्वसनीय आपूर्तिकर्ता की अत्यधिक अनुशंसा की जाती है.

—— गेरान कोलेसियो

मैं अब ऑनलाइन चैट कर रहा हूँ

आईबीएम ने आरएजी वर्कलोड के लिए कंटेंट-अवेयर-स्टोरेज पेश किया

April 24, 2026
IBM ने एक कंटेंट-अवेयर स्टोरेज (CAS) आर्किटेक्चर का अनावरण किया है जो सीधे स्टोरेज लेयर के भीतर AI डेटा प्रोसेसिंग को एम्बेड करता है। यह दृष्टिकोण रिट्रीवल-ऑगमेंटेड जनरेशन (RAG) वर्कफ़्लो के लिए तैयार किया गया है, क्योंकि यह दस्तावेज़ वेक्टरिज़ेशन को स्टोरेज सिस्टम में ही एकीकृत करता है - बाहरी प्रीप्रोसेसिंग पाइपलाइनों की आवश्यकता को कम करता है।

CAS एक प्रमुख RAG फ़ंक्शन को स्थानांतरित करता है - बड़े भाषा मॉडल (LLM)-आधारित विधियों के माध्यम से दस्तावेज़ एम्बेडिंग - स्टोरेज इंफ्रास्ट्रक्चर में। यह उद्यमों को उनके मौजूदा स्थान पर डेटा को संसाधित और अनुक्रमित करने की अनुमति देता है, स्टोरेज सिस्टम को AI-संचालित वर्कलोड के साथ संरेखित करता है और विभिन्न इंफ्रास्ट्रक्चर टियर में डेटा मूवमेंट को कम करता है। IBM इसे परिनियोजन को सरल बनाने के साथ-साथ प्रदर्शन को बढ़ावा देने और AI अनुप्रयोगों के लिए डेटा स्थानीयता को बढ़ाने के साधन के रूप में स्थापित करता है।

वेक्टर डेटाबेस एट स्केल


IBM के CAS कार्यान्वयन के मूल में सिमेंटिक खोज के लिए अनुकूलित एक वेक्टर डेटाबेस है। वेक्टर डेटाबेस अनुमानित निकटतम-पड़ोसी (ANN) खोज का समर्थन करते हैं, जिससे AI सिस्टम को कोसाइन समानता या L2 दूरी जैसे समानता मेट्रिक्स के आधार पर प्रासंगिक डेटा चंक्स को पुनः प्राप्त करने में सक्षम बनाया जाता है। यह क्षमता RAG के लिए मौलिक है, जहां उपयोगकर्ता प्रश्नों को वैक्टर में परिवर्तित किया जाता है और संदर्भ-जागरूक प्रतिक्रियाएं प्रदान करने के लिए अनुक्रमित उद्यम डेटा के खिलाफ मिलान किया जाता है।


के बारे में नवीनतम कंपनी का मामला आईबीएम ने आरएजी वर्कलोड के लिए कंटेंट-अवेयर-स्टोरेज पेश किया  0
                                                                             IBM CAS चार्टस्रोत: IBM

IBM रिसर्च ने सैमसंग और NVIDIA के सहयोग से, एक प्रोटोटाइप सिस्टम का प्रदर्शन किया जो एक ही सर्वर पर 100 बिलियन वैक्टर तक स्केल करने में सक्षम है। सिस्टम ने 90 प्रतिशत से अधिक रिकॉल और सटीकता हासिल की, जिसमें औसत क्वेरी विलंबता 700 मिलीसेकंड से कम थी। यह पैमाना उद्यम वातावरण के लिए है जहां डेटासेट अरबों फ़ाइलों तक फैले हो सकते हैं, और एक बार पूरी तरह से अनुक्रमित होने के बाद, सैकड़ों अरबों वैक्टर तक बढ़ सकते हैं।

RAG पाइपलाइन एकीकरण


RAG उद्यम AI के लिए एक पसंदीदा दृष्टिकोण बन रहा है, क्योंकि यह मॉडल री-ट्रेनिंग की आवश्यकता के बिना आउटपुट सटीकता को बढ़ाता है। यह एक वेक्टर डेटाबेस से प्राप्त उद्यम-विशिष्ट डेटा के साथ प्रॉम्प्ट को पूरक करके काम करता है।

पाइपलाइन डेटा अंतर्ग्रहण के साथ शुरू होती है, जहां पीडीएफ और प्रस्तुतियों जैसे दस्तावेजों को पार्स किया जाता है, चंक्स में विभाजित किया जाता है, और एम्बेडिंग में परिवर्तित किया जाता है। ये एम्बेडिंग एक वेक्टर डेटाबेस में संग्रहीत होते हैं जो कुशल समानता खोज के लिए डेटा को व्यवस्थित करता है। क्वेरी के दौरान, उपयोगकर्ता इनपुट को एम्बेड किया जाता है और संग्रहीत वैक्टर के खिलाफ मिलान किया जाता है, जिसमें प्रासंगिक सामग्री को संदर्भ के रूप में भाषा मॉडल में पारित किया जाता है। यह ग्राउंडिंग तंत्र मतिभ्रम को कम करता है और AI-जनित आउटपुट में विश्वास बढ़ाता है।

IBM का CAS इस पूरी पाइपलाइन को सीधे स्टोरेज में एकीकृत करता है, डेटा के निकट अंतर्ग्रहण, अनुक्रमण और पुनर्प्राप्ति को समेकित करता है।

स्केल और लागत चुनौतियों का समाधान


उद्यम स्टोरेज सिस्टम पहले से ही पेटाबाइट स्केल पर काम करते हैं। जब CAS तक बढ़ाया जाता है, तो प्रत्येक फ़ाइल सैकड़ों वैक्टर उत्पन्न कर सकती है, जिससे डेटासेट का आकार तेज़ी से बढ़ सकता है। पारंपरिक वेक्टर डेटाबेस आमतौर पर कई सर्वरों में स्केल आउट होते हैं, जिससे अतिरिक्त लागत और परिचालन जटिलताएँ आती हैं। बड़े डेटासेट को अनुक्रमित और पुनः अनुक्रमित करना भी समय लेने वाले कार्य बन जाते हैं।

IBM का दृष्टिकोण वेक्टर घनत्व में सुधार और अनुक्रमण ओवरहेड को कम करने पर केंद्रित है ताकि इंफ्रास्ट्रक्चर स्प्राउल को सीमित किया जा सके। आर्किटेक्चर वेक्टर और इंडेक्स स्टोरेज को क्वेरी कंप्यूट से अलग करता है, जिससे स्टोरेज और कंप्यूट संसाधनों का स्वतंत्र स्केलिंग संभव होता है। यह IBM स्टोरेज स्केल और इसके उच्च-प्रदर्शन समानांतर फ़ाइल सिस्टम द्वारा संभव बनाया गया है।

स्टोरेज और हार्डवेयर आर्किटेक्चर


CAS कार्यान्वयन IBM स्टोरेज स्केल सिस्टम 6000 (ESS 6000) का लाभ उठाता है, जो AI और उच्च-प्रदर्शन वर्कलोड के लिए डिज़ाइन किया गया एक ऑल-फ्लैश प्लेटफ़ॉर्म है। सिस्टम 4U एनक्लोजर प्रति 48 NVMe ड्राइव तक का समर्थन करता है, जिसमें व्यक्तिगत ड्राइव क्षमताएं 7 TB से 60 TB तक होती हैं। यह PCIe Gen5, 400 Gb InfiniBand, या 200 Gb ईथरनेट कनेक्टिविटी को एकीकृत करता है, जो प्रति नोड 340 GB/s तक रीड और 175 GB/s राइट थ्रूपुट प्रदान करता है, साथ ही 7 मिलियन IOPS तक प्रदान करता है।

प्लेटफ़ॉर्म NVIDIA GPUDirect स्टोरेज का भी समर्थन करता है, जो स्टोरेज और GPUs के बीच सीधे डेटा पथ की सुविधा प्रदान करता है, साथ ही नेटवर्क और डेटा प्रोसेसिंग कार्यों को ऑफ़लोड करने के लिए BlueField-3 DPUs का भी समर्थन करता है।

सैमसंग PM9D3a PCIe Gen5 NVMe SSDs उच्च-थ्रूपुट, उच्च-घनत्व स्टोरेज प्रदान करते हैं। आठवीं पीढ़ी के TLC V-NAND पर आधारित, ये ड्राइव प्रति डिवाइस 30.72 TB तक प्रदान करते हैं, जिसमें 12 GB/s तक की अनुक्रमिक रीड गति और 6.8 GB/s तक की राइट गति होती है। व्यावसायिक रूप से उपलब्ध एंटरप्राइज़ SSDs का उपयोग वास्तुकला को मानक घटकों का उपयोग करके स्केल करने की अनुमति देता है।

पदानुक्रमित अनुक्रमण और GPU त्वरण


स्केल पर अनुक्रमण से निपटने के लिए, IBM ने एक पदानुक्रमित अनुक्रमण मॉडल विकसित किया है जिसमें कई उप-सूचकांक शामिल हैं जिन्हें स्वतंत्र रूप से अनुकूलित किया जा सकता है। यह संरचना पूरे डेटासेट को बाधित किए बिना वृद्धिशील अपडेट और स्थानीयकृत री-इंडेक्सिंग को सक्षम करती है, जिससे उपलब्धता और परिचालन दक्षता दोनों में सुधार होता है।

GPU त्वरण CPU-ओनली दृष्टिकोण की तुलना में अनुक्रमण समय को काफी कम कर देता है। CPU पर घंटों लगने वाले कार्यों को NVIDIA GPUs का उपयोग करके मिनटों में पूरा किया जा सकता है। परीक्षण में, 100 बिलियन वैक्टर के लिए इंडेक्स बनाने में 4 NVIDIA H200 GPUs के साथ 4 दिन लगे, जबकि एक डुअल-सॉकेट CPU सिस्टम पर अनुमानित 120 दिन लगे।

पूर्ण डेटासेट, जिसमें वैक्टर और इंडेक्स शामिल हैं, ने लगभग 153 TiB स्टोरेज का उपभोग किया। प्रारंभिक डेटा लोडिंग और विभाजन में नौ दिन लगे। परिणामी सिस्टम ने 90% रिकॉल के साथ 694ms का औसत क्वेरी विलंबता प्रदान की, जिसे ब्रूट-फोर्स ग्राउंड-ट्रुथ गणनाओं के मुकाबले मान्य किया गया।

रोडमैप


IBM और NVIDIA प्लेटफ़ॉर्म को अनुकूलित करना जारी रख रहे हैं, जो अनुक्रमण और क्वेरी विलंबता को कम करने पर ध्यान केंद्रित कर रहे हैं। वर्तमान लक्ष्यों में एक दिन के भीतर 100 बिलियन या अधिक वैक्टर को अनुक्रमित करना, डेटा अंतर्ग्रहण समय को नौ दिनों से एक दिन तक कम करना, और 90 प्रतिशत रिकॉल बनाए रखते हुए क्वेरी विलंबता को 50-100 मिलीसेकंड रेंज तक कम करना शामिल है।

मानक फ़ाइल सिस्टम में वेक्टर अनुक्रमण को एकीकृत करने का उद्देश्य परिनियोजन को सरल बनाना और उद्यम AI अपनाने के लिए बाधाओं को कम करना है। RAG क्षमताओं को सीधे स्टोरेज में एम्बेड करके, IBM CAS को AI-सक्षम इंफ्रास्ट्रक्चर के लिए एक मूलभूत परत के रूप में स्थापित कर रहा है।

बीजिंग कियानक्सिंग जिएटोंग टेक्नोलॉजी कं, लिमिटेड
सैंडी यांग/ग्लोबल स्ट्रेटेजी डायरेक्टर
व्हाट्सएप / वीचैट: +86 13426366826
ईमेल: yangyd@qianxingdata.com
वेबसाइट: www.qianxingdata.com/www.storagesserver.com
व्यावसायिक फोकस:
आईसीटी उत्पाद वितरण/सिस्टम एकीकरण और सेवाएं/इंफ्रास्ट्रक्चर समाधान
20+ वर्षों के आईटी वितरण अनुभव के साथ, हम विश्वसनीय उत्पाद और पेशेवर सेवाएं प्रदान करने के लिए अग्रणी वैश्विक ब्रांडों के साथ साझेदारी करते हैं।
“एक बुद्धिमान दुनिया बनाने के लिए प्रौद्योगिकी का उपयोग करना” आपके विश्वसनीय आईसीटी उत्पाद सेवा प्रदाता!
सम्पर्क करने का विवरण
Beijing Qianxing Jietong Technology Co., Ltd.

व्यक्ति से संपर्क करें: Ms. Sandy Yang

दूरभाष: 13426366826

हम करने के लिए सीधे अपनी जांच भेजें (0 / 3000)