DapuStor J5060 स्पेसिफिकेशन्स
| J5060 | |
|---|---|
| क्षमता (TB) | 61.44 |
| फॉर्म फैक्टर | U.2 15mm |
| इंटरफ़ेस | PCIe 4.0 x4, NVMe 1.4a, डुअल-पोर्ट समर्थित |
| रीड/राइट बैंडविड्थ (128K) MB/s | 7400 / 3000 |
| रैंडम रीड/राइट (4KB) K IOPS | 1500 / 30 (16KB) |
| 4K रैंडम लेटेंसी (Typ.) R/W µs | 105 (4KB) / 33 (16KB) |
| 4K सीक्वेंशियल लेटेंसी (Typ.) R/W µs | 7 (4KB) / 12 (16KB) |
| टिपिकल पावर (W) | 23 |
| आइडल पावर (W) | 5 |
| फ्लैश टाइप | 3D एंटरप्राइज़ QLC NAND फ्लैश |
| एंड्योरेंस | 0.5 DWPD |
| MTBF | 2 मिलियन घंटे |
| UBER | 1 सेक्टर प्रति 10^17 बिट्स रीड |
| वारंटी | 5 साल |
DapuStor J5060 प्रदर्शन
चेकपॉइंटिंग
AI प्रशिक्षण वातावरण में Dapustor J5060 SSD के वास्तविक दुनिया के प्रदर्शन का मूल्यांकन करने के लिए, हमने डेटा और लर्निंग इनपुट/आउटपुट (DLIO) बेंचमार्क टूल का उपयोग किया। Argonne National Laboratory द्वारा विकसित, DLIO विशेष रूप से डीप लर्निंग वर्कलोड में I/O पैटर्न का परीक्षण करने के लिए डिज़ाइन किया गया है। यह स्टोरेज सिस्टम चेकपॉइंटिंग, डेटा इनजेशन और मॉडल ट्रेनिंग जैसी चुनौतियों को कैसे संभालते हैं, इस पर अंतर्दृष्टि प्रदान करता है। नीचे दिया गया चार्ट दर्शाता है कि दोनों ड्राइव 99 चेकपॉइंट्स में प्रक्रिया को कैसे संभालते हैं। मशीन लर्निंग मॉडल को प्रशिक्षित करते समय, चेकपॉइंट्स मॉडल की स्थिति को समय-समय पर सहेजने के लिए आवश्यक होते हैं, जिससे रुकावटों या बिजली की विफलता के दौरान प्रगति का नुकसान रोका जा सके। इस स्टोरेज मांग के लिए मजबूत प्रदर्शन की आवश्यकता होती है, खासकर लगातार या गहन वर्कलोड के तहत।
इस कार्य के लिए चुना गया प्लेटफ़ॉर्म हमारा Dell PowerEdge R760 था जो Ubuntu 22.04.02 LTS चला रहा था। हमने 13 अगस्त, 2024, रिलीज़ से DLIO बेंचमार्क संस्करण 2.0 का उपयोग किया। हमारी सिस्टम कॉन्फ़िगरेशन नीचे उल्लिखित है:
- 2 x Intel Xeon Gold 6430 (32-कोर, 2.1GHz)
- 16 x 64GB DDR5-4400
- 480GB Dell BOSS SSD
- सीरियल केबल्स Gen5 JBOF
- 61.44TB Dapustor J5060
- 61.44TB Solidigm D5-P5336
यह सुनिश्चित करने के लिए कि हमारे बेंचमार्किंग ने वास्तविक दुनिया के परिदृश्यों को दर्शाया, हमने LLAMA 3.1 405B मॉडल आर्किटेक्चर के आधार पर अपने परीक्षण किए। हमने मॉडल पैरामीटर, ऑप्टिमाइज़र स्टेट्स और लेयर स्टेट्स को कैप्चर करने के लिए torch.save() का उपयोग करके चेकपॉइंटिंग लागू की। हमारे सेटअप ने एक 8-GPU सिस्टम का अनुकरण किया, जिसमें 4-वे टेंसर पैरेलल और 2-वे पाइपलाइन पैरेलल प्रोसेसिंग को आठ GPUs में वितरित किया गया था। इस कॉन्फ़िगरेशन के परिणामस्वरूप 1,636GB के चेकपॉइंट आकार हुए, जो आधुनिक बड़े भाषा मॉडल प्रशिक्षण आवश्यकताओं का प्रतिनिधित्व करते हैं।
कुल मिलाकर, Dapustor J5060 ने परीक्षण के प्रारंभिक चरण के दौरान ठोस निरंतरता का प्रदर्शन किया, जिसमें पहले 33 चेकपॉइंट्स के लिए लगभग 575.66 सेकंड का समय लगा। 5060J ड्राइव के पहली बार भरे जाने से पहले उच्च प्रदर्शन बनाए रखने में सक्षम था। दूसरी ओर, Solidigm P5336, हालांकि शुरू में J5060 से धीमा था, परीक्षण जारी रहने पर लगातार प्रदर्शन प्रदर्शित किया।
समग्र औसत पर विचार करते हुए, Dapustor J5060 ने 769.44 सेकंड का समय पोस्ट किया, जबकि Solidigm P5336 ने640.17 सेकंड में समाप्त किया। यह चेकपॉइंट्स को तेज़ी से सहेजने के मामले में Solidigm P5336 को आगे रखता है।कुल मिलाकर, Dapustor J5060 छोटी ऑपरेशनों को अच्छी तरह से संभालता है लेकिन 30 मिनट से अधिक के लगातार राइट्स के साथ संघर्ष करता है। इस बीच, Solidigm P5336 लंबे समय तक चलने वाले कार्यों में लगातार प्रदर्शन के लिए बेहतर ड्राइव है। Dapustor J5060 से यह कमजोर राइट प्रदर्शन तब स्पष्ट होता है जब परीक्षण जारी रहने पर इसकी चेकपॉइंटिंग गति खराब हो जाती है।
GPU डायरेक्ट स्टोरेज
GPU डायरेक्ट स्टोरेज एक ऐसी तकनीक है जो स्टोरेज डिवाइस और GPUs के बीच सीधे डेटा ट्रांसफर को सक्षम करती है, CPU और सिस्टम मेमोरी को बायपास करती है। पारंपरिक डेटा ट्रांसफर में, डेटा स्टोरेज से CPU की मेमोरी में पढ़ा जाता है और फिर GPU की मेमोरी में कॉपी किया जाता है। इस प्रक्रिया में कई डेटा कॉपी शामिल होती हैं, जिससे विलंबता बढ़ जाती है और प्रदर्शन कम हो जाता है। CPU एक बाधा के रूप में कार्य करता है, क्योंकि इसे स्टोरेज और GPU के बीच डेटा ट्रांसफर को संभालना होता है। GDS सीधे स्टोरेज डिवाइस को GPU की मेमोरी में और उससे डेटा ट्रांसफर करने की अनुमति देकर इस बाधा को समाप्त करता है।
हमने रीड और राइट वर्कलोड दोनों में निम्नलिखित मापदंडों के प्रत्येक संयोजन का व्यवस्थित रूप से परीक्षण किया:
ब्लॉक आकार: 1M, 128K, 16K
- IO डेप्थ: 128, 64, 32, 16, 8, 4, 1
- जैसे ही हम अपने GDSIO परिणामों की समीक्षा करते हैं, हम 61.44TB Dapustor J5060 और Solidigm P5336 के रीड और राइट प्रदर्शन की जांच करते हैं।
GDSIO सीक्वेंशियल रीड परफॉरमेंस
Dapustor J5060 1M ब्लॉक आकार पर 4.2 GiB/s का पीक रीड थ्रूपुट प्राप्त करता है जिसमें IO डेप्थ 64 और 128 होती है। सबसे छोटे ब्लॉक आकार (16K) पर, IO डेप्थ बढ़ने पर प्रदर्शन 0.1 GiB/s से 0.8 GiB/s तक होता है। यह इष्टतम थ्रूपुट के लिए बड़े ब्लॉक आकार और उच्च IO डेप्थ के लिए एक स्पष्ट प्राथमिकता दिखाता है। पीक प्रदर्शन बड़े ब्लॉक आकार पर प्राप्त होता है, जो बल्क डेटा ट्रांसफर को संभालने में ड्राइव की दक्षता को इंगित करता है।
तुलनात्मक रूप से, Solidigm P5336 ने समान ब्लॉक आकार (1M) पर 4.3 GiB/s का समान अधिकतम थ्रूपुट प्राप्त किया, लेकिन IO डेप्थ 32 पर पहले ही वह प्रदर्शन हासिल कर लिया और उच्च IO डेप्थ पर इसे लगातार बनाए रखा। यह Solidigm P5336 के लिए बड़े ब्लॉक आकार को IO डेप्थ की एक विस्तृत श्रृंखला पर संभालने में थोड़ी बेहतर दक्षता का सुझाव देता है।
एक बेहतर तुलनात्मक दृश्य देने के लिए, हमारे पास दोनों ड्राइव की तुलना करने वाला एक अंतर चार्ट है। एक हरे रंग का ब्लॉक Dapustor SSD के लाभ को दर्शाता है, जबकि स्पेक्ट्रम के लाल पक्ष की ओर बढ़ने वाला ब्लॉक एक कमजोरी को दर्शाता है। यहां, J5060 P5336 से 128K ब्लॉक आकार में बेहतर प्रदर्शन करता है, सिवाय 4 से 8 IO डेप्थ के। हालांकि, 16K और 1M ब्लॉक आकार के साथ उच्च IO डेप्थ पर थ्रूपुट में गिरावट देखी जाती है, जो उन परिदृश्यों में कम दक्षता का संकेत देता है।
सीक्वेंशियल रीड लेटेंसी तुलना में, Solidigm P5336 लगभग सभी ब्लॉक आकार और IO डेप्थ में Dapustor J5060 की तुलना में लगातार कम लेटेंसी बनाए रखता है। 16K ब्लॉक आकार पर, कतार की गहराई बढ़ने पर अंतर अधिक स्पष्ट हो जाता है: J5060 गहराई 128 पर 2,329 μs पर चरम पर होता है, जबकि P5336 1,365 μs पर कम रहता है। 128K पर, Solidigm अधिकांश डेप्थ में फिर से आगे रहता है, उच्च लोड (J5060 पर 4,080 μs बनाम P5336 पर 5539 μs) पर गहराई 128 को छोड़कर। 1M ब्लॉक आकार पर, दोनों ड्राइव अपेक्षित रूप से लेटेंसी वृद्धि का अनुभव करते हैं, लेकिन P5336 थोड़ा बेहतर नियंत्रित रहता है, उच्चतम कतार की गहराई पर 29,138 μs बनाम 29,512 μs के साथ।
GDSIO सीक्वेंशियल राइट परफॉरमेंस
Dapustor J5060 सभी IO डेप्थ (128K, 1 IO डेप्थ आकार को छोड़कर, जिसने 2.2GiB/s पोस्ट किया) में 128K और 1M ब्लॉक आकार के लिए 2.7 से 2.8 GiB/s का लगातार राइट थ्रूपुट दिखाता है। 16K ब्लॉक आकार के लिए, प्रदर्शन 0.5 GiB/s से 1.4 GiB/s तक होता है, जो IO डेप्थ पर निर्भर करता है, उच्च IO डेप्थ पर 1.4 GiB/s पर चरम पर होता है।
तुलना में, Solidigm P5336 128K और 1M ब्लॉक आकार के दौरान बेहतर प्रदर्शन करता है, 3.2GiB/s पर चरम पर होता है। छोटे ब्लॉक आकार (16K) के लिए, Solidigm P5336 भी उच्च प्रदर्शन दिखाता है, IO डेप्थ 16 से 64 पर 1.4 GiB/s का पीक हासिल करता है। यह इंगित करता है कि Solidigm P5336 राइट ऑपरेशनों के दौरान छोटे ब्लॉक आकार के साथ थोड़ा अधिक कुशल है।
एक अंतर दृश्य पर बढ़ते हुए, हम Dapustor J5060 और Solidigm P5336 के राइट प्रदर्शन के बीच एक बड़ा अंतर देखते हैं। हमारा थ्रूपुट तुलना दिखाता है कि J5060 अधिकांश क्षेत्रों में P5336 से पीछे है, विशेष रूप से सभी IO डेप्थ में बड़े ब्लॉक आकार (1M) के साथ। थ्रूपुट ड्रॉप 4 IO डेप्थ पर -0.5 GiB/s तक पहुंचता है। जबकि 128K ब्लॉक आकार के साथ उच्च IO डेप्थ पर प्रदर्शन लाभ होता है, वे व्यापक अंडरपरफॉरमेंस की भरपाई के लिए पर्याप्त नहीं हैं।
Dapustor J5060 और Solidigm P5336 के बीच सीक्वेंशियल राइट लेटेंसी की तुलना करते समय, दोनों ड्राइव छोटे ब्लॉक आकार जैसे 16K पर समान व्यवहार प्रदर्शित करते हैं, Solidigm कम IO डेप्थ पर थोड़ा बढ़त रखता है, जबकि Dapustor उच्च डेप्थ (64 और 128) पर अंतर को बंद करता है। 128K ब्लॉक आकार पर, Solidigm फिर से उथले कतार डेप्थ पर आगे रहता है, लेकिन Dapustor लगातार IO डेप्थ बढ़ने पर कम लेटेंसी प्रदान करता है, जो लोड के तहत बेहतर स्केलिंग का संकेत देता है। हालांकि, 1M ब्लॉक आकार के साथ, Solidigm सभी IO डेप्थ में एक स्पष्ट लेटेंसी लाभ बनाए रखता है, भारी सीक्वेंशियल राइट वर्कलोड के तहत काफी तेज़ प्रतिक्रिया समय दिखाता है। कुल मिलाकर, Solidigm अधिक लगातार प्रदर्शन करता है, जबकि Dapustor की ताकत मध्य-आकार के ब्लॉक और गहरे कतारों पर अधिक दिखाई देती है।
FIO वर्कलोड सारांश
फ्लेक्सिबल I/O टेस्टर (FIO) एक उद्योग-मानक बेंचमार्किंग टूल है जिसका उपयोग विभिन्न प्रकार के वर्कलोड परिदृश्यों के तहत स्टोरेज डिवाइस के प्रदर्शन को मापने के लिए किया जाता है। इसकी बहुमुखी प्रतिभा और विश्वसनीयता के लिए विश्वसनीय, FIO वास्तविक दुनिया की स्थितियों का अनुकरण करता है, जो एक SSD की क्षमताओं और प्रदर्शन सीमाओं में अंतर्दृष्टि प्रदान करता है। StorageReview थ्रूपुट, लेटेंसी और IOPS को वर्कलोड पैटर्न, ब्लॉक आकार और कतार गहराई में मापकर व्यापक विश्लेषण प्रदान करने के लिए FIO का लाभ उठाता है।
लागू किए गए वर्कलोड:
128K सीक्वेंशियल रीड और राइट
- 64K रैंडम रीड्स और राइट्स
- 16K रैंडम रीड्स और राइट्स
- 4K रैंडम रीड्स और राइट्स
- ये वर्कलोड एंटरप्राइज़ उपयोग के मामलों का एक व्यापक स्पेक्ट्रम प्रस्तुत करते हैं, जिसमें बड़े सीक्वेंशियल ट्रांसफर, डेटाबेस के विशिष्ट गहन रैंडम I/O, और वर्चुअल वातावरण में आमतौर पर देखे जाने वाले छोटे-ब्लॉक रैंडम एक्सेस शामिल हैं।
यह प्रदर्शन अनुभाग Dapustor J5060 के प्रदर्शन को प्रमुख सिंथेटिक वर्कलोड में सारांशित करता है, जिसमें विभिन्न ब्लॉक आकार और कतार गहराई पर सीक्वेंशियल और रैंडम रीड/राइट ऑपरेशन शामिल हैं। मेट्रिक्स सीधे पार्स किए गए fio आउटपुट से निकाले जाते हैं और इसमें बैंडविड्थ (MB/s), IOPS, और 99.9999% तक लेटेंसी प्रतिशत शामिल होते हैं, जो लोड के तहत थ्रूपुट और टेल व्यवहार दोनों में अंतर्दृष्टि प्रदान करते हैं।
128K सीक्वेंशियल रीड और राइट परफॉरमेंस
ड्राइव
| IO डेप्थ | BW (MB/s) | IOPS | 99.0% | 99.9% | 99.99% | Dapustor J5060 रीड |
|---|---|---|---|---|---|---|
| 8T/32Q | 7,479 | 57,081 | 1.66 ms | 1.81 ms | 2.83 ms | Solidigm P5336 रीड |
| 8T/32Q | 7,479 | 57,057 | 1.51 ms | 1.66 ms | 1.81 ms | Dapustor J5060 राइट |
| 8T/32Q | 3,364 | 23,063 | 0.69 ms | 0.70 ms | 0.70 ms | Solidigm P5336 राइट |
| 8T/32Q | 3,364 | 25,669 | 2.67 ms | 3.48 ms | 4.42 ms | Dapustor J5060 128K पर प्रभावशाली सीक्वेंशियल रीड प्रदर्शन प्रदान करता है, जो उच्च प्रतिशत पर भी तंग लेटेंसी नियंत्रण के साथ 7.48GB/s तक पहुंचता है। Solidigm P5336 की तुलना में, J5060 का थ्रूपुट अनिवार्य रूप से समान है (7.48GB/s बनाम 7.47GB/s)। हालांकि, Solidigm लेटेंसी स्थिरता में थोड़ा बढ़त बनाए रखता है, जो थोड़ा कम टेल लेटेंसी प्रदर्शित करता है। |
128K सीक्वेंशियल राइट्स (QD16) पर, J5060 बहुत कम लेटेंसी के साथ 3,023MB/s का ठोस प्रदर्शन प्राप्त करता है। फिर भी, Solidigm P5336 इसे मध्यम अंतर से पार करता है, 3,364MB/s तक पहुंचता है, हालांकि विशेष रूप से 99.99% प्रतिशत पर (Dapustor के उल्लेखनीय रूप से कम 0.70ms बनाम 4.42ms) काफी अधिक लेटेंसी पर। यह इंगित करता है कि J5060 लेटेंसी-संवेदनशील सीक्वेंशियल राइट परिदृश्यों के लिए एक मजबूत उम्मीदवार है।
64K रैंडम रीड और राइट परफॉरमेंस
ड्राइव
| IO डेप्थ | BW (MB/s) | IOPS | 99.0% | 99.9% | 99.99% | Dapustor J5060 रीड |
|---|---|---|---|---|---|---|
| 8T/32Q | 847 | 114,058 | 20.05 ms | 21.89 ms | 22.68 ms | Solidigm P5336 रीड |
| 8T/32Q | 847 | 114,014 | 21.36 ms | 21.89 ms | 22.68 ms | Dapustor J5060 राइट |
| 8T/32Q | 847 | 8,151 | 574.6 ms | 708.8 ms | 742.39 ms | Solidigm P5336 राइट |
| 8T/32Q | 847 | 13,070 | 196.1 ms | 208.6 ms | 221.24 ms | 64K रैंडम रीड्स (QD256) में, Dapustor J5060 7.4GB/s के करीब थ्रूपुट और अच्छी तरह से नियंत्रित लेटेंसी के साथ उत्कृष्ट प्रदर्शन करता है। Solidigm के परिणाम बारीकी से मेल खाते हैं (7.47GB/s), जिसमें थोड़ा बेहतर अधिकतम प्रतिशत लेटेंसी है। दोनों ड्राइव यहां असाधारण रूप से प्रदर्शन करते हैं, जिसमें न्यूनतम व्यावहारिक अंतर हैं। |
64K रैंडम पर राइट प्रदर्शन वह जगह है जहां J5060 काफी संघर्ष करता है, थ्रूपुट 534MB/s तक तेजी से गिरता है और लेटेंसी काफी बढ़ जाती है (99.99% पर 742.39ms)। तुलना में, Solidigm P5336 J5060 से काफी बेहतर प्रदर्शन करता है, 857MB/s और काफी कम लेटेंसी (समान प्रतिशत पर 221.24ms) प्रदान करता है, जिससे यह लेटेंसी-संवेदनशील और लगातार राइट थ्रूपुट के लिए कहीं बेहतर अनुकूल है।
16K रैंडम रीड और राइट परफॉरमेंस
ड्राइव
| IO डेप्थ | BW (MB/s) | IOPS | 99.0% | 99.9% | 99.99% | Dapustor J5060 रीड |
|---|---|---|---|---|---|---|
| 8T/32Q | 847 | 453,461 | 5.28 ms | 6.39 ms | 8.16 ms | Solidigm P5336 रीड |
| 8T/32Q | 847 | 453,527 | 5.01 ms | 5.21 ms | 5.47 ms | Dapustor J5060 राइट |
| 8T/32Q | 847 | 32,404 | 143.65 ms | 149.94 ms | 181.40 ms | Solidigm P5336 राइट |
| 8T/32Q | 847 | 51,724 | 57.9 ms | 65.8 ms | 71.8 ms | 16K रैंडम रीड वर्कलोड (QD256) पर, Dapustor 453K IOPS और नियंत्रित लेटेंसी के साथ उत्कृष्ट परिणाम प्राप्त करता है। Solidigm P5336 अनिवार्य रूप से इस प्रदर्शन को दर्शाता है, लेटेंसी में Dapustor को थोड़ा पीछे छोड़ देता है (99.99% पर 5.47ms बनाम 8.16ms), जो भारी रैंडम रीड परिदृश्यों में Solidigm के लिए थोड़ी बेहतर लेटेंसी स्थिरता का सुझाव देता है। |
Dapustor SSD का 16K रैंडम राइट प्रदर्शन 32K IOPS तक काफी गिर जाता है, और लेटेंसी 181.4ms (99.99%) तक बढ़ जाती है। यहां फिर से, Solidigm Dapustor ड्राइव से काफी आगे निकल जाता है, 51.7K IOPS और नाटकीय रूप से बेहतर लेटेंसी प्रोफाइल (99.99% पर 71.8ms) प्रदान करता है, जो लेटेंसी-संवेदनशील रैंडम राइट वर्कलोड के लिए Solidigm के लाभ को रेखांकित करता है।
बीजिंग कियानक्सिंग जिएतोंग टेक्नोलॉजी कं, लिमिटेड
सैंडी यांग/ग्लोबल स्ट्रेटेजी डायरेक्टर
WhatsApp / WeChat: +86 13426366826
ईमेल: yangyd@qianxingdata.com
वेबसाइट: www.qianxingdata.com/www.storagesserver.com
व्यापार फोकस:
आईसीटी उत्पाद वितरण/सिस्टम एकीकरण और सेवाएँ/बुनियादी ढांचा समाधान
20+ वर्षों के आईटी वितरण अनुभव के साथ, हम विश्वसनीय उत्पाद और पेशेवर सेवाएं प्रदान करने के लिए अग्रणी वैश्विक ब्रांडों के साथ साझेदारी करते हैं।
"एक बुद्धिमान दुनिया बनाने के लिए प्रौद्योगिकी का उपयोग करना" आपके विश्वसनीय आईसीटी उत्पाद सेवा प्रदाता!
व्यक्ति से संपर्क करें: Ms. Sandy Yang
दूरभाष: 13426366826



