चाबी छीनना
- एकल नोड में अभूतपूर्व थ्रूपुट:R7725xd 300 GB/s से अधिक आंतरिक बैंडविड्थ और NVMe-oF RDMA पर 160 GB/s से अधिक कायम है, जो 2U चेसिस के अंदर मल्टी-नोड स्टोरेज क्लस्टर को टक्कर देता है।
- ट्रू जेन5 आर्किटेक्चर, कोई स्विच नहीं, कोई फैन-आउट नहीं:सभी 24 माइक्रोन 9550 प्रो एसएसडी सीधे सीपीयू कॉम्प्लेक्स से समर्पित x4 PCIe Gen5 लेन प्राप्त करते हैं, जिससे बिना किसी विवाद के लाइन-रेट स्केलिंग की अनुमति मिलती है।
- AMD EPYC 9005 सीरीज द्वारा संचालित:डुअल AMD EPYC 9575F प्रोसेसर निरंतर उच्च-संगामिति I/O के लिए आवश्यक लेन काउंट, मेमोरी बैंडविड्थ और NUMA टोपोलॉजी प्रदान करते हैं।
- एआई, एनालिटिक्स और चेकपॉइंट-हैवी वर्कलोड के लिए डिज़ाइन किया गया:सिस्टम उन I/O बाधाओं को दूर करता है जो आधुनिक GPU पाइपलाइनों को रोकते हैं, जिससे निरंतर, उच्च-बैंडविड्थ डेटा डिलीवरी सक्षम होती है।
- पीक:एआईओ पूर्ण समानता को खोलता है:पीक: एआईओ का सॉफ्टवेयर स्टैक कतार संरचनाओं को लोड के तहत संतृप्त रखता है, एक आकर्षक डॉलर-प्रति-जीबी अनुपात पर उद्यम प्रदर्शन प्रदान करता है।
iDRAC 10 का भंडारण अनुभाग R7725xd में स्थापित सभी भौतिक डिस्क का संपूर्ण अवलोकन प्रस्तुत करता है। सारांश पैनल सभी कनेक्टेड ड्राइव की उच्च-स्तरीय गिनती प्रदर्शित करता है, साथ में एक विज़ुअल पाई चार्ट भी होता है जो ड्राइव की स्थिति को दर्शाता है। इस कॉन्फ़िगरेशन में, 24 एनवीएमई एसएसडी सक्रिय हैं और तैयार के रूप में रिपोर्ट कर रहे हैं, सिस्टम में दो अतिरिक्त बूट डिवाइस मौजूद हैं, जो प्राथमिक फ्रंट एनवीएमई बैंक से अलग हैं।
दाईं ओर, डिस्क का सारांश पैनल इन्हें भौतिक डिस्क और किसी भी संबद्ध वर्चुअल डिस्क में विभाजित करता है। चूंकि R7725xd पारंपरिक RAID नियंत्रकों के बिना प्रत्यक्ष NVMe आर्किटेक्चर का उपयोग करता है, सभी ड्राइव को गैर-RAID और व्यक्तिगत रूप से पता करने योग्य के रूप में रिपोर्ट किया जाता है, जो बड़े NVMe पूल और SDS प्लेटफ़ॉर्म के लिए सिस्टम के डिज़ाइन के साथ संरेखित होता है।
स्थिति सारांश के नीचे, हाल ही में लॉग किए गए स्टोरेज इवेंट क्षेत्र में बे और स्लॉट द्वारा व्यवस्थित प्रत्येक PCIe SSD के लिए प्रविष्टि लॉग सूचीबद्ध होते हैं। यह रिकॉर्ड सभी ड्राइव बे में उचित पहचान की पुष्टि करता है और बैठने, केबल बिछाने या हॉट-स्वैप गतिविधि के साथ किसी भी समस्या की पहचान करने में मदद करता है। बड़ी तैनाती के लिए, ये लॉग तब उपयोगी होते हैं जब ड्राइव प्रोविजनिंग को ट्रैक किया जाता है या यह सत्यापित किया जाता है कि क्षमता अपेक्षा के अनुरूप भरी गई है।
अंतिम स्क्रीनशॉट iDRAC10 के भीतर विस्तृत NVMe डिवाइस दृश्य दिखाता है। सिस्टम में स्थापित प्रत्येक NVMe ड्राइव को उसकी स्थिति, क्षमता और बे स्थान के साथ सूचीबद्ध किया गया है। एक व्यक्तिगत ड्राइव का चयन करने से उसकी विशेषताओं का पूर्ण विवरण खुल जाता है।
इस उदाहरण में, ड्राइव सूचना पैनल पूर्ण मॉडल स्ट्रिंग, डिवाइस प्रोटोकॉल, फॉर्म फैक्टर और बातचीत की गई PCIe सेटिंग्स प्रदर्शित करता है। NVMe डिवाइस एक तय x4 कनेक्शन के साथ 32 GT/s लिंक स्पीड पर चल रहे हैं, जो पुष्टि करता है कि ड्राइव सिस्टम के PCIe Gen5 बैकप्लेन पर पूर्ण बैंडविड्थ पर काम कर रहे हैं। सूचना अनुभाग सहनशक्ति प्रतिशत, उपलब्ध अतिरिक्त स्थिति और प्रोटोकॉल प्रकार की भी रिपोर्ट करता है, जिससे प्रशासकों को ड्राइव स्वास्थ्य और जीवनचक्र अपेक्षाओं की निगरानी करने में मदद मिलती है।
यह ग्रैन्युलर ड्राइव रिपोर्टिंग उच्च-घनत्व एनवीएमई कॉन्फ़िगरेशन में मूल्यवान है जहां लिंक चौड़ाई, बातचीत की गति और मीडिया स्वास्थ्य सीधे कार्यभार व्यवहार और भंडारण प्रदर्शन को प्रभावित करते हैं।
कुल मिलाकर, iDRAC 10 इंटरफ़ेस R7725xd के NVMe स्टोरेज आर्किटेक्चर का एक स्पष्ट, हार्डवेयर-केंद्रित दृश्य प्रदान करता है, जो एक नज़र में लिंक स्वास्थ्य, ड्राइव स्थिति और सिस्टम अखंडता की आसान मान्यता को सक्षम करता है।
डेल पॉवरएज R7725xd प्रदर्शन
परीक्षण से पहले, हमारे सिस्टम को एक संतुलित लेकिन उच्च-प्रदर्शन लोडआउट के साथ कॉन्फ़िगर किया गया था। सिस्टम दो AMD EPYC 9575F प्रोसेसर से लैस है, प्रत्येक में 64 उच्च-आवृत्ति कोर हैं, और 6400 MT/s पर संचालित होने वाले 24 32GB DDR5 DIMM के साथ जोड़ा गया है। भंडारण के लिए, चेसिस पूरी तरह से 24 15.36TB माइक्रोन 9550 PRO U.2 NVMe SSDs से सुसज्जित है, प्रत्येक एक समर्पित PCIe Gen5 x4 लिंक के माध्यम से जुड़ा हुआ है। यह 368.64 टीबी की कुल कच्ची क्षमता प्रदान करता है, और माइक्रोन 9550 प्रो ड्राइव 14,000 एमबी/एस तक की अनुक्रमिक पढ़ने की गति और 10,000 एमबी/एस तक की अनुक्रमिक लिखने की गति प्रदान करता है। नेटवर्किंग को चार ब्रॉडकॉम BCM57608 एडेप्टर द्वारा नियंत्रित किया जाता है जो संयुक्त आठ 200Gb पोर्ट की आपूर्ति करता है, साथ ही BCM57412 OCP NIC दो अतिरिक्त 10-गीगाबिट पोर्ट की पेशकश करता है।
परीक्षण प्रणाली विशिष्टताएँ
- CPU:2x AMD EPYC 9575F 64-कोर हाई-फ़्रीक्वेंसी प्रोसेसर
- याद:24x 32GB DDR5 @ 6400MT/s
- भंडारण:24x 15.36TB माइक्रोन 9550 PRO U.2 ड्राइव (प्रत्येक PCIe Gen5 के 4x लेन पर कनेक्टेड); आज क्षितिज पर उच्च क्षमताओं के साथ 128TB ड्राइव तक का समर्थन करता है
- नेटवर्क:4x ब्रॉडकॉम BCM57608 2x200G NIC, 1x BCM57412 2x10Gb OCP NIC
- बदलना:डेल पॉवरस्विच Z9664
FIO प्रदर्शन बेंचमार्क
PowerEdge R7725xd के भंडारण प्रदर्शन को मापने के लिए, हमने उद्योग-मानक मेट्रिक्स और FIO टूल का उपयोग किया। इस अनुभाग में, हम निम्नलिखित FIO बेंचमार्क पर ध्यान केंद्रित करते हैं:
- रैंडम 4K - 1M
- अनुक्रमिक 4K - 1M
FIO - स्थानीय - बैंडविड्थ
Dell PowerEdge R7725xd के अंदर 24 PCIe Gen5 NVMe ड्राइव तक स्थानीय पहुंच का परीक्षण करते समय, सिस्टम वही दिखाता है जो आप उस प्लेटफ़ॉर्म से उम्मीद करेंगे जहां प्रत्येक ड्राइव पूर्ण x4 लेन PCIe Gen5 लिंक का उपयोग करके सीपीयू से जुड़ा होता है। इसमें कोई नेटवर्क परत शामिल नहीं है, यह Dell के Gen5 स्टोरेज लेआउट और AMD EPYC प्लेटफॉर्म के PCIe बैंडविड्थ का शुद्ध, आंतरिक थ्रूपुट है जो बिना किसी प्रतिबंध के काम करता है।
अनुक्रमिक रीडिंग 4K ब्लॉक के साथ 184 जीबी/एस से शुरू होती है और ब्लॉक आकार बढ़ने पर तेजी से बढ़ती है। 512K से 1M तक, सर्वर लगातार 312 से 314 GB/s बनाए रखता है, जो इस बात का एक मजबूत संकेत है कि सिस्टम बिना किसी नियंत्रक-चरण बाधाओं के सभी 24 × 4 Gen5 लेन को निरंतर रीड बैंडविड्थ में कितनी अच्छी तरह एकत्रित कर सकता है।
अनुक्रमिक लेखन एक अलग वक्र का अनुसरण करते हैं लेकिन अपेक्षित सीमा में दृढ़ता से रहते हैं। 149 जीबी/सेकंड से शुरू होकर, परिणाम 100 के मध्य तक बढ़ते हैं और 182 जीबी/सेकंड तक 1 मिलियन तक पहुंच जाते हैं। यह माइक्रोन 9550 प्रो एसएसडी के लेखन व्यवहार और कई स्वतंत्र उपकरणों में उच्च-समानांतर एनवीएमई लेखन में निहित ओवरहेड के साथ संरेखित है।
यादृच्छिक पठन प्रदर्शन एक और मुख्य आकर्षण है। सिस्टम सबसे छोटे ब्लॉक आकार में लगभग 300 जीबी/एस की गति प्राप्त करता है, मध्य-सीमा में थोड़ा कम हो जाता है, और फिर बड़े ब्लॉक आकार में ऊपरी 200 और निम्न 300 पर वापस आ जाता है। 1M पर, रैंडम रीड्स अधिकतम 318 GB/s तक पहुंच जाता है, जो सभी 24 ड्राइव्स पर मिश्रित संचालन को समान रूप से वितरित करने की प्लेटफ़ॉर्म की क्षमता को प्रदर्शित करता है।
रैंडम राइट्स कम दर पर आते हैं, जो व्यापक एनवीएमई सेट में बिखरे हुए मेटाडेटा और लेखन-आवंटन कार्यों के लिए विशिष्ट है। अधिकांश परीक्षणों के लिए परिणाम 140 से 160 जीबी/सेकेंड के बीच रहते हैं और 1 एम पर घटकर 100 जीबी/सेकेंड से कम हो जाते हैं।
FIO - स्थानीय - IOPS
IOPS पक्ष की जांच करते समय, R7725xd मजबूत छोटे-ब्लॉक प्रदर्शन को प्रदर्शित करता है, बड़े ब्लॉक आकार के कार्यभार को बैंडविड्थ-संचालित प्रोफ़ाइल की ओर स्थानांतरित करने से पहले अनुरोध दरें लाखों तक पहुंच जाती हैं।
4K पर, पढ़ने की संख्या 44.9 मिलियन IOPS तक पहुंच गई और लिखने की संख्या 36.3 मिलियन हो गई। रैंडम रीड्स 71.4 मिलियन IOPS पर और भी उच्च स्तर तक पहुँचते हैं, जो सभी ड्राइव्स में उच्च-कतार वर्कलोड को कुशलतापूर्वक वितरित करने की सिस्टम की क्षमता को प्रदर्शित करता है। ब्लॉक आकार बढ़ने पर ये मान स्वाभाविक रूप से कम हो जाते हैं, लेकिन प्रगति 8K, 16K और 32K रेंज के माध्यम से सुसंगत रहती है।
16K और 32K ब्लॉक तक, रीड्स 17.4 मिलियन और 8.35 मिलियन IOPS पर स्थिर हो जाते हैं, रैंडम रीड्स 16.5 मिलियन और 8.15 मिलियन पर बारीकी से मेल खाते हैं। लेखन अपेक्षित पैटर्न का पालन करता है, अनुक्रमिक और यादृच्छिक पहुंच पैटर्न दोनों में कम लेकिन स्थिर रहता है।
जैसे ही हम 64K और उससे ऊपर की ओर बढ़ते हैं, परीक्षण शुद्ध IOPS से अधिक बैंडविड्थ-बाध्य परिदृश्य में बदल जाता है। IOPS निम्न-मिलियन सीमा में और अंततः सैकड़ों हजारों में गिर जाता है। 1M ब्लॉक आकार पर, IOPS को 300K के आसपास पढ़ा जाता है, लगभग 174K पर लिखा जाता है, और उसी पड़ोस में यादृच्छिक संचालन समाप्त होता है।
कुल मिलाकर, स्थानीय IOPS परिणाम स्पष्ट रूप से छोटे ब्लॉकों में बहुत उच्च कतार-गहराई वाले कार्यभार को बनाए रखने की प्रणाली की क्षमता को दर्शाते हैं, जैसे-जैसे स्थानांतरण बढ़ता है और बैंडविड्थ प्रमुख कारक बन जाता है, पूर्वानुमानित स्केलिंग होती है।
पीक:एआईओ: क्यों डेल पॉवरएज R7725xd इस कार्यभार के लिए उपयुक्त है
पीक: एआईओ को ऐसे वातावरण के लिए डिज़ाइन किया गया है जो बड़े डेटासेट तक बेहद तेज़, कम विलंबता पहुंच की मांग करता है, विशेष रूप से एआई प्रशिक्षण, अनुमान पाइपलाइन, वित्तीय मॉडलिंग और वास्तविक समय विश्लेषण के लिए। प्लेटफ़ॉर्म सघन NVMe स्टोरेज, संतुलित PCIe बैंडविड्थ और बड़े पैमाने पर पूर्वानुमानित विलंबता पर पनपता है। इन आवश्यकताओं को पूरा करने के लिए, अंतर्निहित हार्डवेयर को समवर्ती भारी भार के तहत लगातार और दोहराए जाने योग्य प्रदर्शन को बनाए रखते हुए निरंतर थ्रूपुट प्रदान करना होगा।
यहीं पर Dell PowerEdge R7725xd स्वाभाविक रूप से PEAK:AIO के साथ संरेखित होता है। सिस्टम का आर्किटेक्चर PCIe Gen5 संसाधनों को अधिकतम करने के लिए डिज़ाइन किया गया है, जो पारंपरिक RAID नियंत्रकों पर भरोसा किए बिना, इसके 24 फ्रंट-माउंटेड U.2 NVMe बे की पूरी बैंडविड्थ को सीधे सीपीयू में उजागर करता है। यह लेआउट PEAK:AIO को समानता और विलंबता प्रोफ़ाइल देता है जिसकी वह आधुनिक NVMe-आधारित डेटा पाइपलाइनों से अपेक्षा करता है। सिस्टम कॉन्फ़िगरेशन ने NVMe SSDs को दो RAID0 समूहों में विभाजित किया है।
परीक्षण किए गए परिदृश्य में, हमने R7725xd से जुड़े दो क्लाइंट सिस्टम का उपयोग किया, प्रत्येक ब्रॉडकॉम BCM57608 2x 200G NIC से सुसज्जित है। इसने प्रत्येक क्लाइंट में फीडिंग के लिए कुल चार 200G अपलिंक बनाए, जिससे R7725xd को एक यथार्थवादी उच्च-प्रदर्शन कॉन्फ़िगरेशन में धकेल दिया गया, जो उत्पादन में PEAK:AIO परिनियोजन को दर्शाता है। नेटवर्क बैंडविड्थ के इस स्तर ने हमें एनआईसी परत पर बाधाओं के बिना एनवीएमई सबसिस्टम, पीसीआईई टोपोलॉजी और सीपीयू इंटरकनेक्ट पर पूरी तरह से जोर देने के लिए हेडरूम दिया।
परिणाम एक ऐसा मंच है जो PEAK:AIO कार्यभार के साथ प्रभावी ढंग से संरेखित होता है। R7725xd सघन NVMe क्षमता, PCIe Gen5 थ्रूपुट, समानता के लिए दोहरी AMD EPYC 9005 प्रोसेसर और प्रति क्लाइंट सैकड़ों गीगाबिट्स पर मल्टी-क्लाइंट डेटा अंतर्ग्रहण को बनाए रखने की नेटवर्किंग क्षमता प्रदान करता है। ये सभी विशेषताएँ PEAK:AIO की प्रदर्शन अपेक्षाओं को प्राप्त करने के लिए मूलभूत हैं।
पीक: एआईओ - एनवीएमई-ओएफ आरडीएमए - बैंडविड्थ
PEAK:AIO के साथ PowerEdge R7725xd पर NVMe-oF RDMA बैंडविड्थ परिणामों की जांच करने पर, समग्र रुझान बिल्कुल वही है जो हम इतने PCIe और नेटवर्क बैंडविड्थ वाले सिस्टम से उम्मीद करते हैं। जैसे-जैसे ब्लॉक का आकार बढ़ता है, थ्रूपुट तेजी से बढ़ता है जब तक कि यह प्लेटफ़ॉर्म की व्यावहारिक सीमा के करीब न आ जाए।
छोटे ब्लॉक आकार में, पढ़ने और लिखने दोनों के लिए प्रदर्शन 20GB/s के मध्य में शुरू होता है, जो सामान्य है क्योंकि 4K और 8K ट्रांसफर IOPS पथ को थ्रूपुट पथ की तुलना में बहुत अधिक कठिन बनाते हैं। एक बार जब हम 16के और 32के ब्लॉक में पहुंच जाते हैं, तो पाइपलाइन खुल जाती है। रीड्स 32K पर लगभग 154 जीबी/सेकेंड तक पहुंच जाता है और 160 जीबी/सेकेंड रेंज तक चढ़ना जारी रखता है, जो ठीक वहीं है जहां हम चार 200 जीबी/एस लिंक से अधिक दोहरे-क्लाइंट सेटअप की अपेक्षा करते हैं।
रैंडम रीड परफॉर्मेंस अनुक्रमिक को लगभग पूरी तरह से प्रतिबिंबित करता है। पीक: AIO कमांड क्यू को फीड रखने का अच्छा काम करता है, इसलिए रैंडम रीड बैंडविड्थ अनिवार्य रूप से अनुक्रमिक रीड बैंडविड्थ को सभी तरह से ट्रैक करता है, जो 32K से 1M तक लगभग 159 से 161 GB/s पर सेट होता है। यह इंगित करता है कि स्टोरेज स्टैक मिश्रित एक्सेस पैटर्न के तहत बाधा नहीं डाल रहा है, और R7725xd की PCIe टोपोलॉजी 24 Gen5 NVMe ड्राइव पर लोड को समान रूप से वितरित कर रही है।
लिखने का प्रदर्शन एक समान वक्र का अनुसरण करता है, हालाँकि यह पढ़ने की तुलना में थोड़ा कम होता है। अनुक्रमिक लेखन मध्यम आकार के ब्लॉकों के माध्यम से 140 से 148 जीबी/सेकेंड की सीमा में रहता है, जो 128K पर लगभग 117 जीबी/सेकेंड तक गिर जाता है लेकिन ब्लॉक आकार बढ़ने के साथ ठीक हो जाता है। रैंडम राइट्स अलग तरह से व्यवहार करते हैं और 110-117 जीबी/सेकेंड के करीब पहुंचते हैं, जो कि अतिरिक्त ओवरहेड पेश करने वाले मिश्रित-कतार वर्कलोड के लिए सामान्य है।
इस अनुभाग से मुख्य बात यह है कि R7725xd को NVMe-oF पर अत्यधिक उच्च बैंडविड्थ बनाए रखने में कोई परेशानी नहीं होती है, यहां तक कि कई क्लाइंट्स द्वारा सिस्टम को उसकी सीमा तक चलाने पर भी। एक बार जब ब्लॉक का आकार 32K या उससे अधिक हो जाता है, तो सर्वर लगातार अपने उपलब्ध नेटवर्क और स्टोरेज बैंडविड्थ को संतृप्त करता है। यह ठीक उसी प्रकार का प्रदर्शन है जिसे PEAK:AIO को निकालने के लिए डिज़ाइन किया गया है, जिससे ये परिणाम वास्तविक दुनिया की परिस्थितियों में प्लेटफ़ॉर्म की क्षमता का एक मजबूत सत्यापन बन जाते हैं।
पीक एआईओ - एनवीएमई-ओएफ आरडीएमए आईओपीएस
IOPS पक्ष पर, PowerEdge R7725xd मजबूत छोटे-ब्लॉक प्रदर्शन को प्रदर्शित करता है, हालाँकि हमने शुरू में अपेक्षा से कम संख्याएँ देखीं; भविष्य में बेहतर नेटवर्क ड्राइवर समर्थन के साथ इस समस्या का समाधान होने की उम्मीद है। इसके साथ भी, समग्र स्केलिंग प्रवृत्ति बिल्कुल वैसी ही दिखाई देती है जैसे एनवीएमई-ओएफ आरडीएमए आमतौर पर ब्लॉक आकार बढ़ने पर व्यवहार करती है।
सबसे छोटे ब्लॉक आकार में, सिस्टम अनुक्रमिक और यादृच्छिक दोनों वर्कलोड में 6 मिलियन से अधिक IOPS वितरित कर सकता है। पढ़ना, लिखना, यादृच्छिक पढ़ना और यादृच्छिक लिखना सभी 4K और 8K पर लगभग एक ही रेंज में बैठते हैं, जो दर्शाता है कि फ्रंट-एंड क्लाइंट, PCIe इंफ्रास्ट्रक्चर और NVMe ड्राइव को अनुरोध दर को बनाए रखने में कोई परेशानी नहीं है।
जैसे-जैसे ब्लॉक का आकार बढ़ता है, IOPS में अपेक्षित गिरावट शुरू हो जाती है। 32K पर, लगभग 4.7 मिलियन IOPS पढ़ता है, जबकि लगभग 4.4 मिलियन पर थोड़ा पीछे लिखता है। रैंडम राइट्स को यहां सबसे बड़ी मार पड़ी है, जो लगभग 3.3 मिलियन IOPS तक गिर गई है, जो मिश्रित-पहुंच पैटर्न द्वारा शुरू की गई अतिरिक्त कतार और सीपीयू ओवरहेड के साथ संरेखित है।
बड़े ब्लॉकों में आगे बढ़ते हुए, IOPS एक पूर्वानुमानित रैखिक फैशन में कम होता जा रहा है। जब तक हम 256के और 512के ट्रांसफर तक पहुंचते हैं, थ्रूपुट प्रमुख मीट्रिक बन जाता है, और आईओपीएस स्वाभाविक रूप से सैकड़ों हजारों के बीच में गिर जाता है। 1M ब्लॉक आकार पर, सभी कार्यभार 140K-153K IOPS में परिवर्तित हो जाते हैं, जो कि पिछले अनुभाग में देखी गई बैंडविड्थ संख्याओं के अनुरूप है।
व्यक्ति से संपर्क करें: Ms. Sandy Yang
दूरभाष: 13426366826



