基于英特爾傲騰持久內(nèi)存深度整合,SmartX 首發(fā) 100us 級(jí)超低延遲超融合解決方案
2020 年 6 月 17 日,北京——超融合中高端市場(chǎng)領(lǐng)導(dǎo)者北京志凌海納科技有限公司(以下簡(jiǎn)稱(chēng) “SmartX”)正式發(fā)布基于核心軟件 SMTX OS 與英特爾?傲騰?持久內(nèi)存的高性能、低延遲超融合解決方案與 SMTX Halo P 系列一體機(jī)。SmartX 在業(yè)內(nèi)首次將英特爾傲騰持久內(nèi)存以 App Direct Mode (應(yīng)用直接訪(fǎng)問(wèn)模式),并作為核心組件用于超融合解決方案中。與此同時(shí),通過(guò)對(duì)計(jì)算虛擬化、存儲(chǔ)網(wǎng)絡(luò)以及存儲(chǔ)介質(zhì)的端到端優(yōu)化,以有限的計(jì)算資源獲得業(yè)內(nèi)領(lǐng)先的高性能與超低延遲服務(wù)器虛擬化存儲(chǔ)性能。在集群測(cè)試中,只需要 3 個(gè)節(jié)點(diǎn) P 系列一體機(jī),即可達(dá)到 120 萬(wàn)的 IOPS,同時(shí),應(yīng)用端延遲保持在 100us 以下。

憑借優(yōu)異的產(chǎn)品穩(wěn)定性與特性,SmartX 產(chǎn)品已經(jīng)被銀行、證券、保險(xiǎn)、基金等金融行業(yè)用戶(hù)應(yīng)用生產(chǎn)環(huán)境。但當(dāng)用戶(hù)希望將超融合應(yīng)用于核心系統(tǒng)并替換裸金屬服務(wù)器與全閃陣列時(shí),仍對(duì)超融合計(jì)算虛擬化、網(wǎng)絡(luò)和存儲(chǔ)層帶來(lái)的延遲信心不足。為此,SmartX 于 2019 年啟動(dòng)代號(hào)為 Sailfish(旗魚(yú),海洋中最快的魚(yú)類(lèi))項(xiàng)目,將英特爾傲騰持久內(nèi)存 App Direct 模式用于緩存加速,同時(shí)對(duì) SmartX 超融合軟件 SMTX OS 進(jìn)行全方面優(yōu)化。
英特爾傲騰持久內(nèi)存在內(nèi)存和 SSD 之間新增了一個(gè)存儲(chǔ)層級(jí),具備像內(nèi)存一樣的超低訪(fǎng)問(wèn)延遲,超高壽命與可靠性,同時(shí)還具備持久化存儲(chǔ)和按字節(jié)訪(fǎng)問(wèn)的能力。在 App Direct 模式下,特定的應(yīng)用程序可直接訪(fǎng)問(wèn)由英特爾傲騰持久內(nèi)存帶來(lái)的獨(dú)立持久內(nèi)存資源。

為了充分發(fā)揮傲騰持久內(nèi)存的能力,Sailfish 項(xiàng)目對(duì)計(jì)算虛擬化到存儲(chǔ)網(wǎng)絡(luò)以及存儲(chǔ)介質(zhì)進(jìn)行了端到端優(yōu)化。而由于超融合架構(gòu)的部署特點(diǎn),以上的性能都必須在有限的計(jì)算資源實(shí)現(xiàn),這一限制條件為 Sailfish 項(xiàng)目帶來(lái)諸多的挑戰(zhàn)。基于此,SmartX 研發(fā)團(tuán)隊(duì)對(duì)系統(tǒng)進(jìn)行了如下重大改進(jìn):
存儲(chǔ)層
Sailfish 項(xiàng)目充分發(fā)揮英特爾傲騰持久內(nèi)存 App Direct 模式低延遲和持久化存儲(chǔ)的能力,保存集群中最經(jīng)常被訪(fǎng)問(wèn)的數(shù)據(jù)。同時(shí)為了保證數(shù)據(jù)的可靠性和高可用特性,緩存的數(shù)據(jù)也會(huì)以副本的形式保存到其他的節(jié)點(diǎn)中。
不僅如此,SMTX OS 充分利用持久內(nèi)存的字節(jié)訪(fǎng)問(wèn)特性重新設(shè)計(jì)了日志,有效解決日志寫(xiě)放大問(wèn)題。并通過(guò) DMA 方式,將內(nèi)存與持久內(nèi)存之間的數(shù)據(jù)拷貝任務(wù),下放到硬件中完成,極大地提高了內(nèi)存拷貝的效率,在提升存儲(chǔ)性能的同時(shí),不產(chǎn)生額外的 CPU 資源需求。
計(jì)算虛擬化層
通過(guò) SMTX ELF Boost 模式將存儲(chǔ)虛擬化功能,從虛擬機(jī)中下放到存儲(chǔ)軟件棧中,避免了因 IO 請(qǐng)求經(jīng)過(guò)虛擬機(jī)而產(chǎn)生額外的性能開(kāi)銷(xiāo)。同時(shí)通過(guò) VM 與存儲(chǔ)系統(tǒng)共享內(nèi)存的方式,避免在 IO 路徑上發(fā)生內(nèi)存拷貝。
存儲(chǔ)網(wǎng)絡(luò)層
通過(guò)使用 RDMA over Converged Ethernet (RoCE )進(jìn)行網(wǎng)絡(luò) IO 加速,并將網(wǎng)絡(luò)協(xié)議的實(shí)現(xiàn)部分下放到網(wǎng)卡硬件上完成,充分利用網(wǎng)卡硬件的加速功能,極大的降低分布式存儲(chǔ)在網(wǎng)絡(luò)通信時(shí)的性能開(kāi)銷(xiāo)。
經(jīng)過(guò)以上優(yōu)化,虛擬機(jī)的 IO 性能提升了 3.2 倍,同時(shí)延遲降低了 85% 以上。

目前,Sailfish 項(xiàng)目中使用到的技術(shù)已經(jīng)集成到了最新的 SMTX Halo P 系列一體機(jī)中。SMTX Halo P 系列一體機(jī)不僅能夠勝任交易類(lèi)數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)等對(duì) IO 性能要求苛刻的核心應(yīng)用場(chǎng)景,并且能夠以更高性能提升虛擬機(jī)密度,進(jìn)一步簡(jiǎn)化 IT 部署,降低整體擁有成本。SMTX Halo P 系列一體機(jī)已經(jīng)在金融行業(yè)進(jìn)行了測(cè)試和部署。

與市場(chǎng)某主流中高端全閃陣列相比,三節(jié)點(diǎn)的 SMTX Halo P 系列一體機(jī)的 8KB 隨機(jī)讀性能為 120 萬(wàn) IOPS,達(dá)到全閃陣列的 1.4 倍,順序讀帶寬達(dá)到 25GB,是全閃陣列的 2.1 倍,同時(shí)應(yīng)用端延遲只有 100us,而全閃陣列僅控制器端延遲就達(dá)到了 500us。不僅如此,P 系列一體機(jī)依舊保持超融合架構(gòu)簡(jiǎn)單、彈性的特點(diǎn),并提供相比于中高端陣列,極具競(jìng)爭(zhēng)力的總擁有成本。

SmartX 聯(lián)合創(chuàng)始人兼 CTO 張凱表示:“SmartX 致力于打造最出色的超融合基礎(chǔ)設(shè)施。在 Sailfish 項(xiàng)目中,我們提供了英特爾傲騰持久內(nèi)存在超融合部署上的最佳實(shí)踐。測(cè)試數(shù)據(jù)表明,通過(guò)引入新的存儲(chǔ)技術(shù),能夠極大地提高超融合系統(tǒng)的性能,解決關(guān)鍵應(yīng)用場(chǎng)景實(shí)際部署難題。SmartX 將持續(xù)攜手英特爾等業(yè)內(nèi)專(zhuān)業(yè)廠商,探索更多前沿技術(shù)在超融合系統(tǒng)中的應(yīng)用,引領(lǐng)下一階段超融合創(chuàng)新。”
轉(zhuǎn)自“SmartX超融合微信公眾號(hào)”