物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

RDMA網(wǎng)卡在實(shí)際環(huán)境中的應(yīng)用

作者:lrlink2003
日期:2020-12-29 16:17:39
摘要:近些年來,RDMA網(wǎng)卡的技術(shù)應(yīng)用在全球以太網(wǎng)通訊市場上刮起一股旋風(fēng),特別是在阿里、騰訊等一些互聯(lián)網(wǎng)巨頭企業(yè)在服務(wù)器上大量部署RDMA網(wǎng)卡。2019年,據(jù)官方數(shù)據(jù)報(bào)道,天貓雙11當(dāng)天成交額達(dá)到2684億元,訂單創(chuàng)新峰值達(dá)到54.4萬筆/秒,單日數(shù)據(jù)處理量達(dá)到970PB,這個(gè)驚為天人的數(shù)值出現(xiàn),再一次將RDMA網(wǎng)卡的應(yīng)用推上話題的頂峰。但是很多用戶表示,看著這數(shù)據(jù)很牛逼,但是RDMA網(wǎng)卡到底在實(shí)際環(huán)境中是如何應(yīng)用的,則是表示一臉懵逼。哈哈哈,其實(shí)對于RDMA網(wǎng)卡的實(shí)際應(yīng)用,并沒有大家想象中的那么神秘,RDMA網(wǎng)卡的出現(xiàn),實(shí)際上是為了解決服務(wù)器端數(shù)據(jù)處理延遲而產(chǎn)生的,也就是說,RDMA網(wǎng)卡誕生的使命,就是降低CPU負(fù)荷,提高網(wǎng)絡(luò)吞吐量,降低網(wǎng)絡(luò)延遲。那么,在實(shí)際中,RDMA網(wǎng)卡到底是如何應(yīng)用的,下面,就像小編帶領(lǐng)著大家一層一層揭開RDMA網(wǎng)卡的神秘面紗。提到RDMA網(wǎng)卡,首先就不得不提RDMA是個(gè)什么東東?

     近些年來,RDMA網(wǎng)卡的技術(shù)應(yīng)用在全球以太網(wǎng)通訊市場上刮起一股旋風(fēng),特別是在阿里、騰訊等一些互聯(lián)網(wǎng)巨頭企業(yè)在服務(wù)器上大量部署RDMA網(wǎng)卡。2019年,據(jù)官方數(shù)據(jù)報(bào)道,天貓雙11當(dāng)天成交額達(dá)到2684億元,訂單創(chuàng)新峰值達(dá)到54.4萬筆/秒,單日數(shù)據(jù)處理量達(dá)到970PB,這個(gè)驚為天人的數(shù)值出現(xiàn),再一次將RDMA網(wǎng)卡的應(yīng)用推上話題的頂峰。但是很多用戶表示,看著這數(shù)據(jù)很牛逼,但是RDMA網(wǎng)卡到底在實(shí)際環(huán)境中是如何應(yīng)用的,則是表示一臉懵逼。哈哈哈,其實(shí)對于RDMA網(wǎng)卡的實(shí)際應(yīng)用,并沒有大家想象中的那么神秘,RDMA網(wǎng)卡的出現(xiàn),實(shí)際上是為了解決服務(wù)器端數(shù)據(jù)處理延遲而產(chǎn)生的,也就是說,RDMA網(wǎng)卡誕生的使命,就是降低CPU負(fù)荷,提高網(wǎng)絡(luò)吞吐量,降低網(wǎng)絡(luò)延遲。那么,在實(shí)際中,RDMA網(wǎng)卡到底是如何應(yīng)用的,下面,就像小編帶領(lǐng)著大家一層一層揭開RDMA網(wǎng)卡的神秘面紗。提到RDMA網(wǎng)卡,首先就不得不提RDMA是個(gè)什么東東?


一、RDMA概念

 

     RDMA(英文全稱:Remote Direct Memory Access),意思是遠(yuǎn)程直接內(nèi)存訪問,這種技術(shù)是一種最早應(yīng)用于高性能計(jì)算領(lǐng)域的網(wǎng)絡(luò)通訊協(xié)議,目前已在數(shù)據(jù)中心逐漸普及。RDMA允許用戶程序繞過操作系統(tǒng)內(nèi)核,直接和網(wǎng)卡交互進(jìn)行網(wǎng)絡(luò)通信,從而提供高帶寬和極小時(shí)延。所以RDMA網(wǎng)卡的工作原理是,與傳統(tǒng)的TCP/CP網(wǎng)卡相比,RDMA網(wǎng)卡省略了內(nèi)核(CPU)的參與,所有數(shù)據(jù)的傳輸直接從應(yīng)用程序到達(dá)網(wǎng)卡。
RDMA模式工作原理

第二、RDMA三種網(wǎng)絡(luò)協(xié)議

 

     目前,RDMA大體有Infiniband、RoCE、iWARP三種網(wǎng)絡(luò)協(xié)議

 

     1.Infiniband是一種專為RDMA量身定做的網(wǎng)絡(luò)協(xié)議,可以從硬件級別上保證數(shù)據(jù)傳輸?shù)目煽啃浴km然InfiniBand技術(shù)規(guī)格及標(biāo)準(zhǔn)規(guī)范在2000年正式發(fā)表,但I(xiàn)nfiniBand Architecture(IBA)在集群式超級計(jì)算機(jī)上得到廣泛應(yīng)用的時(shí)間卻是在2005年以后。發(fā)展緩慢的最大原因就是Infiniband要求從L2到L4到需要自己的專用硬件,企業(yè)成本非常高,現(xiàn)在做InfiniBand網(wǎng)絡(luò)的廠商主要是Mellanox。

 

     2.RoCE是一個(gè)允許在以太網(wǎng)上執(zhí)行RDMA的網(wǎng)絡(luò)協(xié)議,很多網(wǎng)友認(rèn)為RoCE本身的架構(gòu)是InfiniBand嫁接過來的,因?yàn)镽oCE較低的網(wǎng)絡(luò)標(biāo)頭是以太網(wǎng)標(biāo)頭,較高的網(wǎng)絡(luò)標(biāo)頭是InfiniBand標(biāo)頭。是Mellanox為符合市場需求推出的低成本的InfiniBand網(wǎng)絡(luò)。RoCE網(wǎng)絡(luò)要求有無損以太網(wǎng)才能實(shí)現(xiàn)低延遲運(yùn)行,也這意味著集成到網(wǎng)絡(luò)中的以太網(wǎng)交換機(jī)必須支持?jǐn)?shù)據(jù)中心橋接(DCB)和優(yōu)先流控制(PFC)機(jī)制,以此才能維持無損流量,但無損以太網(wǎng)的難點(diǎn)在于,在現(xiàn)代化的企業(yè)環(huán)境中,配置是一個(gè)復(fù)雜的流程,并且可擴(kuò)展性會(huì)受到很大的局限,不過這對于財(cái)力雄厚的企業(yè)來說不是問題。

 

     3.iWARP 是一個(gè)允許在TCP上執(zhí)行RDMA的網(wǎng)絡(luò)協(xié)議,它的優(yōu)點(diǎn)是能夠運(yùn)行在當(dāng)今的標(biāo)準(zhǔn)TCP/IP網(wǎng)絡(luò)中,只需要采購支持iWARP的網(wǎng)卡就可以采用RDMA,對于財(cái)務(wù)預(yù)算略低的小企業(yè)來說,尤為適用。但它的缺點(diǎn)就是在性能上略差于RoCE,畢竟一分價(jià)錢一分貨,這個(gè)道理從古至今一直適用。

RDMA支持協(xié)議
  

第三、RDMA網(wǎng)卡品牌如何選擇

 

     常言道,貨比三家,對于RDMA網(wǎng)卡品牌選擇的同樣適用??v觀全球市場,現(xiàn)在做RDMA網(wǎng)卡的品牌廠商主要有三大巨頭企業(yè),分別是Marvell、intel、Mellanox,其中Marvell是收購的Qlogic品牌。對于Qlogic品牌,相信大家都不陌生,Qlogic一家擁有悠久歷史的專業(yè)提供光纖通道主機(jī)適配器(HBAs)、嵌入式光纖通道交換機(jī)、堆疊式光纖通道交換機(jī)為一體的頂級高速存儲(chǔ)網(wǎng)絡(luò)解決方案提供商,它的產(chǎn)品組合一直是全球企業(yè)數(shù)據(jù)中心首選,比如IT行業(yè)中的思科、戴爾、EMC、惠普、IBM、NEC公司等都一直采用QLogic的方案。

 

     話說回來,我們最終應(yīng)該如何選擇RDMA網(wǎng)卡品牌廠商?且聽我細(xì)細(xì)給大家分析,Mellanox的Infiniband網(wǎng)絡(luò)是RDMA網(wǎng)卡性能最好的代表,可以從硬件傳輸上保證可靠性,但要求整個(gè)生態(tài)環(huán)境必須配備專用的硬件,成本昂貴,就這一項(xiàng),已將絕大多數(shù)數(shù)據(jù)中心企業(yè)排除在門外。剩下的就只有RoCE和iWARP,intel是美國一家主要做CPU處理的公司,其最新的以太網(wǎng)產(chǎn)品系列中部分高速率網(wǎng)卡已支持RDMA性能,但其要求在使用RDMA網(wǎng)卡協(xié)議的時(shí)候,需要對相應(yīng)的硬件進(jìn)行升級,否則會(huì)在一定程度上影響RDMA性能,產(chǎn)品價(jià)格也相對較高。Marvell我們前面講過,他是收購的Qlogic品牌,QLogic品牌在光纖通道市場擁有絕對的話語權(quán),全球眾多企業(yè)客戶都采用QLogic的方案,在RDMA上,QLogic有效地做到對RoCE和iWARP不存在任何偏見,客戶能夠在同一個(gè)適配器上同時(shí)使用RoCE和iWARP協(xié)議,從客戶的立場來說這一點(diǎn)非常重要。

 

Qlogic主控方案

第四、國內(nèi)首家自主研發(fā)生產(chǎn)RDMA網(wǎng)卡廠商

 

     2019年,深圳市聯(lián)瑞電子有限公司(以下簡稱:LR-LINK聯(lián)瑞)與Marvell達(dá)成戰(zhàn)略合作關(guān)系,憑借Qlogic在光纖通道的強(qiáng)大實(shí)力,打造專供于服務(wù)器領(lǐng)域的RDMA網(wǎng)卡。同時(shí),LR-LINK聯(lián)瑞也成為國內(nèi)第一家自主研發(fā)生產(chǎn)RDMA網(wǎng)卡的廠商。LR-LINK聯(lián)瑞RDMA網(wǎng)卡采用Qlogic主控方案,可支持RoCE、RoCE v2、iWARP功能協(xié)議,與intel X520,X710,XX710主控芯片相比,Qlogic主控方案是業(yè)界唯一可實(shí)現(xiàn)通用RDMA技術(shù),并行RoCE和iWARP協(xié)議的10/25GBE網(wǎng)卡。

     在性能上具有低延遲,高網(wǎng)絡(luò)吞吐量,節(jié)約CPU開銷等優(yōu)異特性,在研發(fā)測試中,實(shí)時(shí)遷移成本,使用RDMA網(wǎng)卡的CPU占有率是TCP/IP的1/4倍。在國內(nèi)市場上,LR-LINK聯(lián)瑞目前推出的RDMA網(wǎng)卡主要是雙口/四口萬兆網(wǎng)卡(型號:LRES1004PF-2SFP+,LRES1005PF-4SFP+)。未來,伴隨企業(yè)領(lǐng)域?qū)?shù)據(jù)中心數(shù)據(jù)處理需求的高速飛漲LR-LINK聯(lián)瑞將向25G、40G,甚至更高速率的RDMA網(wǎng)卡研發(fā)道路發(fā)展,致力為全球客戶提供卓越性能的以太網(wǎng)卡解決方案。