影音先锋男人资源在线观看,精品国产日韩亚洲一区91,中文字幕日韩国产,2018av男人天堂,青青伊人精品,久久久久久久综合日本亚洲,国产日韩欧美一区二区三区在线

高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法

上傳人:冷*** 文檔編號(hào):18835707 上傳時(shí)間:2021-01-04 格式:DOCX 頁(yè)數(shù):6 大小:15.36KB
收藏 版權(quán)申訴 舉報(bào) 下載
高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法_第1頁(yè)
第1頁(yè) / 共6頁(yè)
高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法_第2頁(yè)
第2頁(yè) / 共6頁(yè)
高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法_第3頁(yè)
第3頁(yè) / 共6頁(yè)

下載文檔到電腦,查找使用更方便

18 積分

下載資源

還剩頁(yè)未讀,繼續(xù)閱讀

資源描述:

《高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法》由會(huì)員分享,可在線閱讀,更多相關(guān)《高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法(6頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、高性能計(jì)算機(jī)分布式內(nèi)存文件系統(tǒng)的網(wǎng)絡(luò)性能優(yōu)化方法   高性能計(jì)算應(yīng)用對(duì)計(jì)算節(jié)點(diǎn)內(nèi)存的不均衡需求導(dǎo)致節(jié)點(diǎn)之間內(nèi)存利用率差異較大,為充分利用高性能計(jì)算機(jī)的內(nèi)存資源,產(chǎn)生了基于計(jì)算節(jié)點(diǎn)內(nèi)存構(gòu)建分布式文件系統(tǒng)的需求。此時(shí),基于Socket的網(wǎng)絡(luò)通信成為制約系統(tǒng)性能的主要瓶頸。本文提出一種基于RDMA的數(shù)據(jù)傳輸機(jī)制RBP(RDMA Buffer Pool)。通過(guò)靈活配置和使用RBP對(duì)MooseFS進(jìn)行改進(jìn),并依托TH-1A系統(tǒng)上進(jìn)行測(cè)試。結(jié)果表明,改進(jìn)后系統(tǒng)客戶端的順序讀寫速度和服務(wù)端在順序讀寫時(shí)的聚合帶寬均有明顯提高,單客戶端順序讀、寫速度最大可達(dá)原系統(tǒng)的2.0、2.6倍,單服務(wù)端在順序讀、寫時(shí)的聚

2、合帶寬最大可達(dá)原系統(tǒng)的2.0、2.4倍。   高性能計(jì)算應(yīng)用對(duì)計(jì)算節(jié)點(diǎn)內(nèi)存的不均衡需求導(dǎo)致計(jì)算節(jié)點(diǎn)之間內(nèi)存利用率差異較大,為充分利用高性能計(jì)算機(jī)的內(nèi)存資源,為緩解這一狀況,產(chǎn)生了基于計(jì)算節(jié)點(diǎn)空閑內(nèi)存構(gòu)建分布式內(nèi)存文件系統(tǒng)的需求。當(dāng)存儲(chǔ)介質(zhì)從磁盤變?yōu)閮?nèi)存,系統(tǒng)服務(wù)端I/O性能大幅提高,基于Socket的網(wǎng)絡(luò)通信成為制約系統(tǒng)性能的主要瓶頸。針對(duì)這一問(wèn)題,本文提出一種基于RDMA的數(shù)據(jù)傳輸機(jī)制RBP,通過(guò)在讀、寫不同場(chǎng)景下靈活配置和使用RBP,大幅提高了系統(tǒng)的網(wǎng)絡(luò)傳輸性能。   1 相關(guān)工作   1.1 MooseFS   近年來(lái),大數(shù)據(jù)、云計(jì)算、高性能計(jì)算蓬勃發(fā)展,分布式文

3、件系統(tǒng)取得長(zhǎng)足進(jìn)步。其中,GFS(Google File System)提出的以大量不可靠的服務(wù)器為基礎(chǔ)構(gòu)建高可靠的存儲(chǔ)系統(tǒng)的設(shè)計(jì)思想[1],對(duì)分布式文件系統(tǒng)發(fā)展具有重要意義。GFS并不開源,因此選擇設(shè)計(jì)接近的開源系統(tǒng)MooseFS[2],其具備支持POSIX語(yǔ)義、易擴(kuò)展、部署維護(hù)簡(jiǎn)便等特點(diǎn),包括四個(gè)部件:   元數(shù)據(jù)管理服務(wù)器Master,負(fù)責(zé)提供維護(hù)元數(shù)據(jù),提供元數(shù)據(jù)服務(wù),管理數(shù)據(jù)存儲(chǔ)服務(wù)器等。   元數(shù)據(jù)日志服務(wù)器Metalogger,負(fù)責(zé)備份Master的變化日志文件。   數(shù)據(jù)存儲(chǔ)服務(wù)器Chunkserver,在Master的調(diào)度下,為客戶端提供數(shù)據(jù)傳輸和存儲(chǔ)服務(wù)。

4、   客戶端Client,通過(guò)FUSE[3](File system in Userspace)掛載到MooseFS系統(tǒng)。   1.2 RDMA   RDMA是一種高帶寬、低延遲的網(wǎng)絡(luò)傳輸控制技術(shù),通過(guò)將可靠傳輸協(xié)議固化于網(wǎng)卡,支持繞過(guò)內(nèi)核的數(shù)據(jù)零拷貝。當(dāng)前,大多數(shù)高性能計(jì)算機(jī)的計(jì)算節(jié)點(diǎn)之間采用支持RDMA的網(wǎng)絡(luò)互連。以TH-1A系統(tǒng)為例,其采用支持RDMA的自主設(shè)計(jì)的高速互聯(lián)網(wǎng)絡(luò)[4]。通過(guò)Ping Pong方式測(cè)試,計(jì)算節(jié)點(diǎn)之間的最小單邊延遲低至1.57us。通過(guò)流水傳輸方式測(cè)試,單向數(shù)據(jù)傳輸峰值帶寬高達(dá)6.34GB/s。   1.3 相關(guān)研究   分布式存儲(chǔ)

5、系統(tǒng)的分布式特性決定了其對(duì)通信是敏感的,因而往往要求通信能夠提供更高的帶寬和更低的延遲。鑒于RDMA通信在帶寬和延遲方面的良好特性,研究人員在如何利用RDMA通信機(jī)制改進(jìn)分布式存儲(chǔ)系統(tǒng)網(wǎng)絡(luò)性能方面做了很多工作。如N.S. Islam、M. W. Rahman等人為改進(jìn)HDFS(Hadoop Distributed File System的寫性能,在HDFS客戶端增加Java適配器,以便借助UCR(Unified Communication Runtime)提供的功能使用RDMA進(jìn)行通信[5]。Christopher Mitchell、Yifeng Geng等人設(shè)計(jì)了一個(gè)名為Pilaf的分布式內(nèi)

6、存鍵值對(duì)存儲(chǔ),根據(jù)鍵值對(duì)存儲(chǔ)以讀請(qǐng)求為主的特點(diǎn),實(shí)現(xiàn)了一個(gè)基于RDMA的get操作,用來(lái)處理只讀的服務(wù)請(qǐng)求,可以獲得顯著的性能收益[6]。顯然,在利用RDMA改進(jìn)分布式存儲(chǔ)系統(tǒng)網(wǎng)絡(luò)性能時(shí),需要考慮分布式系統(tǒng)的特點(diǎn)、部署方式、額外開銷等諸多因素。   2 MooseFS基于Socket的性能瓶頸   MooseFS在處理一個(gè)讀/寫請(qǐng)求過(guò)程中,有2個(gè)環(huán)節(jié)涉及實(shí)際的數(shù)據(jù)操作:一是Chunkserver對(duì)本地磁盤進(jìn)行I/O操作,二是Client與Chunkserver之間通過(guò)Socket傳輸數(shù)據(jù)。當(dāng)MooseFS部署在磁盤時(shí),Chunkserver中的數(shù)據(jù)塊以EXT4等本地文件系統(tǒng)的文件形

7、式存儲(chǔ)在磁盤中;當(dāng)把MooseFS部署在內(nèi)存時(shí),則可以借助tmpfs等內(nèi)存文件系統(tǒng)實(shí)現(xiàn)。   為對(duì)比基于磁盤和內(nèi)存兩種形式,服務(wù)端I/O性能和系統(tǒng)I/O性能方面的差異,以寫為例進(jìn)行測(cè)試。Chunkserver使用TH-1A部署的Lustre系統(tǒng)作為本地文件系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,相比基于磁盤的存儲(chǔ)形式,基于內(nèi)存存儲(chǔ)可以使Chunkserver的寫性能提高數(shù)倍,然而對(duì)系統(tǒng)整體寫性能的提升非常有限。此時(shí)系統(tǒng)的性能受到基于Socket的數(shù)據(jù)傳輸性能的制約。   3 優(yōu)化方法   3.1 基于RDMA的高速緩沖池RBP   RBP的原理是預(yù)先注冊(cè)一塊或多塊支持RDMA操作的內(nèi)存區(qū),

8、按照系統(tǒng)需求將這片區(qū)域劃分成不同規(guī)格的緩沖塊RBB(RDMA Buffer Block)。再根據(jù)不同用途,將同樣規(guī)格的RBB組織成不同的緩沖池RBP,并配合一套專用API,以RBB為單位提供高性能的數(shù)據(jù)傳輸服務(wù)。   (1)RBP的結(jié)構(gòu)設(shè)計(jì)   RBB由描述區(qū)、請(qǐng)求區(qū)和數(shù)據(jù)區(qū)三部分組成。描述區(qū)負(fù)責(zé)提供RBB進(jìn)行RDMA通信信息,包括RBB數(shù)據(jù)區(qū)所在注冊(cè)內(nèi)存區(qū)的端點(diǎn)信息、數(shù)據(jù)區(qū)偏移、大小等。請(qǐng)求區(qū)負(fù)責(zé)提供傳輸控制消息,包括Socket連接描述符、請(qǐng)求類型、請(qǐng)求數(shù)據(jù)偏移、大小等。數(shù)據(jù)區(qū)負(fù)責(zé)提供位于注冊(cè)內(nèi)存區(qū)的存儲(chǔ)空間。在利用RBB進(jìn)行RDMA通信時(shí),RBB需要在通信兩端成對(duì)使用。

9、   RBP,即RDMA緩沖池,RBP的基礎(chǔ)是一個(gè)由RBB作為元素的雙向鏈表,此外還包括RBP所包含的注冊(cè)內(nèi)存區(qū)數(shù)組,用于進(jìn)行RBB管理的計(jì)數(shù)器,互斥量,條件變量等。   (2)RBP的使用方式   RBP的使用方式分為顯式和隱式兩種,顯式使用是指使用者在RBP創(chuàng)建好后就分配得到全部的RBB,此后由使用者自行管理,適用于用途明確且管理簡(jiǎn)單的情形;隱式使用是指使用者在需要時(shí)從RBP分配RBB,使用完后再將RBB釋放,由專門的RBP管理模塊進(jìn)行管理,RBB分配與釋放對(duì)使用者是透明的,適于用作臨時(shí)用途的情形。一次基于RBP完整的RDMA通信可以分為三個(gè)階段:   數(shù)據(jù)準(zhǔn)備,本地節(jié)點(diǎn)

10、將數(shù)據(jù)寫入到分配的RBB數(shù)據(jù)區(qū)中,并向遠(yuǎn)程節(jié)點(diǎn)發(fā)送控制消息。   數(shù)據(jù)接收,本地或遠(yuǎn)程節(jié)點(diǎn)根據(jù)控制信息通過(guò)RDMA操作讀/寫RBB數(shù)據(jù)區(qū)中的數(shù)據(jù)。   資源釋放,本地和遠(yuǎn)程節(jié)點(diǎn)釋放此前分配的RBB。   3.2 讀優(yōu)化   (1)增加特定的讀RBP   Client的每個(gè)讀請(qǐng)求都會(huì)被分配1個(gè)數(shù)據(jù)區(qū),于是為Client增加了一個(gè)64MB的Req RBP,其RBB大小等于Chunk大小,設(shè)為4MB,用于提供讀請(qǐng)求的數(shù)據(jù)區(qū),從而繞過(guò)臨時(shí)數(shù)據(jù)緩沖區(qū),直接利用RDMA通信從Chunkserver讀取數(shù)據(jù)。但是,Req RBP中RBB較大,限制了其數(shù)量,無(wú)法滿足多線程下大量請(qǐng)

11、求對(duì)數(shù)據(jù)區(qū)的需求。于是Client增加一個(gè)作為臨時(shí)數(shù)據(jù)緩沖區(qū)的Read RBP,與Req RBP互為補(bǔ)充。為配合Client的RBP,Chunkserver增加一個(gè)作為臨時(shí)數(shù)據(jù)緩沖區(qū)Read RBP。兩端Read RBP的RBB大小均與CB相同,設(shè)為64KB。此外,讀優(yōu)化中的RBP都是隱式使用,因此兩端都需要RBP管理模塊。   (2)引入連續(xù)讀流水線   RBP對(duì)RBB的分配和釋放非常靈活,完全可以利用一個(gè)RBB準(zhǔn)備數(shù)據(jù),另一個(gè)RBB向Client提供數(shù)據(jù),因此,在Chunkserver的讀服務(wù)線程中對(duì)采用RMDA進(jìn)行連續(xù)讀的情形引入了流水線。   (3)設(shè)計(jì)多通道策略

12、   為了充分利用Client端Req RBP和Read RBP兩個(gè)RBP的性能,增加了策略控制。當(dāng)讀請(qǐng)求的接收區(qū)大小超過(guò)1MB時(shí),首先從Req RBP分配RBB作為數(shù)據(jù)區(qū),若分配失敗則繼續(xù)采用原有的方式分配內(nèi)存。由于傳輸非連續(xù)小數(shù)據(jù)時(shí)更適合采用Socket。因此,Chunkserver在提供數(shù)據(jù)時(shí)決定采用哪種通信方式,當(dāng)要傳輸?shù)臄?shù)據(jù)小于32KB時(shí),采用Socket通信,其他情況,采用RDMA通信?;谝陨喜呗?,讀請(qǐng)求的數(shù)據(jù)傳輸有3條數(shù)據(jù)通道。如圖1(a)所示,通道①②都通過(guò)RDMA讀取數(shù)據(jù),通道①為Client采用Req RBP接收數(shù)據(jù),通道②為Client采用Read RBP接收數(shù)據(jù);通

13、道③通過(guò)Socket讀取數(shù)據(jù)。   3.3 寫優(yōu)化   (1)增加特定的寫RBP   Client已存在一個(gè)用于提高寫性能的Write Cache,于是增加一個(gè)顯示使用的Write RBP,將Write RBP與Write Cache進(jìn)行合并。為實(shí)現(xiàn)合并,Write RBP的大小與Write Cache設(shè)置保持一致,在初始化Write Cache時(shí),每個(gè)CB都會(huì)綁定一個(gè)從Write RBP分配的RBB。同時(shí),Write RBP初始化后由Write Cache進(jìn)行管理。   為配合Client增加的Write RBP,Chunkserver增加一個(gè)Write RBP作為臨

14、時(shí)數(shù)據(jù)緩沖區(qū),其RBB大小等于CB大小。Chunkserver的Write RBP與Read RBP均由RBP管理模塊進(jìn)行管理。   (2)設(shè)計(jì)多通道策略   出于和讀相同的考慮,寫同樣支持RDMA和Socket兩種通信方式。不同的是,由Client端在將CB寫入ChunkServer前決定采用哪種通信方式。因此,寫請(qǐng)求的數(shù)據(jù)傳輸會(huì)存在2條數(shù)據(jù)通道,如圖1(b)所示,通道(1)通過(guò)RDMA寫入數(shù)據(jù),通道(2)通過(guò)Socket寫入數(shù)據(jù)。   4 性能評(píng)測(cè)   (1)測(cè)試環(huán)境   硬件環(huán)境:TH-1A系統(tǒng),6個(gè)計(jì)算節(jié)點(diǎn),1個(gè)作為Master,4個(gè)作為Client,1個(gè)

15、大內(nèi)存節(jié)點(diǎn)作為Chunkserver。   軟件版本:MooseFS3.0.73,IOR2.10.1。   測(cè)試方法:測(cè)試文件大小為2GB,塊大小從16KB到4MB不等,采用直接IO模式進(jìn)行順序讀、寫測(cè)試。   (2)測(cè)試結(jié)果與分析   客戶端對(duì)比測(cè)試在1個(gè)Client下進(jìn)行,分別采用1、2、4、8個(gè)進(jìn)程進(jìn)行并行讀寫,以測(cè)試單個(gè)客戶端的整體性能。測(cè)試結(jié)果如圖2所示,在相同文件塊大小和相同進(jìn)程數(shù)時(shí),改進(jìn)后系統(tǒng)的順序讀寫速度全面優(yōu)于原系統(tǒng)。讀速度最大可達(dá)到原系統(tǒng)的2.02倍;寫速度最大可達(dá)到原系統(tǒng)的2.63倍。此外,當(dāng)原系統(tǒng)進(jìn)程數(shù)從4個(gè)增加到8個(gè)時(shí),已無(wú)明顯提升,說(shuō)明接近基

16、于Socket通信下的性能上限。但對(duì)于改進(jìn)后系統(tǒng),讀塊大小超過(guò)64KB的文件和寫塊大小超過(guò)512KB的文件,速度依然隨進(jìn)程數(shù)增加而穩(wěn)定提高。   服務(wù)端對(duì)比測(cè)試在1個(gè)Chunkserver下進(jìn)行,采用4個(gè)Client,每個(gè)Client采用單進(jìn)程進(jìn)行并發(fā)讀寫,以測(cè)試單個(gè)服務(wù)端在順序讀寫時(shí)提供的聚合帶寬,測(cè)試結(jié)果如圖3所示。改進(jìn)后系統(tǒng)的單個(gè)服務(wù)端在順序讀時(shí),向4個(gè)Client提供的帶寬最大可達(dá)到原系統(tǒng)的2.04倍;順序?qū)憰r(shí)的帶寬最大可以達(dá)到原系統(tǒng)的2.35倍。而且順序?qū)憰r(shí)的帶寬最大值為4.42GB/s,占到計(jì)算節(jié)點(diǎn)之間RDMA通信最大單向帶寬的接近70%。   5 結(jié)束語(yǔ)   本文提出一種基于RDMA的數(shù)據(jù)傳輸機(jī)制RBP,在MooseFS原有控制流程的基礎(chǔ)上,采用多種切實(shí)有效的設(shè)計(jì),使其在RDMA網(wǎng)絡(luò)下的數(shù)據(jù)傳輸性能得到大幅提升,但對(duì)小數(shù)據(jù)和多進(jìn)程的支持還存在改進(jìn)空間。下一步考慮結(jié)合數(shù)據(jù)預(yù)取、寫合并、最小匹配等技術(shù),使RBP具有更全面的性能表現(xiàn)和更廣泛的應(yīng)用前景。   作者簡(jiǎn)介   武春佳(1988-), 男, 黑龍江賓縣人, 目前于國(guó)防科學(xué)技術(shù)大學(xué)攻讀碩士學(xué)位, 主要研究領(lǐng)域?yàn)榉植际轿募到y(tǒng)、高性能存儲(chǔ)系統(tǒng)。

展開閱讀全文
溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!