成果介紹
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種Spark任務(wù)分配方法和系統(tǒng)。首先基于數(shù)據(jù)位置的選擇方法對(duì)當(dāng)前提交的任務(wù)和已配置的資源中所包含的節(jié)點(diǎn)進(jìn)行配對(duì),生成配對(duì)結(jié)果;利用已生成的節(jié)點(diǎn)標(biāo)識(shí)與存儲(chǔ)設(shè)備特征標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,將配對(duì)結(jié)果中所包含的節(jié)點(diǎn)分組為固態(tài)硬盤(pán)節(jié)點(diǎn)組和機(jī)械硬盤(pán)節(jié)點(diǎn)組;若當(dāng)前任務(wù)的操作數(shù)據(jù)同時(shí)存在于固態(tài)硬盤(pán)節(jié)點(diǎn)組的節(jié)點(diǎn)和機(jī)械硬盤(pán)節(jié)點(diǎn)組的節(jié)點(diǎn)中,優(yōu)先將任務(wù)分配到固態(tài)硬盤(pán)節(jié)點(diǎn)組的節(jié)點(diǎn)中執(zhí)行,即最大限度地將任務(wù)分配到配置有SSD的計(jì)算節(jié)點(diǎn)上,從而充分利用SSD高速讀、寫(xiě)以及高吞吐率的特性,加快任務(wù)的執(zhí)行速度,提升集群的服務(wù)質(zhì)量。