您好, 歡迎來(lái)到環(huán)保在線! 登錄| 免費(fèi)注冊(cè)| 產(chǎn)品展廳| 收藏商鋪|
摘要 : 2016年10月14日,學(xué)術(shù)期刊《BioInformatics》在線發(fā)表了*北京基因組研究所生命與健康大數(shù)據(jù)中心章張研究員的一篇研究論文,研究報(bào)道了*基于Spark的大數(shù)據(jù)系統(tǒng)發(fā)育建樹(shù)工具CloudPhylo。
2016年10月14日,學(xué)術(shù)期刊《BioInformatics》在線發(fā)表了*北京基因組研究所生命與健康大數(shù)據(jù)中心章張研究員的一篇研究論文,研究報(bào)道了*基于Spark的大數(shù)據(jù)系統(tǒng)發(fā)育建樹(shù)工具CloudPhylo。博士研究生徐行健為論文*作者,章張研究員為論文通訊作者。
構(gòu)建系統(tǒng)發(fā)育樹(shù)是分子進(jìn)化研究中分析物種間進(jìn)化關(guān)系的基礎(chǔ)步驟與重要環(huán)節(jié)。隨著生物大數(shù)據(jù)時(shí)代的到來(lái),傳統(tǒng)的建樹(shù)工具在使用大數(shù)據(jù)集構(gòu)建系統(tǒng)發(fā)育樹(shù)時(shí)需要消耗更多的計(jì)算資源且運(yùn)行時(shí)間超長(zhǎng),使得科研工作者無(wú)法快速地進(jìn)行分子進(jìn)化分析。為此,生命與健康大數(shù)據(jù)中心(BIG Data Center;http://bigd.big.ac.cn)利用Spark云計(jì)算技術(shù),于近期開(kāi)發(fā)了一款適用于大數(shù)據(jù)集的系統(tǒng)發(fā)育樹(shù)構(gòu)建工具——CloudPhylo。Spark是一種新的分布式云計(jì)算框架,它實(shí)現(xiàn)了MapReduce分布式并行算法。基于Spark框架的程序在運(yùn)算過(guò)程中可地將中間輸出結(jié)果保存在內(nèi)存中,大大降低了因?yàn)轭l繁讀寫(xiě)文件造成的損耗。因此,與傳統(tǒng)的Hadoop框架相比,Spark能更好地應(yīng)用于需要反復(fù)迭代的大數(shù)據(jù)分析任務(wù)。
CloudPhylo是目前上針對(duì)大數(shù)據(jù)集開(kāi)發(fā)的系統(tǒng)發(fā)育建樹(shù)工具,同時(shí)也是國(guó)內(nèi)*使用Spark云計(jì)算技術(shù)開(kāi)發(fā)的生物信息學(xué)分析軟件。在應(yīng)用于模擬和真實(shí)的大數(shù)據(jù)集構(gòu)建系統(tǒng)發(fā)育樹(shù)時(shí),CloudPhylo均表現(xiàn)出了比傳統(tǒng)建樹(shù)軟件更高的運(yùn)行效率和更大的并行加速比(圖1)。
工具已經(jīng)部署在BIGD云平臺(tái)Qomo(https://cloud.big.ac.cn/users/bigd/tools/Clouldphylo)上,無(wú)須本地安裝,用戶(hù)可在線提交數(shù)據(jù)并進(jìn)行分析。
<img alt="BioInformatics:北京基因組所章張研究組開(kāi)發(fā)基于Spark的大數(shù)據(jù)系統(tǒng)發(fā)育建樹(shù)工具" "="" data-cke-saved-src="http://www.bio1000。。com/uploads/allimg/161102/0956493591-0.jpg" src="http://www.bio1000。。com/uploads/allimg/161102/0956493591-0.jpg" style="vertical-align: middle; border: 0px; width: 400px; height: 214px;">
圖1 CloudPhylo在不同條件下的并行加速比
請(qǐng)輸入賬號(hào)
請(qǐng)輸入密碼
請(qǐng)輸驗(yàn)證碼
以上信息由企業(yè)自行提供,信息內(nèi)容的真實(shí)性、準(zhǔn)確性和合法性由相關(guān)企業(yè)負(fù)責(zé),環(huán)保在線對(duì)此不承擔(dān)任何保證責(zé)任。
溫馨提示:為規(guī)避購(gòu)買(mǎi)風(fēng)險(xiǎn),建議您在購(gòu)買(mǎi)產(chǎn)品前務(wù)必確認(rèn)供應(yīng)商資質(zhì)及產(chǎn)品質(zhì)量。