午夜亚洲国产日本电影一区二区三区,九九久久99综合一区二区,国产一级毛片视频,草莓视频在线观看精品最新

加急見(jiàn)刊

基于統(tǒng)計(jì)感知的大數(shù)據(jù)系統(tǒng)計(jì)算框架

魏丞昊; 黃哲學(xué); 何玉林 深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院大數(shù)據(jù)技術(shù)與應(yīng)用研究所; 廣東深圳518060

摘要:為在一定計(jì)算資源條件下實(shí)現(xiàn)大數(shù)據(jù)可計(jì)算化,本研究提出一種基于統(tǒng)計(jì)感知思想的Tbyte級(jí)大數(shù)據(jù)系統(tǒng)計(jì)算框架Bigdata-α,該框架的核心為大數(shù)據(jù)隨機(jī)樣本劃分模型和逼近式集成學(xué)習(xí)模型.前者保證了劃分后每個(gè)子數(shù)據(jù)塊所包含的樣本與大數(shù)據(jù)總體概率分布的一致性.后者通過(guò)分析若干個(gè)隨機(jī)樣本數(shù)據(jù)塊替代了Tbyte級(jí)全量數(shù)據(jù)分析.使用1Tbyte模擬數(shù)據(jù)集驗(yàn)證隨機(jī)樣本劃分模型的有效性,通過(guò)逐漸增加隨機(jī)樣本塊的個(gè)數(shù),提升了Higgs數(shù)據(jù)集基分類器的分類準(zhǔn)確度,證明該方法能克服大數(shù)據(jù)分析中計(jì)算資源的限制瓶頸.

注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系深圳大學(xué)學(xué)報(bào)雜志社