大數(shù)據(jù)集下休息日效應(yīng)的客流量預(yù)測(cè)模型
摘要:在傳統(tǒng)統(tǒng)計(jì)分析工具無(wú)法直接對(duì)原始數(shù)據(jù)進(jìn)行建模分析的前提下,利用大數(shù)據(jù)工具對(duì)原始數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換和加載(ETL),再通過(guò)統(tǒng)計(jì)分析工具對(duì)樣本數(shù)據(jù)進(jìn)行可視化預(yù)測(cè)分析。本文通過(guò)Hadoop分布式集群對(duì)廣東省部分公交線路嶺南通用戶2014年5個(gè)月的800多萬(wàn)條刷卡數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,通過(guò)樣本數(shù)據(jù)分析了公交客流量以周為周期的波動(dòng)規(guī)律,并結(jié)合休息日(節(jié)假日、周末)效應(yīng),選用多元季節(jié)性時(shí)間序列模型對(duì)日時(shí)段客流量進(jìn)行時(shí)間序列建模,最后通過(guò)外推預(yù)測(cè)評(píng)估模型,平均誤差不超過(guò)5%,結(jié)論表明該模型適用于公交時(shí)段客流量的短時(shí)預(yù)測(cè)。
注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系長(zhǎng)江工程職業(yè)技術(shù)學(xué)院學(xué)報(bào)雜志社