大數據集下休息日效應的客流量預測模型
摘要:在傳統統計分析工具無法直接對原始數據進行建模分析的前提下,利用大數據工具對原始數據進行提取、轉換和加載(ETL),再通過統計分析工具對樣本數據進行可視化預測分析。本文通過Hadoop分布式集群對廣東省部分公交線路嶺南通用戶2014年5個月的800多萬條刷卡數據進行數據清洗,通過樣本數據分析了公交客流量以周為周期的波動規律,并結合休息日(節假日、周末)效應,選用多元季節性時間序列模型對日時段客流量進行時間序列建模,最后通過外推預測評估模型,平均誤差不超過5%,結論表明該模型適用于公交時段客流量的短時預測。
注: 保護知識產權,如需閱讀全文請聯系長江工程職業技術學院學報雜志社