實時廣告競拍平臺中的海量數據分析和競價預測
摘要:實時廣告競拍平臺會產生海量的數據,如何對這些數據進行分析和建模會決定廣告競拍的成敗.其中一個重要的問題是,如何得到勝出競價的概率密度函數以便用于指導競價.在文獻(Cui Y, Zhang R, Li W, Mao J. Bid landscape forecasting in online ad exchange marketplace. Proceedings of the 17th A CM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2011: 265-273)中,雅虎實驗室提出了一個技術框架來解決這個問題:首先利用合理的統計學方法對海量數據按照特征屬性進行分類;再利用高效的數據結構進行存儲,以便快速定位特定屬性的信息;最后用梯度提升決策樹(gradient boosting decision trees,GBDT)模型和有限混合模型(finite mixture model,FMM)學習得到勝出競價的分布模型.結合國內競拍平臺的數據特點,在上述文獻的基礎上,對技術框架進行改進,并提出修正的算法.
注: 保護知識產權,如需閱讀全文請聯系應用數學與計算數學學報雜志社