實時廣告競拍平臺中的海量數(shù)據(jù)分析和競價預(yù)測
摘要:實時廣告競拍平臺會產(chǎn)生海量的數(shù)據(jù),如何對這些數(shù)據(jù)進(jìn)行分析和建模會決定廣告競拍的成敗.其中一個重要的問題是,如何得到勝出競價的概率密度函數(shù)以便用于指導(dǎo)競價.在文獻(xiàn)(Cui Y, Zhang R, Li W, Mao J. Bid landscape forecasting in online ad exchange marketplace. Proceedings of the 17th A CM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2011: 265-273)中,雅虎實驗室提出了一個技術(shù)框架來解決這個問題:首先利用合理的統(tǒng)計學(xué)方法對海量數(shù)據(jù)按照特征屬性進(jìn)行分類;再利用高效的數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲,以便快速定位特定屬性的信息;最后用梯度提升決策樹(gradient boosting decision trees,GBDT)模型和有限混合模型(finite mixture model,F(xiàn)MM)學(xué)習(xí)得到勝出競價的分布模型.結(jié)合國內(nèi)競拍平臺的數(shù)據(jù)特點,在上述文獻(xiàn)的基礎(chǔ)上,對技術(shù)框架進(jìn)行改進(jìn),并提出修正的算法.
注: 保護(hù)知識產(chǎn)權(quán),如需閱讀全文請聯(lián)系應(yīng)用數(shù)學(xué)與計算數(shù)學(xué)學(xué)報雜志社