大規模數據的集合相似度估計研究進展 何安娜; 陳華輝 寧波大學信息科學與工程學院; 寧波315211 摘要:相似度估計是實現近似集合檢索的一個重要組成部分。針對于不用的相似度度量方式,主要有使用Jaccard相似度的Min Hash算法和基于海明距離的Sim Hash算法,它們是兩種常用的大規模數據相似度度量技術。此外,還有基于集合包含度下的集合相似度估計算法。通過總結多篇已,詳細地回顧了不同的相似度度量方式下的集合相似度估計方法。 注: 保護知識產權,如需閱讀全文請聯系無線通信技術雜志社
相關推薦 更多 中國教育信息化 國家級 1個月內錄用 新媒體研究 國家級 1個月內錄用 軟件 國家級 1個月內錄用 通訊世界 國家級 1個月內錄用 通信技術 國家級 1個月內錄用 自動化應用 國家級 1個月內錄用