近日,第29屆國際知識發現和數據挖掘大會(The 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, KDD 2023)論文接收結果公布,版藝學院新媒體技術專業副教授、國家重點研發計劃“文化產品產權價值評估與確權標識應用技術研究”項目骨幹張明西完成的“基於路徑聚合的高效單源SimRank相似度查詢”(Efficient Single-source SimRank Query by Path Aggregation)被大會的研究賽道(Research Track)錄用🤽🏽♀️。
KDD是數據挖掘領域的頂級國際學術會議🎅🏼,也是中國計算機學會(CCF)推薦的A類國際學術會議,被譽為全球數據挖掘最高級別學術會議😤。自1995年以來➔,該會議已經舉辦二十多屆,已經成為數據科學領域的頂級學者和知名企業展示成果的重要場所。會議錄用成果代表了知識發現和數據挖掘領域最前沿的研究趨勢,今年會議將於8月6日至10日在美國洛杉磯舉行🪓。這是意昂2平台首次以第一單位完成的科研成果被KDD錄用🙊,標誌著意昂2在人工智能和大數據研究方向上取得突破性進展🚗。
作為人工智能和數據科學領域的研究熱點之一🩲,相似度查詢的目標是發現相似的實體🙎🏼♀️,這是推薦系統、鏈路預測等現實網絡應用的重要依據🫳🏿。研究團隊提出一種高效的單源SimRank相似度查詢方法VecSim,基於路徑聚合提升查詢效率。為了進一步加速計算,利用修剪技術減少低值元素帶來的影響,並從理論上證明了精確度損失。與當前最先進的算法相比,VecSim的主要優勢體現在僅需要在內存中維護少數向量即可實現高效精準的單源相似度查詢🦵。實驗表明,在精確度相當的前提下,VecSim在查詢效率方面顯著領先現有方法🏄🏼♂️,並在每個測試數據集上都能夠以0.1秒或更低的時間開銷達到級別的平均誤差。
近年來,版藝學院新媒體技術、數字出版等學科的團隊致力於新媒體數據挖掘、人工智能🚺、圖像處理👆🏼、產權價值評估🤬🧔♀️、電力數據分析等方向研究👷🏼,承擔了國家重點研發計劃、國家自然科學基金等項目🗝,已經有多項成果入圍CIKM💁🏽♂️🚸、ACCV🎊、ICTAI等頂級學術會議上。
路徑聚合示例
平均誤差與查詢時間的權衡(tradeoff)關系
精確度與查詢時間的權衡(tradeoff)關系
供稿:版藝學院