近日,2022年數(shù)據(jù)挖掘頂級(jí)學(xué)術(shù)會(huì)議IEEE International Conference on Data Mining (ICDM)近期發(fā)布了論文的最終評(píng)審結(jié)果,由我校計(jì)算機(jī)學(xué)院柳欣教授指導(dǎo)的2020級(jí)碩士研究生于鎮(zhèn)寧作為第一作者的科研成果“Detach and Enhance: Learning Disentangled Cross-modal Latent Representation for Efficient Face-Voice Association and Matching”,以及2020級(jí)研究生劉敦強(qiáng)作為第一作者的科研成果“Inconsistency Distillation For Consistency: Enhancing Multi-View Clustering via Mutual Contrastive Teacher-Student Leaning”均被大會(huì)接收為Oral Presentation paper(口頭報(bào)告論文)。
ICDM是世界數(shù)據(jù)挖掘研究頂級(jí)會(huì)議,創(chuàng)辦于2001年,每年舉辦一屆,會(huì)議主題涵蓋了有關(guān)數(shù)據(jù)挖掘的算法和智能系統(tǒng)籌。本屆ICDM會(huì)議總計(jì)收到投稿885篇,經(jīng)過(guò)初審,870篇論文進(jìn)入評(píng)審階段,最終收錄85篇Oral Presentation paper(口頭報(bào)告論文,錄用率僅為9.77%)。
于鎮(zhèn)寧的研究主要基于跨模態(tài)人臉語(yǔ)音一致性探索的課題。針對(duì)人臉-語(yǔ)音多模態(tài)數(shù)據(jù)中存在與模態(tài)相關(guān)干擾因素的難題,提出了一種有效的跨模態(tài)多層解耦表示學(xué)習(xí)框架,可以挖掘人臉語(yǔ)音數(shù)據(jù)之間語(yǔ)義一致的潛在表示,并同時(shí)過(guò)濾掉與模態(tài)相關(guān)的干擾因素。通過(guò)兩個(gè)階段的學(xué)習(xí)過(guò)程,構(gòu)建純凈的跨模態(tài)公共空間,很好的語(yǔ)義一致性關(guān)聯(lián)挖掘難題。
劉敦強(qiáng)的研究主要針對(duì)多視圖聚類(lèi)工作常常忽略了視圖內(nèi)關(guān)聯(lián)不一致性問(wèn)題,提出了一種有效的相互對(duì)比師生學(xué)習(xí)模型,并設(shè)計(jì)了統(tǒng)一低維表示對(duì)比學(xué)習(xí)以及高維語(yǔ)義特征蒸餾的雙頭網(wǎng)絡(luò)學(xué)習(xí)架構(gòu),通過(guò)將視圖關(guān)聯(lián)性建模在語(yǔ)義特征中并聯(lián)合優(yōu)化表示學(xué)習(xí),很好的解決了視圖之間的類(lèi)內(nèi)多樣性的問(wèn)題以及視圖內(nèi)關(guān)聯(lián)不一致難題。
上述研究工作得到福建省大數(shù)據(jù)智能與安全重點(diǎn)實(shí)驗(yàn)科研項(xiàng)目以及廈門(mén)市計(jì)算機(jī)視覺(jué)與模式識(shí)別重點(diǎn)實(shí)驗(yàn)室科研項(xiàng)目的大力支持。