2025年11月26日,計算機(jī)科學(xué)與技術(shù)學(xué)院在哈爾濱工程大學(xué)21B樓4127會議室成功舉辦智匯論壇第三十四期學(xué)術(shù)活動。本次活動邀請IEEE高級會員,《機(jī)器學(xué)習(xí)》期刊、《ACM概率機(jī)器學(xué)習(xí)事務(wù)》以及《大數(shù)據(jù)研究》雜志編委,AAAI人工智能會議和自然語言處理會議ACL領(lǐng)域主席Lan Du教授,為師生作“關(guān)于模型預(yù)測可信度的研究:多視角與多模態(tài)學(xué)習(xí)中的不確定性估計”的專題報告,并與現(xiàn)場師生進(jìn)行了深入學(xué)術(shù)交流與探討。
現(xiàn)代多視角和多模態(tài)學(xué)習(xí)系統(tǒng)通過整合來自視覺、文本、音頻與傳感器流等異構(gòu)信息源,在眾多任務(wù)中取得了令人矚目的表現(xiàn)。然而,盡管這些模型具有很高的準(zhǔn)確性,它們往往仍像“黑箱”一樣運(yùn)行,在給出預(yù)測結(jié)果的同時卻無法清晰表達(dá)其真正的置信度或不確定性。這一缺口對多視角/多模態(tài)系統(tǒng)在真實(shí)場景中的部署構(gòu)成了重大挑戰(zhàn),因?yàn)樵谶@些場景中,可靠性、魯棒性以及基于充分信息的決策至關(guān)重要。在本次報告中,我將探討多視角和多模態(tài)學(xué)習(xí)中不確定性估計的核心挑戰(zhàn),包括由異構(gòu)性和視角特異性帶來的不確定性來源、跨模態(tài)不一致、融合過程引入的不確定性,以及缺失或部分觀測視角對系統(tǒng)的影響。隨后,我將介紹我們近期提出的用于建模和估計多視角與多模態(tài)環(huán)境中不確定性的方法。這些方法旨在在模態(tài)互補(bǔ)、視角沖突以及隨機(jī)缺失等條件下提升預(yù)測結(jié)果的可信度。綜上,這些研究為構(gòu)建既準(zhǔn)確又可靠、具備不確定性感知能力的多視角與多模態(tài)學(xué)習(xí)系統(tǒng)奠定了系統(tǒng)化、可依賴的理論基礎(chǔ)。
主講人簡介:

Lan Du,博士,澳大利亞莫納什大學(xué)數(shù)據(jù)科學(xué)與人工智能教授,IEEE高級會員。研究興趣集中在機(jī)器/深度學(xué)習(xí)與自然語言處理的交叉領(lǐng)域,特別關(guān)注主動學(xué)習(xí)、不確定性估計和知識蒸餾等方向。致力于探索這些技術(shù)在公共衛(wèi)生、市場營銷, 生物化學(xué)等多領(lǐng)域的應(yīng)用。Lan Du教授已在機(jī)器學(xué)習(xí)、自然語言處理和數(shù)據(jù)挖掘的幾乎所有頂級會議/期刊上發(fā)表高質(zhì)量的研究論文100余篇,例如NeurIPS、ICML、ACL、EMNLP、AAAI、TPAMI、IJCV、TMM和TNNLS。還擔(dān)任《Machine Learning》《ACM Transaction on Probabilistic Machine learning》以及《Big Data Research》等國際學(xué)術(shù)期刊的編委,the AAAI Conference on Artificial Intelligence和the Annual Meeting of the Association for Computational Linguistics(ACL)的領(lǐng)域主席,并且是所有頂級機(jī)器學(xué)習(xí)和自然語言處理會議的程序委員會成員或?qū)徃迦恕W鳛槭紫芯繂T,成功獲得四項(xiàng)政府資助,包括一項(xiàng)NHMRC創(chuàng)意基金、一項(xiàng)ARC DP基金以及兩項(xiàng)MRFF基金,總研究經(jīng)費(fèi)約為500萬澳元。
