5月21日,記者獲悉,人工智能領域CCF-A類頂級會議IJCAI 2024年度的論文日前揭曉,西安電子科技大學通信工程學院的何剛老師團隊所發表的最新針對視頻人臉修復算法研究成果被成功收錄。

人臉恢復通常指從低質量的人臉圖像中恢復出高質量細節的技術,例如去模糊、去噪聲、恢復等。這些技術通過算法改善圖像質量,使人臉特征更清晰。而視頻人臉恢復則是將這一過程應用于視頻序列,它不僅需要處理每一幀的圖像質量,還要保證時間上的連貫性和自然過渡,確保視頻中人臉的動態表現和質量的一致性。這要求算法能夠有效處理視頻中的運動模糊、壓縮損失等問題。人臉恢復任務在最近幾年被廣泛研究,并且在工業界被廣泛應用。

西安電子科技大學何剛團隊研究首次提出了一種新穎的盲視頻人臉恢復方法,即解析引導的時間一致性變換器(PGTFormer),旨在解決現有技術在處理低質量視頻人臉時遇到的挑戰。該方法無需預對齊即可恢復高保真的人臉細節,并增強視頻中不同姿態變化的時間連貫性。PGTFormer利用語義解析指導選擇最優人臉先驗,生成時間上連貫且無缺陷的人臉結果。該研究還包括了一個時間空間矢量量化自編碼器(TS-VQGAN)的預訓練模型,以及一個時間解析引導的碼本預測器(TPCP),這些創新技術顯著提高了人臉恢復的效率和準確性。

責任編輯:黃蕊