騰訊科技訊 CVPR 2018 圖像壓縮挑戰(zhàn)賽(CLIC)結(jié)果已經(jīng)出爐,騰訊音視頻實(shí)驗(yàn)室和武漢大學(xué)陳震中教授聯(lián)合團(tuán)隊(duì)于該項(xiàng)挑戰(zhàn)賽上取得壓縮性能第一。
CVPR是世界頂級(jí)的學(xué)術(shù)會(huì)議,自1983年第一次召開至今已經(jīng)有30多年歷史,在國(guó)際學(xué)術(shù)圈有很強(qiáng)的影響力,每年的CVPR都是計(jì)算機(jī)視覺領(lǐng)域的盛宴,全世界相關(guān)領(lǐng)域的頂尖學(xué)者、研究人員和企業(yè)都會(huì)積極參與。今年,CVPR新增了圖像壓縮workshop和挑戰(zhàn)賽議程,這場(chǎng)挑戰(zhàn)賽由Google、Twitter、Amazon等公司聯(lián)合贊助,是第一個(gè)由計(jì)算機(jī)視覺領(lǐng)域的會(huì)議發(fā)起的圖像壓縮挑戰(zhàn)賽,旨在將神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等一些新的方式引入到圖像壓縮領(lǐng)域。
據(jù)大會(huì)官方介紹,此次挑戰(zhàn)賽分別從PSNR和主觀評(píng)價(jià)兩個(gè)方面去評(píng)估參賽團(tuán)隊(duì)的表現(xiàn)。騰訊音視頻實(shí)驗(yàn)室和武漢大學(xué)陳震中教授聯(lián)合團(tuán)隊(duì)iipTiramisu 在 PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)指標(biāo)上占據(jù)領(lǐng)先優(yōu)勢(shì),在決賽數(shù)據(jù)集上比第二名高了0.13 dB,位列第一。在其他指標(biāo)上,iipTiramisu 也位居前列。
峰值信噪比(PSNR)衡量的是壓縮前后兩張圖逐像素統(tǒng)計(jì)所產(chǎn)生的誤差,峰值信噪比越高,代表兩張圖誤差越小,也就意味著壓縮后的圖與原圖越接近、圖片質(zhì)量損失越小。
iipTiramisu在峰值信噪比上有顯著的優(yōu)勢(shì),與業(yè)界最優(yōu)秀的開源圖像壓縮算法之一BPG相比:
Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)
信噪比不變的情況下,在性能優(yōu)先模式下iipTiramisu比BPG節(jié)省30.8%的碼率,速度優(yōu)先模式下比BPG節(jié)省27.9%的碼率;
在碼率都為0.14 bpp的情況下,iipTiramisu的峰值信噪比比BPG高1.58 dB,質(zhì)量損失率明顯減少。
據(jù)陳震中教授介紹,iipTiramisu團(tuán)隊(duì)使用了基于傳統(tǒng)混合框架(hybrid image coder)融入深度學(xué)習(xí)的編碼模塊CNNMC以及CNN in-loop filter,以及基于不確定性的資源分配策略,最終可以在數(shù)據(jù)集壓縮性能上比BPG提升30%以上。
iipTiramisu由騰訊音視頻實(shí)驗(yàn)室硅谷研發(fā)中心和武漢大學(xué)陳震中教授團(tuán)隊(duì)聯(lián)合組成。 陳震中教授是武漢大學(xué)教授、博導(dǎo),青年千人,主要從事計(jì)算機(jī)視覺、圖像視頻處理、人機(jī)交互、數(shù)據(jù)挖掘等方向的研究,近年來發(fā)表國(guó)際期刊會(huì)議論文120多篇,擁有50余項(xiàng)國(guó)際國(guó)內(nèi)標(biāo)準(zhǔn)(H.265/HEVC/AVS)提案、10余項(xiàng)國(guó)際國(guó)內(nèi)專利申請(qǐng)或授權(quán)。騰訊音視頻實(shí)驗(yàn)室和陳震中教授團(tuán)隊(duì)在圖像視頻處理、人工智能等領(lǐng)域展開了深入的合作。
圖像壓縮技術(shù)對(duì)于互聯(lián)網(wǎng)信息傳輸有至關(guān)重要的意義。一張未經(jīng)壓縮的 1200 萬像素的圖片就會(huì)占用 36MB 的存儲(chǔ)空間,而目前網(wǎng)絡(luò)上每天圖片傳輸、存儲(chǔ)數(shù)量數(shù)以億萬計(jì),為了節(jié)省帶寬資源、存儲(chǔ)資源,減少服務(wù)器的壓力,高效的圖像壓縮算法必不可少。
騰訊音視頻實(shí)驗(yàn)室在圖像壓縮領(lǐng)域有很深的積累,去年5月,該實(shí)驗(yàn)室推出了一種基于AVS的自研圖片格式TPG,其壓縮效率也顯著領(lǐng)先于JPG/JPEG、PNG、GIF、WEBP等主流的圖片格式,處于世界領(lǐng)先水平。今年5月,TPG還因?yàn)樵贏VS標(biāo)準(zhǔn)制定和推廣中做出的突出貢獻(xiàn),獲得了AVS工作組頒發(fā)的年度AVS產(chǎn)業(yè)技術(shù)創(chuàng)新獎(jiǎng)。此次獲得CVPR 2018圖像壓縮挑戰(zhàn)賽壓縮效率第一,意味著騰訊音視頻實(shí)驗(yàn)室在圖像壓縮領(lǐng)域又取得了一個(gè)長(zhǎng)足的進(jìn)步。