騰訊科技訊 7月4日百度AI開發(fā)者大會上,百度高級副總裁王海峰上臺,開始介紹百度大腦3.0,指出多模態(tài)深度語義理解是百度大腦3.0最大的變化。
百度大腦3.0 的多模態(tài)深度語義理解包含視覺、語音、自然語言、數(shù)據(jù)語義以及多元語義這些因素。
王海峰博士指出,基于百度大腦的視覺語義化技術,機器可以全面識別視頻中內容。如今年世界杯期間,機器可以識別出比賽視頻中的球員、裁判、球、以及球門、球場線等人、物和場景。那么機器如何看球?用一句話概括就是,多模態(tài)深度語義理解。不僅讓機器聽清、看清,更要深入理解其背后的含義,從而更好地支撐各種應用。
基于百度大腦的視覺語義化技術,機器可以全面識別視頻中的球員、裁判、球、以及球門、球場線等人、物和場景,可以捕捉射門、進球、角球、任意球、換人等事件。進而提煉出結構化語義信息?;谶@樣的信息,既可以完成機器人自動解說,還可以進行精彩片段集錦、以及各種數(shù)據(jù)統(tǒng)計分析等等。