澎湃新聞 劉箏 圖
改革開放40年︱沈向洋:被計算機改變的人生
沈向洋/微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責(zé)人
1980年,改革開放的第三年,我在江蘇老家參加了高考。
記得填報高考志愿前的一天,我父親拿了一份《參考消息》走進家門,興沖沖地對我說:你應(yīng)該報計算機專業(yè),報紙上說計算機這個東西不得了!
那年我只有13歲,像大多數(shù)人一樣,我從沒聽說過計算機為何物,連計算器都沒見過。當然更不會想到,在接下來的幾十年里,計算機竟徹底改變了我的人生,也給整個世界帶來了翻天覆地的改變。
與人工智能結(jié)下不解之緣
1991年,我有幸考進了美國計算機專業(yè)排名第一的卡內(nèi)基梅隆大學(xué)計算機學(xué)院, 師從著名計算機專家拉吉·瑞迪(Raj Reddy)教授,研讀人工智能和機器人專業(yè)。
卡內(nèi)基梅隆大學(xué)有著當時全世界第一個機器人學(xué)的博士專業(yè)。多年來我一直很喜歡機器人這個方向,就是奔著機器人學(xué)專業(yè)去的,所以非常幸運。拉吉·瑞迪是國際上的語音專家,但是他非常支持我從事計算機視覺方面的研究,后來我的研究方向是機器人視覺。
以前我在卡內(nèi)基梅隆接觸到做科研的風(fēng)格,是團隊協(xié)作的風(fēng)格。同學(xué)跟我講,麻省理工大學(xué)和卡內(nèi)基梅隆大學(xué)最大的區(qū)別是:麻省理工大學(xué)每個人都是一頭虎,而卡內(nèi)基梅隆大學(xué)出來的都是一群狼。我們很少單打獨斗,都是一個團隊一起做一個大項目,卡內(nèi)基梅隆大學(xué)最出名的都是大項目。所以卡內(nèi)基梅隆大學(xué)成功的地方是培養(yǎng)了很多大的IT公司CTO級別的人物,很多學(xué)生在工業(yè)界更加成功。
也是在這一年,比爾·蓋茨先生在西雅圖創(chuàng)立了微軟研究院,當時他的愿望,是讓計算機能聽會講,能看會想。因此微軟研究院最早成立的其中三個研究組是計算機語音、計算機視覺和自然語言處理——正是這些基礎(chǔ)性的研究,為今天的人工智能奠定了堅實的基礎(chǔ)。
1996年,我作為研究員加入微軟研究院,從事計算機視覺研究。對我而言,加入微軟研究院,確是一種幸運,讓我有機會與世界頂尖的天才為伍。直到今天,我仍清楚地記得,剛到微軟研究院的那個星期,我發(fā)現(xiàn)自己離計算機圖形學(xué)領(lǐng)域的傳奇人物吉姆·布林[Jim Blinn,美國計算機科學(xué)家,曾經(jīng)在美國宇航局的噴氣推進實驗室(JPL)工作]只隔著4個辦公室,我難以抑制心中的興奮,抓起電話,語無倫次地把這個發(fā)現(xiàn)驕傲地分享給我太太。
人工智能發(fā)展之路
人工智能事實上是相對于人類智能而言的。我對它的理解主要有兩個方面:一個是“感知”,另外一個就是“認知”。
為什么人類有智能?第一,我們可以感受這個世界,主要是通過語音的方式和視覺的方式,所以對應(yīng)的人工智能感知方面最主要技術(shù)就是語音和視覺方面的技術(shù)。第二,我們還有認知,認知就是人類不僅僅能感受到這個世界,而且還能理解這個世界。而理解這個世界就包括理解真正的物理世界,以及理解你身邊的人,甚至是最最重要的——理解自己。所以,在認知方面,有兩類技術(shù)就格外重要了,一個是語言、自然語言,另外一個就是知識。這是這么多年來,我對人工智能的理解和定義。
我加入微軟研究院的時候,正值人工智能的“寒冬期”——現(xiàn)實世界中的基礎(chǔ)性研究枯燥乏味、進展緩慢,與之前人們所想象的“未來科技”相去甚遠,行業(yè)內(nèi)悲觀失望的情緒,讓當時的很多投資人和研究機構(gòu)都對人工智能研究避之唯恐不及。
今非昔比,如今的人工智能已經(jīng)成了行業(yè)內(nèi)外最熱門的話題。
為什么發(fā)展如此迅猛呢?主要是三個方面:大數(shù)據(jù)、大計算、精準算法。在豐富的大數(shù)據(jù)資源,強大的云計算平臺,以及先進的機器學(xué)習(xí)算法的支持下,人工智能開啟了蓬勃發(fā)展的黃金時代。
以云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能為代表的第四次工業(yè)革命正在到來,這一輪以技術(shù)創(chuàng)新為代表的數(shù)字化轉(zhuǎn)型,正在給全球的企業(yè)帶來巨大的挑戰(zhàn)和機遇,也給企業(yè)業(yè)務(wù)、商業(yè)應(yīng)用、產(chǎn)品和服務(wù)等方面帶來了巨大的沖擊。目前人工智能的主要方法論仍是基于大數(shù)據(jù)、大計算模式。擁有大量數(shù)據(jù)積累和分析需求的行業(yè)更適合通過人工智能技術(shù)實現(xiàn)轉(zhuǎn)型。
以醫(yī)療行業(yè)為例,在癌癥早期篩查領(lǐng)域,存在大量讀取醫(yī)療影像并作出判斷的需求。若是傳統(tǒng)人工讀片,效率較低,且正確率不高。加之醫(yī)療資源有限,很難做到每一個影像都能有效讀取。而人工智能技術(shù)應(yīng)用能夠很好地提高讀片效率,且通過計算和比對,有效提高正確率。這是一個典型的案例。
把握中國機遇
1997年,微軟公司在劍橋成立了研究院,之后決定把第二個海外科研機構(gòu)放在北京。我覺得這是一個非常難得的機會,在中國進行這么一次研發(fā)“創(chuàng)業(yè)”,也是公司內(nèi)部的創(chuàng)新。公司包括院里的一些老領(lǐng)導(dǎo)都鼓勵我,就把握住這樣一個機會。
1998年我回到中國,開始參與中國微軟研究院的建立。1999年1月15日正式轉(zhuǎn)到中國,成為了第一個研究員,到現(xiàn)在差不多快20年了。我還記得,當時的第一份工作,是讓我來選地毯的顏色。
以前念書的時候,我對國內(nèi)的關(guān)注不是太多。不過我覺得,在傳統(tǒng)的人工智能研發(fā)方面,中國一直有非常深厚的基礎(chǔ)。中國在傳統(tǒng)的模式識別這一個領(lǐng)域,包括手寫體識別等方面,都做得相當不錯,在國際上非常領(lǐng)先。我了解的很多國內(nèi)高校的老師,較早開始做傳統(tǒng)的模式識別研究?;貒薪涣鞲嘀螅揖烷_始關(guān)注這個領(lǐng)域的發(fā)展。
現(xiàn)在在中國,人工智能技術(shù)的蓬勃發(fā)展非常激動人心。這里有很多機會,在基礎(chǔ)科研方面也已經(jīng)取得很多了不起的成果。比如,在計算機視覺方面,已經(jīng)有很多本土公司,很多科研院校、院所,做了大量工作,推進這一技術(shù)的發(fā)展。我相信,中國有更多的機會,也將讓更多的應(yīng)用場景落地。中國的確有很多的優(yōu)勢。
近幾年,中國的經(jīng)濟、技術(shù)都在快速發(fā)展。中國不僅擁有龐大的消費市場,更已成為全球創(chuàng)新的重要力量。很多國內(nèi)的IT企業(yè)以及初創(chuàng)公司都不同程度在人工智能領(lǐng)域有所作為。中國的優(yōu)秀人才也不斷涌出。
從市場發(fā)展來看,創(chuàng)業(yè)、投資的趨勢正趨于理性發(fā)展和價值投資。但是相信由技術(shù)創(chuàng)新驅(qū)動的創(chuàng)新、創(chuàng)業(yè)、產(chǎn)業(yè)升級仍將保持強勁的發(fā)展勢頭。今后技術(shù)創(chuàng)新不再是噱頭,而是要與現(xiàn)實的應(yīng)用場景、行業(yè)應(yīng)用相互結(jié)合,真正解決企業(yè)運營或者人們生活中遇到的問題,提高生產(chǎn)效率、改善生活品質(zhì)。
從技術(shù)發(fā)展的趨勢來看,混合現(xiàn)實、人工智能、量子計算,將是未來技術(shù)發(fā)展的三個主要方向。國家發(fā)布了“新一代人工智能發(fā)展規(guī)劃”并且列出了首批四個重點人工智能平臺的發(fā)展規(guī)劃,近期來看,人工智能仍將是市場發(fā)展的一個熱點。
人工智能仍需冷靜
人工智能快速推進的同時,仍有些問題值得我們停下來想想。目前,人工智能發(fā)展主要面臨以下幾方面的限制:
第一,人工智能技術(shù)對大數(shù)據(jù)和大計算的依賴較大。這和人類智能有很大的差異,因為人們多數(shù)時候是用小樣本的方式在學(xué)習(xí),很容易舉一反三。這個方法論是需要思辨的。
第二,絕大多數(shù)的人工智能算法都是黑箱算法,包含有大量參數(shù),形成了一個復(fù)雜的網(wǎng)絡(luò)。這樣復(fù)雜的算法是可以推演的,還是只是函數(shù)的遞進,這也是我們需要深思的問題,也是下一步人工智能發(fā)展要解決的后續(xù)的問題。
第三,人工智能領(lǐng)域不僅過于重視數(shù)據(jù),而且重視的是數(shù)據(jù)的表象。很多時候,人工智能技術(shù)是在用復(fù)雜解釋復(fù)雜,為了擬合數(shù)據(jù)結(jié)果,而做出一個更加復(fù)雜的模型。這是與科學(xué)認知有悖的。在自然科學(xué)領(lǐng)域,人們應(yīng)當是通過復(fù)雜的現(xiàn)象抽象出一個簡單的本質(zhì)。因此從這個角度而言,人工智能技術(shù)還有待探索和發(fā)展。
第四,人工智能技術(shù)現(xiàn)在遇到一個很大的問題就是偏見。例如用網(wǎng)絡(luò)搜索引擎搜索CEO會發(fā)現(xiàn),出來的結(jié)果基本上沒有女性,亞洲人面孔也很少。這些都是隨著人工智能的發(fā)展出現(xiàn)的倫理問題。這不僅是科研的問題,也是整個行業(yè)的問題,整個行業(yè)和全社會都必須認識到這個問題的重要性,攜手合作,探索解決之道。
如何讓人工智能更加造福人類
作為一個從事人工智能研究將近30年的從業(yè)者,在為技術(shù)突破感到興奮的同時,我也開始認真思索,人工智能技術(shù)之于整個人類的未來的影響,以及科學(xué)家在技術(shù)發(fā)展和應(yīng)用中應(yīng)當承擔(dān)的角色與社會責(zé)任。
我認為我們所需要的人工智能創(chuàng)造,應(yīng)該符合三原則:
第一,人工智能創(chuàng)造的主體,不僅僅是具有IQ,而是兼具IQ與EQ的綜合體。人工智能時代的基礎(chǔ)架構(gòu),最終將是一種IQ和EQ完美融合的狀態(tài)。而在這個過程中,需要去分別發(fā)展IQ和EQ兩個維度。
第二,人工智能創(chuàng)造的產(chǎn)物,須能成為具有獨立知識產(chǎn)權(quán)的作品,而不僅僅是某種技術(shù)中間狀態(tài)的成果。
第三,人工智能創(chuàng)造的過程,須對應(yīng)人類某種富有創(chuàng)造力的行為,而不是對人類勞動的簡單替代(如工業(yè)機械臂那樣的“人工智能制造“)。
人工智能本質(zhì)上還是一門技術(shù),是由人來開發(fā)和控制的。技術(shù)本身沒有好壞之分。因此,我們需要客觀看待這個問題。我們支持技術(shù)的發(fā)展和演進,同時也希望國際組織、各個國家、整個社會一起努力,對技術(shù)利用從道德和法律上加以引導(dǎo),防止技術(shù)成為壞人作惡的工具。我們在工作中有一系列核心的原則:人工智能是用以增強人類能力的(AI must be designed to augment humans)、人工智能技術(shù)應(yīng)該是透明的、人工智能應(yīng)當在不傷害人類尊嚴的前提下最大限度地提高效率、為意外情況籌備智能隱私和問責(zé)機制、防范偏見。
(以上內(nèi)容由澎湃新聞記者沈丹麗采訪整理,經(jīng)作者審定)