作者:天下編輯部
科技創新浪潮,從PC(個人電腦)移到行動裝置,現在最熱門的就是人工智慧(AI)。不過,也有很多人覺得,AI話題被炒得過熱。微軟亞洲研究院副院長馬維英在「2017天下經濟論壇」中指出,數據就是新石油、火藥,如果集中資源,就能創造大爆炸。因此,企業一定要跟與用戶更靠近,拿到更多、更新的數據。以下為演講摘要:
今天我想花點時間、揭開人工智慧(AI)的神秘面紗。
全世界有很多趨勢在推動人工智慧。第一個趨勢是「萬物數位化」,當世上萬事、萬物能夠轉化成數位資訊,電腦就能得到大量的數據,可以開始運算。第二個趨勢則是「萬物互聯」,這其實是很不得了的事情。
第三個趨勢則是「雲端運算」出現。任何人、任何公司,如果需要幾千台伺服器來處理大量竄出的資料,可以付費從雲端取得這些運算資源。
軟體產業本身也被顛覆
雲端運算的出現,導致第四個趨勢「軟體智慧化」。傳統認知上,工程師要用人腦來寫每一條程式規則,但現在則是軟體自己能夠藉由機器學習的方式驅動完成。這些深度學習、類神經網路的軟體,本身都是很大的模型,是幾千億、幾兆的參數組成,不可能用傳統人工調整。
資料愈來愈多、軟體愈來愈聰明,這些趨勢形成了正向循環,促成人工智慧變革,今天大家可能知道軟體正在吃掉全世界,但是可能不知道,軟體產業本身也正在被顛覆——工程師如果只會寫程式、但不會使用深度學習、網路開源社群資源,也會失去競爭力。
語音辨識是AI的主流產品
接下來,我想講人工智慧的發展歷程,語音識別是當今主流產品。
過去20年,語音識別幾乎沒什麼重要發展,被認為是高不可攀的學術領域。但加入深度學習技術後,現在語音已經平民化、大眾化,微軟的語音辨識技術,已做到跟真人語音相同的精度。
接著是基於深層神經網路開發出的圖像識別技術,這是從大腦結構得到啟發,一個輸入層、一個隱藏層及一個輸出層,三者之間都有神經元做連接。舉例來說,我們向電腦展示兩張照片,一張是狗、一張是貓,電腦會根據像素組成結構建立建立標準模型。並判斷其他照片是狗、或是貓。
這就是神經網路的運作原理。一層一層分類下去,學的空間非常大。
以前傳統的人工智慧,還需要人類去檢視、調整,相當曠日費時,現在電腦可以直接從數據學習表達。當神經網路愈做愈深層,再複雜的問題都能解決,只怕沒有足夠的資料讓機器學習。
機器學習有一個特點,有愈多數據,它學出來的成果就更好。當聊天機器人聽過大家聊天問答、看過物聯網上的諸多圖像,它就能學會更多事情。
AI的競爭,已全面進入思想解放時期
當然,今天人工智慧還是有很多做不到的事情,比如理解、表達、擁有知識,下一個門檻就是學會人類語言。
比如公司開會時,大家花很多時間找秘書,能不能有一個機器人可以代勞?但其實辨別自然語意並不簡單,機器人必須辨別你說出的人名實際上是哪些人、與會者的辦公室在哪些地方,並決定出最適合的會議地點。
解決問題的方法非常多,比如圍棋,要用加強學習、機器互打的對抗學習方式,解決數據資料不足的問題。
在我們研究院過去幾年,已經創造一個強大的知識圖譜,一個人沒辦法記全世界的知識,但電腦可以,我讀你的文字時,可以同時連接到全世界的知識。
接下來,還有聊天引擎,我們想把聊天機器人做到微信、LINE等通訊軟體中,取代企業官方帳號功能——你有什麼需求,就去跟機器人說。
未來,人工智慧將透過語音機器人,重新定義人機介面。人工智慧的競爭,已進入思想解放時期,很多嶄新的想法問世。
數據,就是企業最重要的戰略資源
我發現,現在也有很多人對人工智慧感到不安,怕被人工智慧取代、甚至覺得這些尖端技術僅數於少數人。但我要說,現在門檻已經不再高不可攀,你有很多顛覆別人的機會。
對於企業,我建議你要比別人掌握更大、更有品質的數據。任何公司都應該要把數據視為戰略資源。數據就是火藥,如果你只掌握了一點點,就只能放鞭炮,但如果集中資源,就能創造大爆炸。
因此,你要跟與用戶更靠近,拿到更多、更新的數據。你也需要好的基礎設施、判斷模型,因此,政府也必須投入更多科研計劃。
人工智慧也可以帶來新的商機,我昨天去參觀台北醫學大學,台灣醫療資源都是非常好的。我住在中國,我知道北京醫療資源非常稀缺,大家掛號1個月還看不到醫生。是否可以在病人進入醫院前,透過大數據的方式做一些診斷?就像澳洲輸出教育產業一樣,台灣醫療產業或許能夠輸出,可以造福全世界。
這是一個最好、也最壞的時代
人工智慧現在很流行一個詞彙是「learning to learn」(學習怎麼學),我覺得人很大的能力,包括教育,是教導一個人的學習能力在離開學校以後,該如何面對最新的變化?
我讀博士的時候是做影像搜索,但我當初做的研究現在完全沒用了。我每天都有急迫感必須不斷學習,對我來說,我是要每天不斷學習的。
這是一個最好的時代,也是一個最壞的時代,值得我們去顛覆、去突破。
讀者迴響