福士公司发生机械手”杀人“命案
德国汽车制造商福士(Volkswagen)周三发生一宗罕见的致命事故,一名技术人员遭一个机械人「攻击」死亡,令业界对工业自动化的忧虑加深。当时这名二十一岁的外判员工与另一名工人正在组装新的电动车自动生产线,但突然被机械人抓住胸口,并撞向一块金属板。
据了解,一只机械手臂原定举起汽车的零件,却误把技术人员举起撞向金属板,令其胸部受到重创,他送院後证实死亡。在西方国家的工厂内,极少发生与机器人有关的死亡事件,因为重型机械人会被放在特定的安全护笼(safety cages)後面确保安全,以避免它们与人类意外接触。但该名技术人员事发时正好站在护笼内,第二名技术人员由於在笼子外面,因而没有受伤。
福士发言人称初步结论是机械人没有出现技术问题,事故应归咎於人为错误。正常情况下,机器人只能在工厂一定范围内工作,负责抓取和操纵一些汽车零件。发言人又称肇事机械人不属於新一代轻量级机械人,不可以在生产线上与工人们一起工作。
警方正调查事件起因,当地检察官称从未听闻类似案件,正考虑是否提出起诉以及起诉谁。
有关事件加深人们对工业自动化的忧虑,包括机械人能否受控的问题。福士是全球自动化制造汽车最多的生产商之一,大量使用以电脑操控的机械人於生产线中。
機器人殺人了?!來看看真正的機器人世界
機器人真的如此恐怖嗎?機器人會消滅人類嗎?
每周你給你的機器人100比特幣,結果它卻買回來10粒搖頭丸和一張偽造的匈牙利護照,你不得不去警察局把它“撈”回來。
這并不是科幻小說。今年初,瑞士的一個研發團隊“!Mediengruppe Bitnik”發明了一個自動化網絡購物機器人程序,并將其安裝在一個機器人身上,稱為“隨機暗網購物者”,該研發團隊要求機器人每周從在線市場隨機購買商品,于是就發生了以上的測試結果。這個“膽大妄為”的機器人確實也被警察帶走了。
這就是人工智能在今天和不遠的未來能做的事情。當下較為普遍的人工智能定義是:利用計算機程序的方式,自動完成人類可以完成的功能。
百度首席科學家吳恩達表示,人工智能發展50多年來,已經無處不在了,最近一兩年取得了突飛猛進的進步,一是得益于為計算機提供的數據量越來越大,二是因為計算機的運算速度越來越快。
根據摩爾定律,計算能力每18個月翻一番,計算機容量和功能亦是如此。美國科學家雷·庫茲韋爾(Ray Kurzweil)預言,到2019年,售價4000美元的計算機的計算能力將會超過人腦,即每秒20 quadrillion(千的五次方)次計算。
神經元網絡與大數據急速發展
谷歌完全無人駕駛車正等待美國加利福尼亞州的批準,一旦獲準便可馬上路測。曾在谷歌擔任建立“谷歌大腦”重任的吳恩達評價稱,過去幾年里,計算機視覺獲得了大大的進步,開始區分事物,識別出各種圖片間十分微妙的差別,甚至有人已經著手研究讓計算機識別漂亮的圖片與不漂亮的圖片,這就自然給自動駕駛汽車帶來了激動人心的發展提升。百度無人駕駛汽車也已落地。
自動駕駛汽車技術包含幾個關鍵技術:精確的地圖定位、圖像識別、語音識別、基于感知的雷達、紅外形成自動導航,然后再進行模式識別,根據路上的情況不斷優化模型,即大閉環優化。
科大訊飛高級副總裁、訊飛研究院院長胡郁表示,自動駕駛是人工智能最好的功能應用之一,“人工智能有三個條件:第一先進的算法,比如神經元網絡,第二大量的數據,第三大閉環優化模型”。自動駕駛汽車中的地圖定位、圖像識別等都需要借助先進的算法,同時產生大量的數據,最后在優化中讓機器自己不斷學會完全的無人駕駛。
整個過程在科學界亦稱之為“機器學習”。吳恩達認為,機器學習是人工智能的一個重要分支,而機器決策、策劃、不確定性推理則是下一個階段。他將機器學習比喻成一枚火箭,人工神經元網絡是發動機、大數據是燃料。
最近幾年在移動互聯網及智能硬件的帶動下,大數據的膨脹已不言自明。Facebook稱今年元旦一天上傳圖片量就達7.5億張。百度今年一季度財報顯示,僅百度LBS開放平臺每天響應來自第三方的定位請求就超過110億次。
與此同時,人工神經元網絡也取得了飛速的發展,這其中又包含兩個方面的技術:第一硬件,過去服務器用的是CPU,現在用GPU(Graphics Processing Unit,圖形處理器),后者比前者至少快14倍,世界上最快的中國“天河二號”超級計算機用的就是CPU+GPU的模式;第二過去神經元網絡都是單層結構,現在不僅變成多層,還出現了多種計算方式,比如RNN(Recurrent neural Network,多層反饋神經網絡)、DNN(Deep neural network,深度神經網絡)、CNN(Cellular neural network,細胞神經網絡,又稱卷積神經網絡)。
單層神經網絡只能獲得幾百個神經元,而多層金字塔式結構則可達到十幾億神經元的規模,能更好地模擬大腦。每一層會記錄不同的類別特征。頂層用來輸入信息,比如照相機捕捉到一只貓,機器收到信息就開始在每層查找匹配,最終輸出信息告訴你“這是一只貓”。
科技更加進步的地方在于,以前,科學家們告訴計算機“貓臉”的幾個特征標簽,計算機“按標索貓”,但是現在,科學家們改用無監督學習方式,只給機器查找的方法,讓它自己去找,查找的過程又會生成數據,影響它下次的查找行為。
谷歌無人駕駛汽車用的便是RNN神經網絡,它賦予了計算機邏輯推理的能力,讓它可以用一句話對畫面進行簡單描述,這樣計算機便具備了用有邏輯的語言描述圖片中不同事物的能力。
雅虎則利用CNN神經網絡,可以從寬泛的角度來識別人臉,即使部分被遮擋住了,而且它可以相當精確地從相同的圖片中識別出多張臉。雅虎團隊把這種方法稱為深度密集人臉檢測器。
微軟5月份上線的How-old.net與此有異曲同工之妙,即:上傳圖片,機器檢測到人臉,并給出年齡的大小。雖然準確率很低,但是其功能應用更進一步,也起到了收集數據的作用。
不只是雅虎、微軟,Facebook臉部識別率的精確度達到97.25%,國內百度LFW測試中曾跑出99.85%的國際最高分。
胡郁稱,在機器學習領域的算法,國內外技術水平不相上下,“谷歌的看圖說話能力很強,但我覺得這并沒有訊飛高考機器人難度大。只不過兩者專注的領域不同”。據胡郁介紹,大多數省市的中考、高考英語口語考試,都已由訊飛高考機器人作為主考官來完成。
教育考試、無人駕駛、圖像識別、語音識別、即時翻譯、工業和家居機器人等等人工智能產品,無不是神經元網絡與大數據飛速進步的產物。
這些進步都只僅限于一種功能,到目前為止,人類還沒有發明一個具備五官感覺功能的機器人。
特征:單一功能與語音交互
2014年11月,意法半導體在日本展示了一個人形機器人iCub。iCub已經意識到自己的身體以及它如何和世界互動,這類似于嬰兒學習夠拿物件的過程。2014年5月,在加利福尼亞州舉辦的會議上,微軟展示了一款可以實時語音翻譯的人工智能程序,一名研究人員用英語與一名德國的同事通話。2014年1月,谷歌斥資4億英鎊收購了位于倫敦的Deepmind人工智能公司。Deepmind最擅長的是,能夠讓計算機學會49種不同的電子游戲。而且在超過半數的游戲中,計算機熟練到可以擊敗一個專業的人類玩家。
這看上去是三個級別的人工智能技術,但實際上都是專注實現一種功能,iCub做的是感官反饋功能,即時翻譯做的是翻譯功能,Deepmind就是打游戲功能。同樣都是輸入與輸出,涉及復雜的計算。
工業機器人是單一功能人工智能的最好詮釋。1959年,第一個工業型機器人被安裝于瑞典的一個金屬制品工廠。它是一個有關節的,能運轉的手臂,重達2噸。通過磁鼓上的程序控制,機器人可依賴液壓缸調整機械臂的位置,到達一系列預設好的角度。
目前,超1300萬的工業型機器人在各行各業投入使用,包括汽車、電子產品、橡膠和塑料、化妝品、醫藥、食品和飲料。它們的市場價值達95億美元。
吳恩達說:“現在的機器人之所以能取得成功,顯然是因為工業化應用,科幻小說中說的那種什么都能做的泛用型機器人,現在幾乎不可能造得出來。”他覺得現在能夠期待的是,對著手機說:“幫我叫輛車帶我去機場”,然后就能如愿以償。具有強大語音交互能力的機器已可期。他認為,人工智能下一個將要開啟的就是,語音交互時代。
在十多年間,人機交互發生了兩次突破:PC和鼠標的誕生、觸屏操作和語音交互問世。其中最后兩個都是在近十年發生的。特別是語音交互,它意味著計算機擁有了“聽覺”并能給出正確的反饋。語音交互的實現解放了人類的雙手,將促進人類生產力的巨大飛躍。胡郁亦認為,機器不能理解語言,就不能形成知識、對知識進行處理,就不能進行邏輯推理。機器需要一場認知革命,正如人類在7萬年前開始掌握語言一樣。
吳恩達認為,當語音識別準確率達到99%時(百度目前為96%),人與機器的交互就將發生徹底改變。他表示,這并不難實現。今年初百度流出的“百度神燈”手機視頻,較好地展現了語音交互時代。這并不意味著機器掌握了語言,交互只是理解語言的開始。一般認為,人工智能分為三個階段:計算智能、感知智能、認知智能。從感知飛躍至認知智能,目前人類還沒有好的方法。但感知智能已被大面積商業化,在使用的過程中,機器會不斷進步。
未來:威脅不到人類
隨著技術的快速發展,就像科幻小說一樣,機器人真的來搶人類的工作了。
2013年9月,兩位牛津學者——Carl Benedikt Frey和Michael Osborne,就發布了一篇研究報告,該報告預測在未來20年內,美國將有約50%的工作崗位因機器人而消失。根據兩位的計算,在今后的二十幾年內,50%的編程工作也會外包給機器人。
失去工作還只是影響之一,機器的進步給人類帶來的更大威脅是,消滅人類。去年10月,在美國MIT的一次公開訪談上,特斯拉創始人馬斯克稱人工智能就是“召喚惡魔”,很多科學家對此表示了認同,并將超級智能作為人類的重大威脅,與小星球沖撞地球和大規模的核戰爭并列。雷·庫茲韋爾(Ray Kurzweil)亦曾發出樂觀的預言:機器智能超越人類智能總和的那個奇妙“奇點”,就在2045年。
不過,吳恩達與胡郁均表示,不必為機器的進步過分焦慮。現在,每位駕駛員在每次航班上平均只駕駛3分鐘的飛機,但飛行員并沒有被取代,就像ATM機并未取代銀行柜員一樣。恰恰相反,因為銀行支行需要的柜員減少,銀行便開設更多支行,而銀行柜員的總數增加。
科技一邊接手一些任務,一邊也增加了對商品和服務的需求,因此也需要更多執行剩余任務的人力。一項統計表明,在過去30年中,計算機在辦公室文職工作里被廣泛應用,而工作崗位卻每年增加1.2%。
因此,人類仍然為擁有更聰明的人工智能技術而不吝千金。2014年,百度在研發投入上共計花費69.81億元,訊飛的研發投入占銷售收入的比例也高達30%-40%。然而,這與一年投入106億美元、104億美元、80億美元的Intel、微軟、谷歌,以及一個季度花掉10.6億美元研發經費的Facebook相比,并不算什么。
吳恩達說,人工智能的進步速度與投入是極度相關的,中國在這方面需要增加投入。胡郁亦表示,“并不是別人不會做,而是別人沒這個條件做這個事情。”這個條件,一是指數據規模,二是指資本投入。(作者陳慶春為《財經》雜志TMT報道主管編輯,本文原載2015年5月25日《財經》雜志,經《哈佛商業評論》中文版重新編輯。)