前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的人工智能的商業化應用主題范文,僅供參考,歡迎閱讀并收藏。
報告從醫療人工智能的發展角度出發,以商業落地為切入點,總結出中國醫療人工智能發展10大洞察。梳理了國內10項主流的醫療AI產品,醫療人工智能領域中十大主流產品,并從技術成熟度、使用效果、發展情況、企業案例等角度進行分析。
2018中國醫療人工智能十大洞察從人工智能在醫療健康領域的四個核心應用場景——醫學影像、虛擬助理、健康管理和藥物研發的角度,提出出中國醫療人工智能發展的十大洞察及相關觀點。
1. 部分智能影像診斷企業將在2018年獲得三類器械證,正式進入商業化階段。
2. 智能影像診斷競爭格局基本形成,“偽醫療AI企業”基本出局,新入場技術型玩家基本沒有獲得風投的可能,商業機會已然錯過。
3 .語音電子病歷:落地醫院成本高,產品需進行科室定制化,客單價低,主要用于病理科、影像科等。
4. 智能問診:知識圖譜搭建是關鍵,目前僅發揮導診、輔助檢索或連接醫患的作用。院內場景“預問診”需求量大,具備落地能力.
5. 國人健康管理意識尚待培育,健康大數據尚待采集與整合。企業以B端為主要切入口。
6. 精神心理治療師嚴重缺乏,AI或可成為替代性工具。
7. 藥物研發中化合物數據質量對于AI企業是關鍵。
8. 借助國際力量,中國AI藥物研發企業從無到有,預計2018年起將涌現更多玩家,AI藥物研發或將是未來的新風口。
9. 產品形態以軟件/SaaS為主,收取軟件授權費的商業模式存在一定局限性。軟硬一體化產品的商業落地更具優勢。
10. 中國醫療整體數據量大,但針對細分場景的數據量和質量仍無法滿足算法模型的訓練需求;隨訪數據的缺失,使國內在類似“腫瘤患者五年存活率”等領域的研究一片空白。
醫療人工智能應用場景與技術路線人工智能與醫療健康結合點在哪里?下圖呈現的是人工智能技術在醫療領域的主流應用場景與技術路線,通過該圖能夠對中國醫療人工智能的格局有清晰的了解。
中國十大醫療人工智能產品總覽為了更深入的解讀商業落地的現狀,在報告中,億歐智庫主要按照技術成熟度和使用效果兩大維度對醫療人工智能十大產品進行了分析與評估。其中,針對技術成熟度和使用效果兩大維度,主要通過產品出現時間、落地情況、發展情況、企業數量、行業人士和專家訪談進行判斷。另外,還從產品的發展情況、涉足的企業案例等角度更加具體地進行分析。
醫療人工智能六大發展趨勢結合政策和商業落地產品的現狀,億歐智庫認為市場在今年呈現出六大趨勢:
1. 2018年起,AI影像產品落地速度會加快,產品性能成熟度將不斷提高。
2. 隨著技術成熟度提高,語音電子病歷醫院普及率加快,頭部企業可形成規模效應
3. 智能問診隨著知識圖譜的不斷完善,預問診功能可以有效提升醫生效率
4. 健康大數據的發展,會使AI在健康管理場景下的應用程度會進一步提高。
5. AI在精神心理健康的的滲透程度會更深,未來可能成為這一領域的核心推動力
6. AI+藥物研發領域將會誕生出獨角獸。
醫療人工智能發展四大挑戰一是數據數量問題:中國醫療整體數據量大,但針對不同病種的數據量和質量參差不齊,有些病種的訓練數據缺乏;健康大數據孤島問題有所緩解,但仍未達到深度學習的階段。
二是數據質量問題:AI數據處理中標注的準確性關乎結果的準確性,近兩年之內還是需要大量醫生去標注。藥物研發中的數據質量對于研發效率的提升至關重要。
三是人才問題:AI算法人才與醫學人才知識體系不同,如何融合各自優勢發揮最大價值,值得企業思考。
中國電子信息產業發展研究院總工程師烏寶貴參加了本次大會并代表主辦方致辭。烏寶貴回顧了人工智能的歷史,肯定了人工智能60年來的發展成績,并指出,中國人工智能產業正步入一個嶄新的階段。從科學研究角度來看,中國在深度學習等領域的學術研究水平,已經走在世界前列;從龍頭企業發展角度來看,阿里等國內企業在人工智能領域已經具備和國際巨頭抗衡的實力;從創新創業角度來看,人工智能已經成為國內“雙創”最活躍的領域之一;從應用創新角度來看,制造、交通、家居、教育、金融、大健康等眾多領域的應用正全面展開;從產業鏈角度來看,從智能芯片到IT基礎設施,從底層架構到模型算法,從大數據到云平臺,從智能終端到智能應用,國內在各個層面均取得了突破性進展。他表示,人工智能不僅僅是一個概念,而是下階段技術創新、應用創新的新焦點,是市場發展的新熱點,也是我國推動產業轉型升級的重要支點。
中國科學院自動化研究所復雜系統管理與控制國家重點實驗室主任王飛躍參加了本次論壇并發表演講。王飛躍以《邁向人機混合虛實互動的平行智能》為主題,追溯了智能的本源,探討了平行時代的智能基礎設施X5.0,并展望了智能產業和智能社會。王飛躍認為,陽為智能,陰為情報,相輔相成,智能是開放的情報,情報是封閉的智能,智能的本質是利用已知解決未知,從已知到未知只能依靠想象。王飛躍提出,物理世界與心理世界、人工世界共同構成平行世界,平行世界需要平行智能。開放智能算法,開發人工世界,最終消除“智力的不對稱”是新智能時代的歷史任務。人機混合、虛實互動的平行智能,是“激活”的人工智能,是未來人、組織、各種類的智能機器、裝置、過程、系統所必備的“生存”形式,是智能產業的基礎設施。X5.0 時代的智能體系包括:一個核心――平行,兩個支撐――ACP 和CPSS,三個主題――智能系統、智慧管理和社會智能。平行智能各種各類的虛實互動X5.0 系統是智能社會的基礎設施,不久的將來,一個個體的實力,很大程度上可能并不取決于其本身,而取決于與其伴生的軟件定義的人工映像。
中國電子信息產業發展研究院電子信息產業所副所長溫曉君參加了本次大會,并以《電子信息產業新興熱點及趨勢――人工智能與虛擬現實》為主題發表演講。溫曉君指出,泛在、互聯、融合、智能成為產業發展新趨勢,技術創新是國內經濟新舊動能轉換,經濟結構轉型升級的核心推動力量之一,是從根本上打開增長之鎖的鑰匙。溫曉君重點解讀了人工智能和虛擬現實的發展現狀和趨勢。溫曉君分享了智能感知、人腦芯片、深度學習、大數據等人工智能前沿技術,移動社交、智能搜索、機器人、無人駕駛等人工智能前沿應用,指出“基礎資源+技術+應用”的人工智能產業生態逐步形成。我國人工智能產業需構建開放生態體系、合作搭建基礎資源、促進產業鏈深度合作、開拓可持續應用需求 。在虛擬現實方面,溫曉君判斷,消費端市場早期一定爆發于歐美等發達國家,國內市場短期內以產業鏈布局蓄力和消費者提升消費認知為主;行業應用一定從高附加值行業或價值鏈的高端環節興起,應用成本與效率提升必須首先得到權衡。他指出,虛擬現實的趨勢為:消費市場的普及化、行業需求的明晰化、投資熱潮的全球化、基礎平臺的開放化、技術創新的協同化。他建議,強化頂層設計,面向行業需求規劃應用路徑;加強重點攻關,盡快突破行業應用技術瓶頸;制定標準規范,開展行業應用聯合測試驗證;推進試點示范,以點帶面擴大行業應用范圍和影響力。
搜狗、英特爾、陌上花(衣+)等企業代表分別從各自的領域出發,分享了人工智能的實踐與思考。
北京搜狗科技有限公司CTO楊洪濤分享了關于互聯網產品自然交互的經驗。他指出,人機之間交互的學習成本在不斷降低,變得越來越接近人的自然能力,語音正在成為最自然的交互形式。在他看來,自然交互= 技術 + 計算力 + 數據 + 產品。技術是擴散的,計算力穩步增長, 只有數據和產品才是私有財產,將成為競爭的壁壘。要想做好自然交互,需要充分利用“產品+數據”。會上,楊洪濤還分享了搜狗輸入法即將推出的智能回復功能。
英特爾中國研究院院長宋繼強博士就《人工智能驅動的智能交互,推進個人機器人產業化》發表演講。他說,人工智能與人機交互推動科技進步,人工智能應用的終極平臺是自主系統。他分析,個人自主服務機器人理想與現實的差距在于智能組合的實現難度,其中運動不易,認知更難。人工智能聯手智能交互,通過商業化成功帶動人工智能的發展和成本下降。宋繼強分享了幾種人工智能驅動智能交互的應用模式,并提出了個人機器人的智能度分級建議,展望了個人機器人的商業化迭代 ,即在用戶需求推動下,由能力達標到價格達標,再到可靠性達標。
當我們想忽視它的時候,一些陳舊的科幻故事會跳出來,將當時的設想和如今的技術產品擺到我們眼前:看,多少個荒謬的想象,在現實中就是不可思議地成真,還被應用了!當我們想推辭說,擁有人類智慧的機器人,技術實現上還遠得很呢!但一個個機器人打敗人類的例子又活生生地公布在新聞中,把這個技術性“能夠”和道德性“應該”的話題,不斷地逼到我們面前。
如今越來越多的人,在新奇地看著那些會說、會笑、會動的機器人時,會忍不住疑問,未來會不會發生我們都不曾理解和預想的事情?像宇宙大爆炸一般的技術奇點會不會不期而至?人類會成功主宰我們自己的世界嗎?那個時候,我們又該說人類是聰明還是愚蠢呢?
在人工智能再次成為當下熱點話題的今天,英國倫敦帝國理工學院認知機器人學系教授默里?沙納漢帶著他的新書《技術奇點》來到中國,希望為這個人工智能起步不久的國度,帶來更多的思考和討論。
人工智能新的春天
《鳳凰周刊》:如今人工智能在當下又掀起全球關注的熱潮,這一輪人工智能的發展狀況是怎樣的?
默里?沙納漢:人工智能指的是計算機機器人,他們能在不同環境之下做出正確決定,完成任務。目前,人工智能技術最新的進展是讓機器人擁有學習力,以及擁有更強大的處理龐大數據的能力。比如說,我們可以教一個電腦辨認和創造圖像,給每個圖像編號,電腦學習這些無數的圖片后,可以創造一個新的圖像,我們從來沒有見過的。
《鳳凰周刊》:人工智能的發展過程是什么樣的?
默里?沙納漢:在西方,“人工智能”并非新鮮詞匯。上世紀八九十年代,人工智能研發熱潮興起,美國、日本等國家熱情高漲,政府進行了大量投入和研究,后來很多預想并沒有實現,人工智能又陷入了引人疑問的寒冬期。近20年來,人工智能經歷了三個里程碑:1997年,IBM機器人“深藍”打敗世界國際象棋冠軍加里?卡斯帕羅夫;2001年,又有IBM的機器人在一款美國游戲中,打敗人類對手獲得冠軍;2016年,谷歌的機器人“Alpha Go”打敗了圍棋大師李世石。
最近的這一次,再次引發了人們對人工智能的強烈關注。在我看來,人工智能正在迎來又一個春天。是否會像前一輪一樣大起又大落呢?我認為不會,因為現在的很多人工智能已經應用到了我們的生活設備當中,實現了商業化,形成了產業效應,比如說無人駕駛汽車、醫療產品等,未來會是一個良性的循環,這就是為什么谷歌、臉書、百度等大公司都有很高的投資和研發熱情。
我注意到,中國出臺的“十三五”計劃,也明確提出了人工智能將是一個值得開發的重點領域。百度公司投資人工智能已有一段時間,現在小米公司也宣布要投資人工智能技術。
《鳳凰周刊》:人工智能對我們目前的生活有何影響?
默里?沙納漢:這一輪人工智能的影響,可以分為短期和長期來看。短期內5至10年,人工智能可以用在個性化醫療,搜集個人全面的健康數據,為治療提供全面的數據服務;另一方面,一些產品很可能會融入我們現在已經高度依賴的金融、能源、媒體、安全等領域。從50至100年的長階段來看,人工智能可能出現我們在科幻電影中,看到的人性化的人工智能技術。作為研究人工智能40年的專家,我認為,到2100年人性化的人工智能技術將會達到一個新的高度。
和人類一樣的機器人
《鳳凰周刊》:您的新書《技術奇點》正是討論了這兩個階段的影響,為什么叫“技術奇點”?
默里?沙納漢:聽說因為一部大陸電視劇,“奇點”一詞在中國很熱。“奇點”在物理學、數學中都有定義,在人類歷史中,“奇點”指的是,由于技術的迅速發展,人類社會的一切都出現了改變,生活在今天的我們將無法理解。
這本書就是討論,人工智能和神經技術兩個領域的技術進步,會加速這個“技術奇點”的到來。我們可以把目前的人工智能興起和應用,稱為人工智能的第一次浪潮,這個短期的發展是商業化、產業化的;而未來一個世紀可能會出現超人工智能(即有人類意識的人工智能),這個長期的發展,我們需要用一個更大的人類與機械關系視角去看待和討論。后者看起來離我們還很遙遠,但是從技術變革的歷史來看,也不過是一瞬。
《鳳凰周刊》:從現實技術的角度,人工智能擁有人類的意識和感情,這離我們還有多遠?您最近擔任科學顧問的科幻電影《機械姬》也有涉及這個主題。
默里?沙納漢:機器人是否會有以及是否應該有人類一樣的意識和感情,這個富有爭議的話題,已經在科學界和科幻界討論了半個世紀。早在1950年,大家熟知的“計算機之父”艾倫?圖靈,就曾經發表過學術文章《計算機與智能》,他預測到2000年,人們談論機器也能思考時,會是一件很正常的事情。雖然到2000年這個預言沒有實現,但是以上我們提到的人工智能的發展歷程,讓我們看到未來的可能性。
近年來,我把注意力更多地放在神經技術領域,目前我們正在小白鼠的大腦上進行實驗,看是否可以實現全腦仿真,與生物大腦不同,數字基質的大腦可以多次復制。數字基質的大腦還可以加速,這一點也與生物大腦不同。所以,如果我們能通過全腦仿真制造人類水平的人工智能,那么只要運算能力足夠強大,就可以制造一個以超高速運轉的人類水平的人工智能社區。如果人工智能不是按照仿生方法制造,而是從無到有創造的,這個道理也適用。事實上,只要是電腦程序,都可以復制或加速。而且,目前有很多仿生技術,也讓這個預言越來越有成真的希望。
記者:你認為,我們可以在多大程度上把人類的意識和生理功能放到機器人身上?
默里?沙納漢:讓機器人多大程度上擁有人類的思考和創造能力,以及是否要有性能力等,這是一個復雜的問題。涉及到社會層面的道德和責任,以及人類和機器人的關系。但我想指出的是,很多科幻小說和電影,把有意識的機器人最后妖魔化、邪惡化,說它會代替人類或者謀反人類等,這些都是因為人性對未來的恐懼而產生的想象,我們不要被這些想象帶得太深。事實上,機器人是安全的,很多風險是可控的。
一次突破就可能改變世界
《鳳凰周刊》:有時候,技術發展可以達到一個新的高度,但是人性本身或者說人類社會未必能接受或承受,所以會使得技術在一定程度上發展減慢停滯。你認為這是一件好事還是壞事?
默里?沙納漢:每一次技術革新的時候,我們的人性也被影響,面對未知和不確定,我們的一個自然反應是被吸引,同時又害怕。從短期來看,有時候放慢是好事,因為商業化總是會不自覺地推著一項技術和應用大肆向前。比如說,社交媒體已經在年輕人中非常流行,但我們的社會也需要一些時間去學習如何處理社交媒體。某些人會很關注別人的個人生活,但其實是沒有意義的。同理,人工智能也是一樣。但是從長期來看,我們不能因為人性本身的局限性,就完全阻止創造未來更多的可能性。
《鳳凰周刊》:按照您在書中說的,從長遠歷史來看,人類現在只是走在人工智能的開始階段。那么我們在研發人工智能的時候,我們到底在研發什么?一個機械奴隸,一個人類伙伴,還是有可能比人類還聰明的“老師”?
默里?沙納漢:這是個很有意思的問題。在未來40到50年,我們需要很嚴肅地思考和面對這個問題。現在我自己也沒有答案。
2013年4月,何搏飛辭去了一家美國上市公司中國區總經理的職務。他用幾個月的時間在中國尋找創業伙伴,結果卻讓人失望。當時,他已經做好打算,和這個團隊隨便聊半個小時,然后就飛去美國硅谷。
何搏飛推開門,看見幾個光著上身的年輕人坐在電腦前,整個屋子被各種大小的顯示屏圍繞。隨后,他和團隊CTO趙勇從下午兩點一直聊到了凌晨兩點,就決定加入擔任CEO。這家公司的名字叫做“格靈深瞳”。
格靈深瞳是一家計算機視覺和人工智能的技術公司,通過深度數據和機器學習算法讓計算機主動獲取三維視覺信息,并進行精確的實時智能分析。簡單來說,他們想讓計算機像人一樣,看見并理解這個世界。
“計算機視覺的技術已經存在了幾十年,我們想要做第一個將計算機視覺商業化的公司。”何搏飛說。切入智能安防監控領域是格靈深瞳選擇將計算機視覺商業化的第一步。今年6月,格靈深瞳獲得了紅杉資本數千萬美元的A輪融資。10月,其智能安防系統開始在國有四大銀行中的三大銀行進行試點。
格靈深瞳CTO趙勇創業之前在Google工作,是Google Glass的核心研發團隊成員之一。Google的工作原則是80/20,員工可以利用20%的時間自由創新。趙勇利用空閑的時間,重新開始研究自己在美國博士期間的研究方向―計算機視覺的人工智能。
計算機視覺過去主要建立在光學鏡頭采集的二維圖像上。光學鏡頭在生成圖像時,會丟失掉一個維度“深度”,只保留長度和寬度。當時人們覺得,通過二維圖像加上算法,就能夠讓計算機看懂世界。但趙勇和他布朗大學的博士導師并不同意這個觀點。他們堅持認為,計算機必須要通過三維信號才能夠看懂這個世界。因此,他們主張要增加“深度”這一維度的信息。“我們有兩只眼睛,就是為了判斷深度。人腦比計算機聰明多少倍?人腦進行判斷還需要三個維度的信息,計算機只通過兩個維度怎么能夠準確判斷?”何搏飛對《第一財經周刊》說。格靈深瞳的這一代智能安防系統上一共裝有3個鏡頭。一個是和普通安防系統一樣的RGB攝像頭,另外兩個用來發射和接收激光。激光發射鏡頭能夠在1/30秒的時間里發送36萬束激光,安防系統借助它們掃描出現實世界的三維立體圖像。
這3個鏡頭就相當于計算機的“眼睛”。格靈深瞳所做的,不僅是給計算機裝上“眼睛”,而且給計算機設置了一套“視網膜神經系統”,讓計算機能夠看懂“眼睛”里出現的東西。
借助機器學習算法,格靈深瞳的系統能夠同時分辨多人的運動軌跡和行動速度,并一一精確記錄。比如早上8時的北京地鐵站,人群正處于早高峰極端擁擠的狀態,格靈深瞳可以從中分辨出一個穿紅衣服的女孩,精確跟蹤她在人群中的行走軌跡。同時,格靈深瞳的系統還能夠監測人類肢體的運動幅度和速度,從而精確識別人們的姿勢和正在做的事情。
最初,趙勇和團隊已經解決了基本的技術問題,但還沒有想好商業化應該選擇的行業。辦公區域前的大黑板上密密麻麻地寫著80多條可能的商業化方向,包括安防、教育、醫療等等。這些是格靈深瞳團隊的工程師們一個晚上頭腦風暴之后的成果。
“你們這是科學家在實驗室里想問題的方式。”熟悉商業的何搏飛對趙勇說。“如果格靈深瞳的目標是成為全球最好的計算機視覺和人工智能公司,最需要的是什么?”“海量的數據。”趙勇說。
要獲得海量的數據,有兩種方法。第一個是像Google街景一樣,自己到各地去拍攝采集。另外一種,是通過現成的行業和設備實現。有沒有一個行業,已經在所有能夠采集數據的地方都裝上了攝像頭?趙勇和何搏飛同時想到了安防。安防是一個足夠大的市場。2013年中國安防市場的復合增長率為30%,銷售收入約為4000億元。美國的攝像頭與人口比是1:10,但在中國的北京和上海這個數字還只是1:50。
更難得的是,格靈深瞳的技術正可以解決安防領域目前面臨的兩個難題―看不見和找不到。一方面,一個安保人員往往要同時負責監看100多個攝像頭,隨便里面某個攝像頭拍攝到突發事件,當時就被監控人員發現的可能性非常小。另一方面,想要查找監控錄像中的某一段錄像也非常困難,就算快進,一段6個小時的視頻也得近1個小時才能看完。而格靈深瞳的智能計算機視覺系統可以很好地解決這些問題。
選擇安防領域作為商業化切入口之后,趙勇和何搏飛開始分析市場和客戶。他們發現安防系統在機場、火車站、廣場等場景應用最多。但場景一多,很多東西就無法控制。他們希望首先找到一個具有高度可復制性的場景,他們將目光投向了銀行。“中國的銀行幾乎都長得一模一樣。由于銀監會有嚴格的條例規定,它們的需求也都一樣。而且銀行本身底子厚,它們有很強的應用安防新技術的動力。”何搏飛告訴《第一財經周刊》。
一開始跟銀行談合作時,何搏飛和趙勇將重點放在了暴力事件的監控和報警上面。但他們發現實際情況并不如自己所想。暴力事件的概率極小,因此在很長一段時間內,格靈深瞳無法向銀行展示出產品優勢。
銀行的工作人員告訴他們,比起外部風險,銀行更頭疼的是內部風險。銀行一直有雙人加鈔的規定,一個人保管鑰匙,一個人保管密碼。但這條規定執行得并不好,就算排班排了兩人,也常出現一個人出去抽支煙,另一個人自己加鈔的情況。媒體曾經報道有顧客在ATM機中取出過假鈔,就是加鈔過程中出了問題。
何搏飛和趙勇將這點作為了產品的突破口。經過一段時間的研發,他們的安防監控已經能夠確保當ATM機的加鈔蓋子被打開的時候,必須有兩個人在場。甚至當一個人輸入密碼時,另一個人沒有轉過身,系統都能夠自動報警。銀行長久以來的難題被格靈深瞳解決了,它們開始接受格靈深瞳成為自己的安防合作伙伴。2013年12月,格靈深瞳進入全國網點最多的銀行中國農業銀行進行無人監控安防測試。2014年10月,格靈深瞳在國有四大銀行的三大銀行中進行大規模推廣試點,測試地區包括北京、重慶等省市。
摘要:汽車作為重要的交通出行工具,它的出現和應用極大程度的改善了人們的生活狀態,隨著經濟的發展,汽車行業的發展規模越來越大,對應的技術水平也越來越高,當前汽車產業的三大技術突破:車載網絡、無人駕駛技術以及新能源中無人駕駛技術主要針對現代人對汽車駕駛的新需求,它的研發和應用將徹底扭轉人們的駕駛習慣,改變駕車方式,并逐步促進車聯網的形成和完善。
關鍵詞:智能輔助駕駛系統;車聯網;技術應用
智能輔助駕駛系統目前在一些高端品牌的車輛中已經有所應用,例如寶馬、沃爾沃等,智能輔助駕駛系統的使用提高了行車的安全性,當駕駛員處于疲勞狀態下,或是執行了錯誤的操作、車況遭遇意外時,輔助系統能夠智能化控制車輛的行駛狀態,保護行車安全。車聯網則是車與人、車與路、車與車之間的信息共享,通過傳感設備,建立車輛與公眾網絡之間的聯系。在車聯網當中,通過傳感設備和信息共享,智能輔助駕駛系統就能夠準確獲知車輛的當前行駛狀態,并進行路徑規劃,進行智能操作,輔助駕駛員保持車況穩定。在下文當中,筆者將對智能輔助駕駛系統在車聯網中的應用進行分析,加快實現無人駕駛。
一、 智能輔助駕駛系統分析
(一) 算法技術
算法技術是智能輔助駕駛系統中最為重要的技術部分,要決定了智能輔助駕駛系統的智能化程度以及其能夠保障駕駛安全。國內相關企業所提出的算法技術比較受到認可的是上海趨視信息科技有限公司所推出的ADAS輔助駕駛系統算法版本,該算法模塊應用了趨視科技自動3D場景建模與深度學習算法模塊,對汽車行駛狀況的計算和分析較為準確,且應用比較簡單,即使是普通駕駛員也能進行操作。近年來,隨著科技的發展,國內很多的科技公司都相繼推出了智能輔助駕駛系統,其中的算法技術都是大同小異,理論上具有一定的操作性,但是實際應用價值較低,還需要進一步改進。國外MOBILEYE所推出的智能輔助駕駛系統雖然優越于國內技術,但也不盡完善,且售價非常昂貴。未來的智能駕駛輔助系統應當趨于平民化、實效化方向發展。
(二) 相機科技
趨視科技的輔助駕駛系統主要是用單個光學相機集成車輛行駛畫面,并將其傳輸至顯示界面,其技術優勢在于解決了傳感器攝影的數據融合問題,應用成本低,但可靠性比較高。
(三) 相機的自動標定技術
相機自動標定技術的研發節約了相機設備的安裝和調試成本,而且可以自動標定位置,發現并處置相機的意外移動,時刻保持趨視的完整性和正確性,保證智能駕駛輔助系統性能的應用。
在基于光學攝像機的智能輔助駕駛系統中,車輛狀態的物理數據,如車速,車輛本身相對于車道線的位置,以及車輛周圍的距離等,都是基于目標檢測的圖像內容,依據相機內部和外部的標定參數進行計算的。因此,校準參數的準確性是非常重要的。現有的智能輔助駕駛系統,通常使用一個特定的相機,所以相機的焦距等內部參數等是默認的,需要專業人員通過特殊工藝調整相機的外標定參數,如高度等,確保在使用狀態下的攝像機角度不會改變。這些高標準安裝要求必然會增加使用成本。但對于自動標定技術而言,通過檢測圖像中的目標和實際的物理尺寸對攝像機的內部參數和外部參數進行連續實時匹配,不僅不需要使用特定的攝像機,也可以用來改變攝像機的位置,并自動檢測相機角度,自動調整內部系統的算法。該技術使智能輔助駕駛系統被用來作為智能手機的一個移動應用程序,促進了智能駕駛輔助系統的推廣應用。
(四) 視頻技術
視頻技術是智能輔助駕駛系統中比較重要的一項技術,而且具有實際應用性,但是增加了視頻技術的智能駕駛輔助系統計算量非常大,國際主流廠商現在都需要使用專用芯片進行數據處理,而不是依賴于硬件性能,該技術的重點是開發高效的算法來解決計算問題。從這一點出發,應用樹結構專家系統能夠智能分析模塊數據,利用專家系統可以增加有針對性的深度學習,利用圖像特征減少深度學習的維度,得到學習統計的魯棒性,同時保持系統的邏輯和效率。目前上海趨勢科技已經在x86芯片平臺上實現了基于1080p的視頻智能輔助系統,現在正在移植到一般的Android和IOS移動平臺。
二、智能輔助駕駛系統在車聯網中的應用
ADAS輔助駕駛系統已經應用于寶馬、沃爾沃等高端車型,但國內汽車行業還沒有普及這一智能輔助駕駛系統。汽車行業的發展和改革需要一個漫長的周期,一項新技術,需要至少兩到三年的測試才能進入實際應用階段。到目前為止,國內還沒有人工智能(AI)與國內汽車廠商合作,完成對其汽車輔助駕駛系統的全面測試,更談不上真正意義上的商業化。
目前,上海趨視已經開始與國內領先的汽車制造商上汽通用開展了技術交流和技術評價等合作,這標志著智能輔助駕駛系統以及相關科技已經逐步的受到了國內汽車制造商的認可,科技公司和汽車廠商將會進入全方位研究測試階段,相信在不久之后,國內將出現大量的具有智能駕駛輔助系統的汽車。
智能輔助駕駛系統的應用必須遵循三個階段:商業試驗、商業應用、數據應用。人工智能產業仍處于商業實驗的第一階段。目前,市場上表現出了對人工智能技術的極度渴望,尤其對于智能輔助駕駛系統來說,但是人工智能技術的發展卻一直跟不上市場需求。主要問題是人工智能的準確性較低,不能提供一個完整、可靠的系統,存在錯誤和遺漏,對于汽車駕駛來說,這種漏洞是百分之百不允許出現的,以人臉識別為例,如果在駕駛過程中,智能輔助駕駛系統多次錯報和漏報人臉識別結果,就會帶來嚴重的安全隱患,也會使得用戶逐步對智能輔助駕駛系統失去信心。錯報、漏報是人工智能在試驗階段必須解決的問題。
而在國外,以色列MOBILEYE公司已經成功的將基于視覺的智能駕駛輔助系統應用在了一些高端車輛上,并受到了廠商的認可,這標志著國外汽車行業的智能駕駛輔助系統已經進入了商業應用階段。其它的視覺技術依舊等待創新,尤其是人臉識別技術,小范圍、近距離的人臉識別已經較為成熟和完善,正在準備進入商業應用階段,但是廣義上、大范圍的人臉識別技術還有待開發。
結束語:
未來,趨視科技以及其它人工智能企業將進一步加大技術研發力度,不斷完善智能輔助駕駛系統,優化算法技術、相機技術等相關技術,盡快實現車與車、車與路以及車與人之間的信息交互,提高信息計算和分析的準確性。此外,國內科技公司還需繼續對行為分析算法進行大規模升級,大大提高識別的精度,滿足更多行業的應用需求。
參考文獻:
[1]徐邦振; 湯一平; 蔡國寧.基于機器視覺的輕量級駕駛輔助系統[J].計算機科學,2015(S2):172-173.
[2]方景輝; 徐偉明; 朱曉峰; 王春新.基于物聯網與三維可視化技術的變電站智能輔助控制系統的研究與應用[J].電氣自動化,2012(03);248-249.
[3]余濤; 俞立中; 王錚; 嚴網林.自主式智能系統及其在汽車安全輔助駕駛中的應用[j].公路交通科技,2012(06):143-144.
“機器人替代我演奏還需多長時間?”第一次參與科技跨界的小提琴演奏家呂思清問。
“谷歌已經通過深度學習,模仿一位大畫家的畫風。現在谷歌的畫作已經達到普通人難以區分的程度。”有人告訴他。
“音樂表演是最高層次的精神活動,機器人短期內替代不了音樂家。”另外的人反駁說。
“剛才你們談了幾種機器人的應用場景,我覺得還少了一塊音樂教育。”呂思清說,“機器人、人工智能可能會提供一種因材施教的新教學途徑。”
這是優必選科技在召開的主題為“機器人,不止于此”的會,請一些跨界嘉賓來交流,主要是公布其人工智能戰略布局。
COO養CTO
用機器人為人們提供包括教育在內的多元服務,正是優必選科技創始人周劍的夢想。8年前,周劍帶著十幾個小伙子走上智能機器人的創業路。他內心的最大夢想是做出能夠普及的人形服務機器人。
剛創業時,周劍遇到的最大瓶頸是,國內連組裝一臺小的伺服舵機都非常難,而國外伺服舵機又非常昂貴。
接下來的4年中,在耗盡在商場上打拼的半億元積蓄,克服技術難關后,周劍他們研發出“最重要的是既便宜又高質量”的伺服舵機技術。
這個伺服舵機讓他有信心在2012年成立優必選科技,投身機器人和人工智能平臺。
周劍認定了人形機器人。“手機App這類數據采集手段,收集到的數據其實是非常非常少的,它很難全面定義一個人。”他說,“我曾反復強調,我們需要主動的數據收集。如果有像ASIMO那樣的人形機器人進入家庭,像父母家人一樣,與我們朝夕相處,通過語音、視覺平臺主動收集我們的數據,為我們勾畫出完整畫像,再配合BAT公司的云端合作,這才能形成嚴謹的邏輯閉環。”
周劍也與亞馬遜團隊討論了很久。在此之前,亞馬遜推出了智能音箱Echo。“我們后來達成了一致,認為未來人機交互的中心一定是人形機器人。它就是你的家庭成員,與你可以坦誠交流,這不是一個音箱可以做到的”。
要做出人形機器人是非常難的。全球一些大型公司和實驗室已探索多年。它需要大規模資金投入,需要高尖技術人才,還需要整合大量資源。
“我對自己的定位是要落地,所以才有了兩條腿走路的戰略。”周劍說。
“左腿要賺錢”。周劍預計優必選2017年的銷售收入將在10億到15億元之間。他對實現這個收入有信心。“近幾年我們一直在高速增長。2014年收入190萬元,2015年5000萬元,今年是3億元。”周劍說。
2017年,優必選的收入來自與“大塊頭”的合作。這是周劍的信心來源之一。2017年1月,優必選和亞馬遜將在CES展上共同一款機器人。“亞馬遜和我們都認為這是個廣闊的市場”。既然亞馬遜Echo音箱賣了幾百萬臺,機器人銷售也不會弱,這將是優必選科技收入增長來源之一。
優必選的第二個收入增長來自于IP產品。要知道IP產品是影視界、體育界大亨的重要收入來源。在這個智能時代,過去靜態的IP衍生品變成活靈活現、可以互動的機器人將是個趨勢。這方面的銷量也被看好。
2016年,蘋果主動找到優必選,它對優必選的機器人很感興趣。之后,優必選和蘋果合作的JIMU STEAM教育機器人就登陸全球部分Apple Store零售店。STEAM機器人是一種既能組裝、又能編程的機器人,它對學生在多方面都有影響,也順應美國總統奧巴馬發起的“編程一小時”運動。優必選正在形成一套課程,要逐步進入校內外教育市場。
周劍認為,這類產品要讓孩子使用到真正的機器人技術,如伺服舵機、控制及各種傳感器。而且價格不能太貴,才能真正落地。
“從2016年推出到全球布局,這可能也是2017年我們比較大的收入來源。”周劍說。按照布局,北美2017年會有4000家店,歐洲2000家店,國內有2000家店。
周劍還布局To B的Cruzr機器人,目標是在銀行、商超、海關、安防監控場景下的應用,已經拿到多個訂單。
“我們做的每個東西都是有原因的。左腿基于商業化走路,賺到錢后投入到‘右腿的未來技術研發上’,積累更多東西。”周劍笑談,“我們是COO來養CTO。”
機器人的“軀干與智能”
周劍所說的未來技術,是為他的“人形服務機器人”積蓄資源。
最近,悉尼大學教授陶大程即將加入優必選,擔任優必選“人工智能首席科學家”。“人工智能領域都知道陶教授。”周劍說。陶是歐洲科學院院士、澳大利亞科學最高榮譽尤里卡獎獲得者。2016年,陶大程團隊獲得了包括NIST PaSC、ActivityNet等權威賽事的冠軍。
“我們每天獲取的信息70%、80%以上來自視覺。因此,視覺研究我們主要抓在自己的手上。”周劍說。
“未來非常關鍵的技術是模型壓縮。我們要把大模型變成小模型,實現在人形機器人本地的計算,而不依賴于云計算,這樣也能降低人形機器人的電能開銷。” 陶大程對《IT經理世界》說。同時,視覺研究還包括基于視頻的視覺理解、單/多態的情緒識別以及視頻的室內定位導航和避障等。
“有了這些技術,當你跟機器人Alpha相遇說:你好,Alpha,并同時把手伸過去時,Alpha能理解這是要跟他握手,然后會把手伸過來。”陶教授形象地介紹。
優必選同時聘請清華大學趙明國教授擔任其“人形機器人首席科學家”,在機器人運動控制上展開合作。“趙教授幾乎是全中國屈指可數的堅持20年只做雙足人形機器人的人士之一。”周劍說。他領導的聯合實驗室將繼續專注于雙足機器人運動控制技術研究。
記者的一位朋友,從小受過專業圍棋的訓練,長大后又從事過很長一段時間程序員的工作,對于圍棋的奧妙深有體會,因此在李世石與AlphaGo的人機大戰開始前,他曾拍著胸脯說,對戰的結果一定是5∶0,人類輕松獲勝。可是事情的結果呢?事與愿違。通過此事,記者的這位朋友對于人工智能(AI)有了更新的認識。
不可否認,人工智能給人們帶來了無窮無盡的想象空間。人工智能到底能給人類社會的發展帶來多大影響?人們的工作和生活是否將從此產生質的飛躍?現在人工智能技術的發展到底進入到什么樣的階段?11月1日―2日,一年一度的C&C用戶論壇暨iEXPO 2016在日本東京舉行。我們或許能從這次大會一窺人工智能領域的新動向。
NEC主辦的C&C用戶論壇暨iEXPO大會今年已經是第20屆,“Orchestrating a brighter world”(協同創造更美好的世界)成了本屆大會最響亮的口號。NEC希望借助在人工智能和物聯網(IoT)方面的諸多技術和產品創新,更好地肩負起構建安心、安全、高效、公平社會的責任。
改變已經發生
“人工智能市場的增長已經超出了人們的想象。”NEC全球總裁兼首席執行官新野隆在大會的主旨演講中開宗明義,“人口增長帶來的巨大壓力,新型城鎮化發展引發的各類社會問題,人與人、人與物之間廣泛而復雜的連接……為了更好地解決這些問題,我們必須更充分、有效地利用ICT的創新。”
人類社會正面臨一場新的數字化革命,而云計算、人工智能、可視化、大數據、安全、物聯網等技術將成為支撐這一變革的技術驅動力。作為一個傳統的ICT廠商,NEC將如何應對這一變革,揚長避短?NEC中國總代表兼日電(中國)有限公司總裁吉田直樹表示:“我們的優勢主要體現在具有很強的綜合實力,憑借深厚的技術積淀,以及長年服務大型企業級客戶累積的經驗,可以為行業用戶提供全面的針對其應用需求量身訂制的解決方案。”
新野隆特別強調了NEC的三大技術優勢――人工智能、連接性、網絡安全。NEC在這些技術領域的許多創新之作都可以在本次大會的展示區看到。據NEC的工作人員介紹,往屆大會的展示區通常是按技術和解決方案的類別來劃分,而今年有了很大的改變,以助力數字化變革為核心,突破了技術間的界限,以藍色、紅色和綠色三種顏色來劃分展區:藍色代表“AI和IoT引發的數字化革命”,主要展示NEC在AI和IoT領域的最新技術成果;紅色代表“加快數字化變革的先進技術”,主要包括大數據、網絡安全、SDN和云平臺;綠色代表“利用AI和IoT加速構建更美好的世界”,主要展示NEC的AI和IoT在制造、流通、通信、醫療、市場營銷、安全、智慧城市等領域的成功應用。
在展區中,讓記者印象最深刻的還是NEC在網絡空間安全方面的技術創新和應用。人臉識別可以說是NEC最擅長的一項技術,不僅識別速度快,而且準確率極高,已經在機場、海關,以及涉及公共安全的很多應用場合得到了廣泛部署。在人臉識別技術展臺前,記者做了一次親身體驗。負責演示的技術人員現場用平板電腦給記者拍攝了一張照片,并上傳到后臺的數據庫中,然后記者走到攝像頭前,NEC的人臉識別系統幾乎是瞬間就認出了記者。
其實,人臉識別在今天來看已經不是什么新鮮事,許多中國廠商也在這方面有所建樹。“在人臉識別方面,我們會將其他廠商不做或做不到,但又是NEC所擅長的技術和解決方案帶入中國市場,凸顯自身的差異化競爭優勢。”吉田直樹介紹說,“我剛剛參加了在北京舉行的2016中國國際社會公共安全產品博覽會,目的是進一步了解中國客戶的需求,以及中國同類廠商的動態。雖然很多廠商都可以提供針對特定個體的人臉識別解決方案,但是目前在數百人中快速找到特定的人還是一個難題,而這正是NEC的強項。”
NEC還將人工智能技術用于網絡安全領域,探測未知的網絡安全威脅。NEC的自主學習型系統異常監測技術,可以在攻擊發生后到產生實際危害前的這一時間段內,及時發現系統異常并報警,從而盡量避免造成實際的安全損害。NEC已經將這套融入了人工智能的系統異常監測技術用于公司內部的16萬臺設備上,更好地保證了公司業務的正常運行。
人工智能在行動
在本次大會上,記者還看到NEC將人工智能用于健康和醫療、物流,以及智能工廠等諸多領域。比如,NEC將人工智能與可穿戴設備相結合,用于工廠的設備管理、業務流程控制,以及遠程監控等,可以及時發現生產中的問題,持續提升生產效率。在物流行業,即使是一個新手,他只要通過一副智能眼鏡和一塊智能手表,就可以根據貨運單的要求,準確找到貨物存放的貨架,然后將貨物運送到指定的地點。這同樣得益于NEC的人工智能技術與可穿戴設備相結合的解決方案。
其實,早在半個多世紀前,NEC就已經開始在可視化、分析、控制等領域展開了研究,尤其是在聲音和圖像識別、語義解析、機器學習、風險預測、控制和優化等方面取得了非常多的成果,并廣泛應用于多個商業場景。這為今天NEC構建先進的人工智能技術群奠定了堅實的基礎。在可視化、分析、控制和引導三大領域,NEC擁有多項世界領先或唯一的技術創新成果。
舉例來說,在人工智能方面,應用了NEC世界最高精度的面部識別技術的出入境系統、可以察覺因肉眼無法發現的微小狀態變化導致故障的飛機故障預警系統、基于機器學習技術的可精確預測訂貨需求的零售訂貨系統等,已經廣泛應用于創造安心、安全環境的公共安全領域、大型社會基礎設施的監控、強化企業營銷、提升業務效率等方面。NEC希望通過人與人工智能技術的協調,最終實現生活的智慧化。
就在本次大會召開前,NEC剛剛了幾款人工智能和物聯網解決方案。NEC the WISE NeoFace Watch Image Data Mining可以快速對圖像數據進行分析。據稱這是目前世界上最快速、準確率最高的人臉識別解決方案。另外,像Auto Responses Solution可以更加準確地理解文本文件中上下文的意思。NEC the WISE IoT Platform提供了一個驗證平臺,讓那些有關物聯網應用方面的創意可以更快速地轉化為商業化的產品。新野隆介紹說,NEC還與大阪大學、東京大學等高校合作開發用于人工智能方面的低功耗智能芯片等。NEC與通用集團合作推出的IoT方案已經在某些領域付諸實施。
上文提及的NEC最新推出的產品名前面都有“NEC the WISE”的字樣,其實這是NEC今年正式的人工智能技術群的統一品牌名稱。在本次大會的現場,“NEC the WISE”的標志無處不在。NEC the WISE表明,NEC將協調人與AI技術,為創造安心、安全、高效、公平的社會做出貢獻。
人工智能的核心之一是數據。人工智能技術的應用必須與大數據有機地結合一起。吉田直樹表示:“收集數據只是第一步,更重要地是如何對數據進行有效的分析和預測。從技術的角度講,人工智能的推進要從兩方面入手,一是基礎技術研究,二是與實際應用相結合研發出針對不同行業和應用場景的解決方案。NEC在全球各地的研究院將主要精力放在人工智能基礎技術研究方面。NEC與各國當地的合作伙伴,以及各行業的用戶協作,共同開發適合不同行業需求的人工智能解決方案。”
NEC the WISE所代表的人工智能產品是NEC物聯網整體解決方案的一部分,它還要與其他相關軟硬件,以及行業應用需求緊密結合。未來,NEC會把物聯網作為一個獨立業務計算收入。
本次大會傳遞的信息十分明確:NEC將積極推進人工智能技術的開發與應用,并以大數據、物聯網、安全、云計算等為核心,提供創新的解決方案,支持企業的數字化變革。本次大會也可以看作是NEC全面向人工智能和物聯網領域進軍的誓師大會。它為NEC未來十年甚至更長遠的發展定下了基調――協同創造更加美好的世界。
差異化和本地化是關鍵
數字化轉型、人工智能、物聯網等都是當下最熱門的話題,也是所有ICT廠商共同關注的焦點。對于NEC來說,挑戰在于如何做出差異化,如何在中國市場上更好地實現本地化發展。
吉田直樹講述了NEC的原則:第一,人無我有,做別人沒有的技術和產品,比如在大數據方面,很多廠商都可以做大數據的收集和處理,那么NEC就把重點放在大數據的分析和預測上;第二,在注重自主創新的基礎上,加強同合作伙伴之間的協作創新,比如NEC與農業有機栽培方面的專業公司合作,利用ICT的創新改進西紅柿的栽培,推而廣之,就是將NEC在構建大型基礎設施方面的經驗與特定行業或應用領域專業公司的技術特長相結合,取長補短,實現理想的經濟效益和社會效益。
結合NEC在中國的業務發展,上面的兩條原則具體體現為,根據中國用戶和市場的實際情況,選擇最適合的合作和發展模式,提供差異化的產品和解決方案,尋找屬于NEC的藍海市場。
根據中國的具體情況,NEC將當前的發展重點放在了安全、流通和零售,以及智慧城市等領域。安全包括與政府相關的公共安全,以及企業內部的安全兩個方面。NEC的策略是,積極與本地的伙伴合作,在一些自己擁有優勢的細分安全領域進行投入。NEC在流通和零售行業的業務前景十分廣闊。隨著電子商務的快速發展,物流可能是一個新的瓶頸。NEC有針對物流行業的融入了人工智能和物聯網技術的解決方案。另外,在便利店的管理方面,NEC也有先進的解決方案,比如很多便利用店的POS機就是NEC的產品。POS機是信息匯聚的一個源頭,以后針對POS機的數據進行智能分析也是NEC的強項。
>> 控制人工智能?你也可以 人工智能可以猜心了? Affectiva:讓人工智能“讀懂”你 人工智能可以講一個大故事 人工智能讓你成為藝術家 人工智能,比你想象的更快 人工智能很重要,鮑勃?迪倫也很重要 地平線機器人:基于人工智能,讓硬件也擁有大腦 虐電腦?被電腦虐?《金戈鐵馬》人工智能等你驗證 EmoSPARK:一個為了讓你快樂而生的人工智能魔塊 寂寞沒人理睬?微軟要開發人工智能和你聊天 你所恐懼的“人工智能”到底是什么? 人工智能為什么搶不走你的飯碗 你看到的人工智能可能是假的 “人工智能”之父 人工智能 AI人工智能 人工智能 Icon 擁抱人工智能 人工智能時代 常見問題解答 當前所在位置:中國 > 管理 > 控制人工智能?你也可以 控制人工智能?你也可以 雜志之家、寫作服務和雜志訂閱支持對公帳戶付款!安全又可靠! document.write("作者: 王杰夫")
申明:本網站內容僅用于學術交流,如有侵犯您的權益,請及時告知我們,本站將立即刪除有關內容。 >> 創始人戴文淵曾是百度鳳巢系統的總架構師。在構建鳳巢時,他便嘗試簡化搭建機器學習模型的工程。
康執璽用鼠標從屏幕邊上拖來一些長方形的模塊,并把它們用線依次連接起來,一個人工智能機器學習的模型就做好了,前后用了不到一刻鐘。根據模型初始數據的不同,這個模型可以有不同的功能,例如識別信用卡詐騙,或是檢測垃圾郵件。
“如果沒有先知平臺,搭建一個識別信用卡詐騙模型可能需要花費數據團隊幾個月的時間,”康執璽告訴《第一財經周刊》,“普通技術員工經過一個月的訓練,差不多能熟練使用先知平臺上的模型。”康執璽是第四范式先知平臺的產品負責人,為了讓普通技術人員也可以輕松搭建機器學習模型,他和團隊已經不間斷工作了一年之久。
第四范式是一個提供AI機器學習模型的通用型平臺。該公司的算法工程團隊開發了一系列的基礎設施組件,以此組成了大規模分布式機器學習框架(General Distributed Brain Technology,GDBT)。康執璽稱,未來兩年,普通技術人員可以在“先知平臺”上做出類似AlphaGo復雜度的人工智能,“這里面的難點不是AlphaGo本身,難點是如何讓普通人也可以做出AlphaGo”。
目前市面上比較流行的計算框架,例如Hadoop、Sparkd更適合執行傳統的數據倉庫技術(ETL)任務。而第四范式“先知平臺”的框架由C++語言編寫,可以在單機、MPI、Yarn、Mesos等多個分布式環境運行,例如很多企業在計算時所用的硬件資源并不相同,GDBT可以針對不同的硬件資源、不同的算法場景,就調度、計算模式、機器學習算法部件的抽象等做優化。
成立兩年多來,第四范式相繼拿到紅杉資本和創新工場數千萬元人民幣的天使輪和A輪融資。雖然還沒實現自負盈虧,但是創始人戴文淵稱,公司已經開始有了營收。
AI for Everyone,這既是第四范式的公司目標,也是戴文淵2014年決定從華為諾亞方舟實驗室離職創業的原因。在這之前,他最常問自己的問題是“人工智能要創造更大的價值,要通過什么方式去做”。
過去十幾年,人工智能在學術領域一直處于發展瓶頸期。直到2007年左右,還在讀碩士的戴文淵和一些同行感覺到機器學習在理論上取得了很大進展,這時候就需要海量數據來推動人工智能的發展。戴文淵認為,這個機會很可能發生在互聯網公司,于是2009年他進入百度工作,參與搭建百度鳳巢。這是一個全新的廣告銷售系統,百度鳳巢系統背后的人工智能需要識別信息、廣告,以及智能地匹配不同的權重因素。
作為百度鳳巢的總架構師,戴文淵需要當一個全才―不只要懂機器學習的原理,還要精通數學統計、編程、分布式計算,以及要有很強的架構能力。“不僅要設計算法,還要懂業務”,戴文淵為此專門用半年的時間學習網絡營銷,只有這樣才能明白人工智能可以應用在哪些方面。百度鳳巢用了三四百人,花了三四年才做出來,投入的成本之大,甚至影響到了百度公司的業績,為此李彥宏還出面向股東做過解釋。不過,如今百度鳳巢已經成為拉動百度利潤增長的核心,人工智能終于有了產業效果。
對于戴文淵來說,百度鳳巢的成功意味著AI for Someone已經實現,更關鍵的是,他從中看到了AI for Everyone的機會。但是讓人工智能服務每個技術人員的目標還有重重困難,當前,絕大多數的AI技術都集中在Google、Facebook、百度等互聯網公司巨頭手中,作為商業公司的它們不可能將AI核心技術完全開放出來。比如Google,雖然開源了深度學習系統TensorFlow,但是這套系統上手難度高,另一方面,與Google自家的服務深度綁定,對于不想依附Google的中小企業并不友好。
因此戴文淵認為,與其等待大公司的“施舍”,不如做一家人工智能的企業服務公司,專門為那些養不起大型AI團隊的公司提供AI服務。
在構建百度鳳巢時,戴文淵開始嘗試簡化搭建機器學習模型的工程。工作之余,他動手寫了一堆機器學習的組件,并找來一個實習生,讓后者通過這些機器學習組件搭建一個全新的模型。短短一個月,這名實習生做出了一個機器學習的模型。這個結果讓戴文淵很振奮,如果一個實習生一個月就能做出來一個機器學習模型,那招來10個實習生,經過培訓,一年就能服務120個客戶。事實上,這也成為第四范式最初的運作模式。
然而這種模式很快就遇到了問題。首先是人才的短缺,戴文淵意識到這相當于把人工智能公司做成勞動密集型公司,但人工智能的人才資源嚴重不足。另一方面,由于出售的產品是一套機器學習的模型,買家只能使用卻無法修改,一旦出了問題或者遇到需要調整的地方,還需要第四范式再次提供服務。
因此在最初階段,金融客戶只愿意把一些非核心的的項目外包給第四范式。對于大型金融機構來說,風險控制是業務核心,交給第三方公司去做相當于命脈交到其他人手里,這是它們無法接受的。
了解到實際的客戶需求后,戴文淵意識到第四范式還是要做一個通用型平臺,“就像在賣建造機器學習模型的釘子和錘子”。在這種模式下,第四范式只負責提供機器學習的工具,工具用來做什么就與他們無關了。一個金融機構購買先知平臺后開發了十幾套機器學習模型,至于有沒有用來開發風控模型這些核心產品,“這就是商業機密了,我們也不清楚”,戴文淵說。
雖然看起來產品形態更加簡單了,開發難度反而比之前大了好幾倍。從產品上看,釘子和錘子因為要給普通人用,所以耐用性要好,比如對于建模時所輸入的數據不能挑剔,即使數據有空缺、格式不對,也不可以宕機。從內核上看,考慮到工具將來的迭展,底層代碼要從頭開始寫,原來戴文淵在百度鳳巢時寫的組件不夠用了。
徐立有著典型的人工智能科學家背景,在香港中文大學就讀博士期間,其與導師賈佳亞教授研發的圖像去模糊技術將圖像清晰度提升了100倍,被視為是全球圖像處理的一大突破。以研發實力聞名的商湯也一度被“學術氣息”所標簽化。徐立認為,人工智能還遠未走向技術同質化的時代,若技術上不構成領先性和差異化,將難以跟上行業變化。對于人工智能的商業落地,商湯則自有一套驅動行業的經營哲學。
21CBR:智能視頻目前是“人工智能+安防”的行業熱點,你在去年也提過類似觀點,這塊的市場存量有多大?
徐立:安防一直是國家大力發展的領域,也是十三五規劃的重點行業。從政府投入來看,今年也要投入2000-3000億。傳統安防領域的最大廠商,去年營業額在300多億。所以,這塊目前有足夠的市場空間。
今年的視頻業務和去年的人臉識別有些類似。去年,業內都在嘗試和落地人臉識別的具體應用,到今年進入相對成熟期,業務增長很快。今年,智能視頻業務也在各地展開試點,整體發展正處在一個大的行業機會點上。
視頻業務何時落地,核心問題在于明確產品的商用標準。工業界的一個標準紅線是評估產品是否超過所謂人眼的準確率,這也是人臉識別逐漸商用化的原因。但是視頻內容的分析和人相比效果上還有差距。目前全球每天有2.5億只安防攝像頭在記錄,視頻數據輸入達到一定規模,但在智能處理上還很欠缺,而核心算法的突破將成為最關鍵的落地因素之一。
21CBR:商湯切入安防領域有哪些布局,如何構建自己的智能視頻生態鏈?
徐立:商湯在安防領域的產品體系分為兩類:一類是成熟的業務系統,需要基于客戶方的具體業務邏輯進行設計,比如怎樣做多視頻協調,如何做人像處理等,代表產品是SenseFace人臉布控系統和SenseVideo視頻結構化系統,另一類是業務系統中的核心算法模塊,包括動靜態比對服務器、人群分析服務器和結構化服務器等,儆諳嘍員曜薊的產品。
舉例來說,我們在視頻結構化系統上做了很大突破。以往的視頻結構化系統只能通過身高、性別等屬性來查詢視頻信息,SenseVideo實現了自然語言的信息查詢。我們做了1.3萬人的案例測試,總共生成了9000多個自然語言構成的關鍵詞。對于辦案人員來說,通過自然語言來描述罪犯、完成案件信息的視頻檢索是更常見的業務邏輯,也比根據屬性搜索來得更加精準,未來將是一個新的業務形態。
目前商湯在安防市場相較領先,前十大安防廠商一半以上是我們客戶,商湯為其提供標準化模塊和業務子系統。同時,我們也在國內重點城市建立本地化業務。去年,商湯的智能視頻業務(Intelligent Video Analytics)已占公司整體業務的40%,今年這一勢頭依舊良好。
21CBR:比起發展客戶,商湯似乎更擅長行業聯盟,商湯的市場開拓邏輯怎樣的?
徐立:首先,無論賣什么產品,最后都要接觸到甲方。但是,我一直認為,B2B企業如果要起量、要規模化,產品一定是相對標準化的。如果每次銷售的方案都是定制化服務,企業的ROI(投資回報率)就會比較低。相反,集成商則可以將商湯與電信方、施工方等等連接起來,在各地做出標桿性的項目,再用標準化的形式去鋪開。
這里的標準化不是一蹴而就的,而是來自產品和項目的逐次迭代。比如前面提到的比對服務器,再往上可能是一套帶著攝像頭的子系統,最后則是一整套的訓練部署平臺。通過深入行業、做細項目,商湯不斷把標準化的范圍擴大,并聚合客戶的需求從而形成共有需求,最終完成標準化產品的打磨過程。
因此,商湯一直把自己定位成一個技術公司,而不是集成商公司。商湯能做的是集中力量攻破核心算法和技術。這個技術不是單點的、閉門造車的技術,而是以打通上下游的客戶需求、構建產業鏈條來實現的。就像英特爾不直接向終端用戶銷售芯片,而是通過上下游的合作伙伴,比如主板廠商、主機廠商等實現筆記本電腦的銷售,但用戶仍然了解產品背后有英特爾領先的芯片技術,這也是商湯所追求的:做行業的賦能者。
21CBR:業界普遍在談AI同行業的深度結合,各家公司從技術表現來看也大致相當。對此你怎么看?
徐立:很多人覺得,深度學習已經形成開源生態,技術沒那么重要了,打通行業才是關鍵。這里面有一個重要前提:深度學習是否已經成熟、不會再變化了。然而,學術界目前有關深度學習的文章大部分都是工程實踐型的,新的實驗結果不斷前人做出的理論解釋,指導下一代工業級應用的技術原理有待被歸納總結,人工智能距離成熟的“黑盒”還差得很遠。
例如,從近年來物體識別競賽的結果看,識別準確率在2013-2017年之間提升了300%,基本與摩爾定律吻合。也就是說,在某些垂直領域,算法的演進已經進入摩爾定律時代,不是既有算法的變化,本質上是重新設計出一套新的引擎算法,從而形成巨大的提升空間。未來三五年間,深度學習還將迎來革命性的變化,現有的算法如果不趕上,就會被淘汰。