文|曾響鈴
來源|科技向令說(xiangling0815)
除了“技術炫”,人工智能的另一大特征是“開會多”,然而,專門針對“深度學習”的開發者大會卻少之又少。
究其原因,搞“技術”的AI企業,在深度學習這件事上反而被“技術門檻”所鉗制。不過,這對于一直深耕技術的AI企業來說,也就成了優勢,例如擁有國內唯一開源深度學習平臺PaddlePaddle的百度。
4月23日,百度就與深度學習技術及應用國家工程實驗室在北京聯合主辦了首屆(2019)WAVE SUMMIT深度學習開發者峰會。
不開則已,開則“有料”。
百度高級副總裁、深度學習技術及應用國家工程實驗室主任王海峰面對大批深度學習開發者,拋出“深度學習推動人工智能進入工業大生產階段,深度學習框架是智能時代的操作系統”的言論。
這句話有兩個關鍵詞:AI的發展要進入一個新的階段—“工業大生產”,而這個新的階段深度學習框架將起到關鍵作用—“操作系統”。
深度學習在AI體系內的關鍵價值,使得它已經成為AI深入發展的技術堡壘,也成為各平臺轉型AI企業角逐AI時代的核心內容。WAVE SUMMIT 2019百度試圖率先舉起深度學習的旗幟,通過站位“智能時代的操作系統”擴大AI競爭優勢的意圖,而王海峰敢這么說,百度已有充足的自信。
AI“工業大生產”臨門一腳,深度學習成為“躍遷”力量
AI深入發展的表現之一,是提出“為什么AI”的企業正逐漸減少,而提出“為什么不AI”的企業群體逐漸龐大。
當最傳統的制造業等產業也開始把“智能+”掛在嘴邊時,多樣化場景反過來需要平臺型AI企業在各種層次上進行開放:
有些開發者只需要借助外部技術完善自家產品,例如智慧客廳場景中,OTT TV的智能互動(語音、圖像等)需求,或互金平臺、游戲平臺等的智能客服需求,這些是目前多數AI企業在技術上所能達到的層次;
有些開發者則因為業務的特殊性,需要借助外部更基礎的深度學習框架能力,如構建農業病蟲害治理應用,這種AI技術呈現出“高門檻”的特征,能夠提供開發者生態的少之又少。
很明顯,越是高通用性的領域,AI技術越是只需要到達“表層”;越是低通用性的領域,AI技術的介入越需要切入“深層”。
問題來了,語音、人臉可以依靠通用性快速普及,那些需求越來越旺盛的AI個案應用怎么辦?——AI全面發展必然要解決“個性化”與“規模化”的矛盾問題。
王海峰提到的深度學習的通用性特點,以及深度學習框架及平臺的發展,正在推動人工智能標準化、自動化和模塊化,進入工業大生產階段,就是在針對這個問題。其解決方式本質是通過深度學習框架,讓AI在“深層”也實現“框架能力”的通用性(對應地,AI已經在“表層”實現“應用能力”的通用性),如此,專屬領域的AI應用也可以被“批量生產”。
由此,也不難理解PaddlePaddle同時在峰會上發布的中文名字“飛槳”——AI發展到了這個階段,深度學習已經急速劃動AI潮流、幫助AI躍遷進入“工業大生產”時代。
這里通過百度PaddlePaddle平臺案例來理解。
在林業管理中,紅脂大小蠹是非常嚴重的害蟲災害,過去,林業管理系統需要通過人力監測來預報和治理蟲情,現在,北京林業大學在百度PaddlePaddle支撐下研發的智能蟲情監測系統,30分鐘可完成原本研究院一周的觀察工作量,大大提升了災害防治的效率;
此外,百度曾基于PaddlePaddle深度學習能力完成了一個“AI控煙”監測項目,數萬張吸煙動作圖片進行了43次深度學習模型訓練,能夠以較高的準確率完成吸煙人群的識別。
這些案例與人臉識別不同,都具備極強的“個案”色彩,其需求是獨特而少有的,傳統AI平臺在應用層并不能提供對應的解決方案,開發者必須借助深度學習平臺自主開發、訓練和部署應用。
反過來,這些“個案”的生產實際上建立在框架能力的通用性基礎之上,圖像識別的深度學習還能以同樣的姿勢生產出更多有關“識別”的個性化AI應用。
如果類比人類歷史上的工業發展變革,深度學習框架實際上也提供了“標準化、自動化、模塊化”的生產平臺,只不過生產的東西變成了“AI應用”。
搶占智能時代的“操作系統”,百度PaddlePaddle豎起中國深度學旗幟
按王海峰的觀點,深度學習框架下接芯片、大型計算機系統,上承各種業務模型、行業應用,是“智能時代的操作系統”。
這也可以理解為,AI深度學習之戰,就是搶占智能時代“操作系統”的戰爭,而“操作系統”的價值不言而喻,這也給了“技術派”百度更充分的底氣。
至少在現階段,憑借深度學習領域的三個“唯一”,百度PaddlePaddle已樹立中國深度學習的一面旗幟,打造了一套運行良好的“操作系統”。
1、唯一具備深度學習所需的前置技術積淀
解決問題(AI應用),與教一個人如何“解決問題”(深度學習自構建AI應用)有著維度上的不同。
深度學習的平臺服務能力,不是找上一批人、搭上一個班子就能快速上馬的,它需要的長時間的深厚積淀,如同飛機發動機的研發只能依靠技術沉淀而沒有“捷徑”一樣,“財大氣粗”短期投入突破的可能性并不大。
百度的深度學習歷史可以追溯到2013年設立全球首個深度學習研究院,這比大多數AI企業切入AI領域還要早。
2016年PaddlePaddle正式開源,形成了目前國內唯一開源開放、功能完備的深度學習框架,之后的2017年,百度又在國家發改委批復下牽頭籌建了國內唯一的深度學習技術及應用國家工程實驗室。
其結果,是百度形成了難以被追趕的深度學習積累,不論是率先開源還是籌建實驗室,在國內不存在對手。其他提供深度學習開發服務的AI企業,其發展階段還遠未到能夠開源或被官方認可的程度。
2、唯一具備開發、訓練、部署無死角系統化能力
深度學習框架這個“操作系統”也有自己的構成:開發、訓練與部署的“三步走”標準姿勢。
用大白話說,先針對要處理的數據構建一套合適的模型(可自己設置也可以利用深度學習平臺提供的現成案例),把這個模型到平臺上跑很多次教會它識別數據,最后將成型的“產品”裝載到硬件或云端,最終一個AI應用被生產出來。
這三個環節缺一不可,模型建立不佳,大方向失誤;訓練能力不足,要么教出“差學生”,要么教出“壞學生”;部署時掉鏈子,好好的成型“產品”被搭載的平臺拖累甚至難以執行。
深度學習框架是“取整函數”,任何一個環節缺失或能力不足就讓“操作系統”的價值大打折扣。
上文百度PaddlePaddle所謂唯一“功能完備”的深度學習框架,其意義也在于此——“無死角”的系統化能力。
例如,在開發環節,PaddlePaddle已開源60多個經過真實業務場景驗證的官方模型,涵蓋視覺、NLP、推薦等AI核心技術領域。其中,新發布的視頻識別工具包,能為開發者解決視頻理解、視頻編輯、視頻生成等一系列任務,可實現一鍵式的高效配置來做訓練和預測;
在訓練環節,PaddlePaddle對原有大規模分布式訓練(即多個芯片一起進行計算)進行了升級,一方面提升協同訓練的效率,另一方面大幅度放松訓練所需求的軟件、硬件、帶寬環境(可理解為各種學習條件下都能“好好學習”);
在部署環節,PaddlePaddle的軟硬一體能力起到了重要作用,例如有針對多硬件支持的底層加速庫和推理引擎Paddle Mobile和新發布的Paddle Serving。這可以理解為老師除了教會學生知識,還給予他們快速適應環境、實踐上手的能力。
馬化騰曾經當面承認李彥宏的百度在人工智能方面走的更靠前,而騰訊則要落后不少。回過頭來看,這樣唯一全套齊備的深度學習平臺出現在百度并不意外。
3、唯一具備技術理解基礎上的細節優化能力
通用AI應用十分強調易用性,拿來就用,接通就能放到實際業務中。
事實上,包括AI在內,所有涉及信息化的技術越是“深度”,也越要談“易用性”。可讀性、兼容性、開發效率都是操作層面的注意點,如同Windows操作系統一直在優化其體驗一樣,開發者也講“體驗”。
而在沒有深度理解之前是無法談細節的,越到細節優化層面,PaddlePaddle越難以看到對手。
例如,與“標準化、自動化和模塊化”相對應,PaddlePaddle提供了包括遷移學習、強化學習、自動化網絡結構設計、訓練可視化工具、彈性深度學習計算等在內的工具組件。此外,Paddle還提供零基礎定制化訓練和服務平臺EasyDL和一站式開發平臺AI Studio。
工具化、平臺化降低了深度學習的門檻,AI“工業大生產”將擁有更多參與者。PaddlePaddle深度學習框架作為智能時代的“操作系統”,也能讓“用戶”快速上手、實現生產力目標。
飛輪效應典型適用,深度學習平臺一步贏步步贏
操作系統的市場開拓是“飛輪效應”的典型案例——起步慢,一旦超過臨界點就會越跑越快,競爭優勢持續擴大,Windows、Android皆是如此。
深度學習框架這個“操作系統”也不例外。
如前文所言,積累和沉淀需要漫長的過程,但行業“旗幟”一旦打起來,就難以再被追趕,正如PaddlePaddle。
其原因與普通操作系統一樣,達到一定規模后,市場與生態的延展由“主動式”變為“吸附式”,持續做好產品新用戶就會源源不斷被“吸附”進來,競爭對手搶占市場的代價變得更高昂。
這次峰會上,百度宣布其一站式開發平臺AI Studio將為開發者提供總計1億元的免費算力,包括“一人一卡”模式下大量派發V100訓練卡(實體的訓練單元),以及遠程集群模式下AI Studio云端算力使用。
此外,高校方面,百度提供有深度學習師資培訓,通過專項基金以及AI Studio教育版,培育深度學習領域的高校人才;企業方面,百度之前黃埔學院基礎之上,還發布“AI快車道”計劃以及AI技術的生態扶持計劃,預計深度扶植1000家AI企業;開發者社區方面,百度則通過課程和賽事激發開發者群體的創新精神。
有外部開發者群體不斷被吸附,也有核心平臺積極為開發者破除AI應用開發的桎梏,百度深度學習生態的發展已經進入滾雪球模式。
從整個市場競爭格局而言,“旗幟效應”下的“圈地運動”將只有一個玩家——不用“跑馬”圈地,旗幟照耀之處,皆是權屬土地。
*此內容為【科技向令說】原創,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產品經理等多家創投、科技網站年度十大作者;
2虎嘯獎高級評委;
3作家:【移動互聯網+ 新常態下的商業機會】等暢銷書作者;
4《商界》《商界評論》《銷售與市場》等近十家雜志撰稿人;
5鈦媒體、界面、虎嗅等近80家專欄作者;
6“腦藝人”(腦力手藝人)概念提出者,現演變為“自媒體”,成為一個行業。
7現為“今日頭條問答簽約作者”、多家科技智能公司傳播顧問。
- 該帖于 2019/4/26 16:31:00 被修改過