中國 AI 正在全球不斷提升影響力。
文 | 劉琳
自 2006 年深度學(xué)習(xí)算法被提出、2012 年開始大數(shù)據(jù)爆發(fā)式增長以來,人工智能領(lǐng)域的各項技術(shù)分支也在不斷發(fā)展,人工智能相關(guān)的產(chǎn)業(yè)化落地方案和商業(yè)化模式逐漸清晰,人工智能的細(xì)分領(lǐng)域技術(shù)分支的代表性企業(yè)及其競爭格局也逐漸形成。
近日,中國科學(xué)院大數(shù)據(jù)挖掘與知識管理重點實驗室發(fā)布了《 2019 年人工智能發(fā)展白皮書》, 對人工智能關(guān)鍵技術(shù)(計算機視覺技術(shù)、自然語言處理技術(shù)、跨媒體分析推理技術(shù)、智適應(yīng)學(xué)習(xí)技術(shù)、群體智能技術(shù)、自主無人系統(tǒng)技術(shù)、智能芯片技術(shù)、腦機接口技術(shù)等)、人工智能典型應(yīng)用產(chǎn)業(yè)與場景(安防、金融、零售、交通、教育、醫(yī)療、制造、健康等)做出了梳理。
并根據(jù)調(diào)研數(shù)據(jù)重點分析了人工智能各個細(xì)分領(lǐng)域的關(guān)鍵技術(shù)和產(chǎn)業(yè)應(yīng)用,并推出全球人工智能企業(yè) TOP20 榜單,微軟、谷歌、臉書、百度位列排行榜前列。
白皮書顯示,中國 AI 正在全球不斷提升影響力,成為主導(dǎo) AI 創(chuàng)新落地的有力競爭者。在人工智能向各行各業(yè)滲透的過程中,主要的人工智能技術(shù)還掌握在大型科技公司,而人工智能開放創(chuàng)新平臺讓 AI 普惠到更多公司和用戶,對于推動全行業(yè)的發(fā)展、加速人工智能社會的建設(shè)都具有重要推動價值。
1、人工智能關(guān)鍵技術(shù)不斷取得突破
1、計算機視覺技術(shù)
計算機視覺(Computer Vision)是一門研究如何使機器“看”的科學(xué), 更進一步地說,是指用攝影機和電腦代替人眼對目標(biāo)進行識別、跟蹤和 測量的科學(xué)。近幾年計算機視覺技術(shù)實現(xiàn)了快速發(fā)展,其主要學(xué)術(shù)原因是 2015 年基于深度學(xué)習(xí)的計算機視覺算法在 ImageNet 數(shù)據(jù)庫上的識別準(zhǔn)確率首次超過人類,同年 Google 也開源了自己的深度學(xué)習(xí)算法。計算機視覺系統(tǒng)的主要功能有圖像獲取、預(yù)處理、特征提取、檢測/分割和高級處理。
2、自然語言處理技術(shù)
自然語言處理(Natural Language Processing)是一門通過建立形式化的計算模型來分析、理解和處理自然語言的學(xué)科,也是一門橫跨語言學(xué)、計算 機科學(xué)、數(shù)學(xué)等領(lǐng)域的交叉學(xué)科。自然語言處理,是指用計算機對自然語言的形、音、義等信息進行處理,即對字、詞、句、篇章的輸入、輸出、識別、 分析、理解、生成等的操作和加工。自然語言處理的具體表現(xiàn)形式包括機器翻譯、文本摘要、文本分類、文本校對、信息抽取、語音合成、語音識別等??梢哉f,自然語言處理就是要計算機理解自然語言,自然語言處理機制涉及 兩個流程,包括自然語言理解和自然語言生成,自然語言理解是讓計算機把輸入的語言變成有意思的符號和關(guān)系,然后根據(jù)目的再處理;自然語言生成則是把計算機數(shù)據(jù)轉(zhuǎn)化為自然語言。實現(xiàn)人機間的信息交流,是人工智能界、計算機科學(xué)和語言學(xué)界所共同關(guān)注的重要問題。
? ? ? ?
? ? ? ?自然語言處理的研究可以分為基礎(chǔ)性研究和應(yīng)用性研究兩部分,語音和文本是兩類研究的重點?;A(chǔ)性研究主要涉及語言學(xué)、數(shù)學(xué)、計算機學(xué)科等領(lǐng)域,相對應(yīng)的技術(shù)有消除歧義、語法形式化等。應(yīng)用性研究則主要集中在一些應(yīng)用自然語言處理的領(lǐng)域,例如信息檢索、文本分類、機器翻譯等。由于我國基礎(chǔ)理論即 機器翻譯的研究起步較早,且基礎(chǔ)理論研究是任何應(yīng)用的理論基礎(chǔ),所以語法、句法、語義分析等基礎(chǔ)性研究歷來是研究的重點,而且隨著互聯(lián)網(wǎng)網(wǎng)絡(luò)技術(shù)的 發(fā)展,智能檢索類研究近年來也逐漸升溫。近年來,計算機視覺在產(chǎn)業(yè)界和學(xué)術(shù)界不斷取得突破,取得代表性成果的組織有谷歌、阿里、百度、搜狗、科大訊 飛等公司,清華大學(xué)、Allen 人工智能研究所等高校/研究所以及其他多種類型的組織或個人。
? ? ? ?
3、跨媒體分析推理技術(shù)
以往的媒體信息處理模型往往只針對某種單一形式的媒體數(shù)據(jù)進行推理分析,比如圖像識別、語音識別、文本識別等,而越來越多的任務(wù)需要像人一樣能夠協(xié) 同綜合處理多種形式(文本、音頻、視頻、圖像等)的信息,這就是跨媒體分析與推理。跨媒體是一個比較廣義的概念,既表現(xiàn)為包括網(wǎng)絡(luò)文本、圖像、音頻、 視頻等復(fù)雜媒體對象混合并存,又表現(xiàn)為各類媒體對象形成復(fù)雜的關(guān)聯(lián)關(guān)系和組織結(jié)構(gòu),還表現(xiàn)在具有不同模態(tài)的媒體對象跨越媒介或平臺高度交互融合。
通過“跨媒體”能從各自的側(cè)面表達(dá)相同的語義信息,能比單一的媒體對象及其特定的模態(tài)更加全面地反映特定的內(nèi)容信息。相同的內(nèi)容信息跨越各類媒體對象交叉?zhèn)鞑ヅc整合,只有對這些多模態(tài)媒體進行融合分析,才能盡可能全面、正確地理解這種跨媒體綜合體所蘊涵的內(nèi)容信息??缑襟w分析推理技術(shù)主要包括跨媒體檢索、跨媒體推理、跨媒體存儲幾個研究范疇,可應(yīng)用于網(wǎng)絡(luò)內(nèi)容監(jiān)管、輿情分析、信息檢索、智慧醫(yī)療、自動駕駛、智能穿戴設(shè)備等場景。
4、智適應(yīng)學(xué)習(xí)技術(shù)
作為教育領(lǐng)域最具突破性的技術(shù),智適應(yīng)學(xué)習(xí)技術(shù) ( Intelligent Adaptive? Learning) 模擬了老師對學(xué)生一對一教學(xué)的過程,賦予了學(xué)習(xí)系統(tǒng)個性化教學(xué)的能力和傳統(tǒng)千人一面的教學(xué)方式相比,智適應(yīng)學(xué)習(xí)系統(tǒng)帶給了學(xué)生個性化的學(xué)習(xí)體 驗,提升了學(xué)生的學(xué)習(xí)投入度和學(xué)習(xí)效率。采用了智適應(yīng)學(xué)習(xí)技術(shù)的學(xué)習(xí)系統(tǒng)能夠針對學(xué)生的具體學(xué)習(xí)情況提供個性化學(xué)習(xí)解決方案,包括定位學(xué)生的知識漏洞、 持續(xù)性地評估學(xué)生的學(xué)習(xí)能力水平和知識狀態(tài)、實時動態(tài)提供個性化學(xué)習(xí)內(nèi)容。智適應(yīng)學(xué)習(xí)技術(shù)讓教育領(lǐng)域一直困擾的質(zhì) 量、成本、可獲取性三大矛盾因素變成了歷史。
智適應(yīng)學(xué)習(xí)技術(shù)體系包括知識狀態(tài)診斷、能力水平評測和學(xué)習(xí)內(nèi)容推薦等。知識狀態(tài)診斷技術(shù)是指通過少量試題,在較短時間精準(zhǔn)診斷出學(xué)生的知識漏洞,這一技術(shù)較常用的算法是知識空間理論。能力水平評測技術(shù)是指評測出學(xué)生的知識掌握情況,分析出學(xué)生得到提升的學(xué)習(xí)能力、學(xué)習(xí)思維和學(xué)習(xí)方法,這一技術(shù)較常用的算法是項目反應(yīng)理論、貝葉斯知識追蹤。學(xué)習(xí)內(nèi)容推薦技術(shù)是指依據(jù)學(xué)生學(xué)習(xí)情況,推薦合適的學(xué)習(xí)內(nèi)容,這一技術(shù)較常用的算法是機器學(xué)習(xí)算法,該算法以學(xué)生的所有信息為輸入,輸出是學(xué)生接下來需要學(xué)習(xí)的內(nèi)容,達(dá)到最大化學(xué)習(xí)效率的目的。
? ? ? ?目前在全球已有一億多學(xué)生在使用智適應(yīng)學(xué)習(xí)系統(tǒng),覆蓋了各個年齡段,從小學(xué)、初中、高中,到高等教育、職業(yè)教育和成人教育,已應(yīng)用到文、理、工、醫(yī)等不同學(xué)科領(lǐng)域。
5、 群體智能技術(shù)
群體智能(collective intelligence)也稱集體智能、群智。群體智能是一種共享的智能,是集結(jié)眾人的意見進而轉(zhuǎn)化為決策的一種過程,用來對單一個體做出隨機性決策的風(fēng)險。對群體智能的研究,實際上可以被認(rèn)為是一個屬于社會學(xué)、商業(yè)、計算機科學(xué)、大眾傳媒和大眾行為的分支學(xué)科,研究從夸克層次到細(xì)菌、植物、動物以及人類社會層次的群體行為的一個領(lǐng)域。
群體智能最早源于對以螞蟻、蜜蜂等為代表的社會性昆蟲的群體行為的研究,自1991年意大利學(xué)者Dorigo提出蟻群優(yōu)化(Ant Colony Optimization, ACO)理論開始,群體智能作為一個理論被正式提出,并逐漸吸引了大批學(xué)者的關(guān)注,從而掀起了研究高潮。1995年,Kennedy 等學(xué)者提出粒子群優(yōu)化算法(Particle Swarm Optimization, PSO),此后群體智能研究迅速展開。目前群體智能的研究主要包括智能蟻群算法和粒子群算法,智能蟻群算法主要包括蟻群優(yōu)化算法、蟻群聚類算法和多機器人協(xié)同合作系統(tǒng)。其中,蟻群優(yōu)化算法和粒子群優(yōu)化算法在求解實際問題時應(yīng)用最為廣泛。
6、 自主無人系統(tǒng)技術(shù)
自主無人系統(tǒng)是能夠通過先進的技術(shù)進行操作或管理而不需要人工干預(yù)的系統(tǒng),是由機械、控制、計算機、通信、材料等多種技術(shù)融合而成的復(fù)雜系統(tǒng)。自主無人系統(tǒng)可應(yīng)用到無人駕駛車輛、無人機、服務(wù)型機器人、空間機器人、海洋機器人、無人車間、智能工廠等場景中,并實現(xiàn)降本增效的作用。
7、 智能芯片技術(shù)
近年來我國學(xué)術(shù)界和產(chǎn)業(yè)界都加大了對芯片技術(shù)的研發(fā)力度,國內(nèi)智能計算芯片技術(shù)不斷取得新的成果。一些基于傳統(tǒng)計算架構(gòu)的芯片和各種軟硬件加速方案相結(jié)合,在一些人工智能應(yīng)用場景下都取得了巨大成功,但由于市場需求的多樣性,很難有任何單一的設(shè)計和方法能夠很好地適用于各類情況。因此,學(xué)術(shù)界和產(chǎn)業(yè)界涌現(xiàn)出多種專門針對人工智能應(yīng)用的新穎設(shè)計和方法,覆蓋了從半導(dǎo)體材料、器件、電路到體系結(jié)構(gòu)的各個層次。
? ? ??
8、 腦機接口技術(shù)
腦機接口(Brain-Computer Interface,BCI)是在人或動物腦(或者腦細(xì)胞的培養(yǎng)物)與外部設(shè)備間建立的直接連接通路。通過單向腦機接口技術(shù),計算機可以接受腦傳來的命令,或者發(fā)送信號到腦,但不能同時發(fā)送和接收信號。而雙向腦機接口允許腦和外部設(shè)備間的雙向信息交換。2013年,自美國首次宣布啟動“腦計劃”以來,歐洲、日本、韓國等陸續(xù)參與“腦科技”競賽項目,據(jù)已公開數(shù)據(jù)表明,全球在腦機接口相關(guān)領(lǐng)域的研發(fā)支持已經(jīng)超過200億美元。
2、人工智能賦能產(chǎn)業(yè)與應(yīng)用場景
在人工智能技術(shù)向各行各業(yè)滲透的過程中,不同產(chǎn)品由于使用場景復(fù)雜度的不同、技術(shù)發(fā)展水平的不同,而導(dǎo)致其成熟度也不同。比如,教育和音響行業(yè)的核心環(huán)節(jié)已有成熟產(chǎn)品,技術(shù)成熟度和用戶心理接受度都較高;個人助理和醫(yī)療行業(yè)在核心環(huán)節(jié)已出現(xiàn)試驗性的初步成熟產(chǎn)品,但由于場景復(fù)雜,涉及個人隱私和生命健康問題,當(dāng)前用戶心理接受度較低;自動駕駛和咨詢行業(yè)在核心環(huán)節(jié)則尚未出現(xiàn)成熟產(chǎn)品,無論是技術(shù)方面還是用戶心理接受度方面都還沒有達(dá)到足夠成熟的程度。
在人工智能技術(shù)向各行各業(yè)滲透的過程中,安防和金融行業(yè)的人工智能使用率最高,零售、交通、教育、醫(yī)療、制造、健康行業(yè)次之。安防行業(yè)一直圍繞著視頻監(jiān)控在不斷改革升級,在政府的大力支持下,我國已建成集數(shù)據(jù)傳輸和控制與一體的自動化監(jiān)控平臺,隨著計算機視覺技術(shù)出現(xiàn)突破,安防行業(yè)便迅速向智能化前進。金融行業(yè)擁有良好的數(shù)據(jù)積累,在自動化的工作流與相關(guān)技術(shù)的運用上有不錯的成效,組織機構(gòu)的戰(zhàn)略與文化也較為先進,因此人工智能技術(shù)也得到了良好的應(yīng)用。
零售行業(yè)在數(shù)據(jù)積累、人工智能應(yīng)用基礎(chǔ)、組織結(jié)構(gòu)方面均有一定基礎(chǔ)。交通行業(yè)則在組織基礎(chǔ)與人工智能應(yīng)用基礎(chǔ)上優(yōu)勢明顯,并已經(jīng)開始布局自動駕駛技術(shù)。教育行業(yè)的數(shù)據(jù)積累雖然薄弱,但行業(yè)整體對人工智能持重點關(guān)注的態(tài)度,同時也開始在實際業(yè)務(wù)中結(jié)合人工智能技術(shù),因此未來發(fā)展可期。醫(yī)療與健康行業(yè)擁有多年的醫(yī)療數(shù)據(jù)積累與流程化的數(shù)據(jù)使用過程,因此在數(shù)據(jù)與技術(shù)基礎(chǔ)上有著很強的優(yōu)勢。制造行業(yè)雖然在組織機構(gòu)上的基礎(chǔ)相對薄弱,但擁有大量高質(zhì)量的數(shù)據(jù)積累以及自動化的工作流,為人工智能技術(shù)的介入提供了良好的技術(shù)鋪墊。
安防:安保、警務(wù)、治安、人車流監(jiān)控等場景全面應(yīng)用 。
金融:以智能風(fēng)控為主,同時滲透支付、理賠、投研投顧等場景 。
? ? ? ?
零售:人工智能提升零售全流程運行效率,優(yōu)化消費者體驗 。
? ? ?
交通:人工智能應(yīng)用到擁堵分析、路線優(yōu)化、車輛調(diào)度、駕駛輔助等場景,有效改善交通問題 。
教育:由表及里,人工智能技術(shù)逐漸深入學(xué)習(xí)環(huán)節(jié)。
醫(yī)療:從影像分析、輔助診療、健康管理等角度做好醫(yī)患助手。
制造:助力生產(chǎn)制造優(yōu)化,減少重復(fù)勞動,實現(xiàn)智能制造。
健康:降低健康管理成本,實現(xiàn)交互革命,增強人類功能。
3、人工智能開放創(chuàng)新平臺逐步建立
雖然人工智能技術(shù)不斷向眾多行業(yè)和商業(yè)場景滲透,但目前人工智能的能力仍然不是像云計算一樣可以隨取隨用的通用資源,主要的人工智能技術(shù)還掌握在大型科技公司和互聯(lián)網(wǎng)巨頭的手里,若能讓人工智能普惠到更多公司和用戶,人工智能社會的建設(shè)才會明顯提速。在政府和大型公司的領(lǐng)跑下,越來越多的人工智能開放平臺開始涌現(xiàn)出來。
2017-2018年,科技部等多部門經(jīng)充分調(diào)研和論證,確定了五大國家新一代人工智能開放創(chuàng)新平臺:分別依托百度、阿里云、騰訊、科大訊飛公司、商湯集團,建設(shè)自動駕駛、城市大腦、醫(yī)療影像、智能語音、智能視覺人工智能開放創(chuàng)新平臺,并由科技部、發(fā)改委、財政部、教育部、工信部、中科院等15個部門構(gòu)成的新一代人工智能發(fā)展規(guī)劃推進辦公室來推進項目、基地、人才的統(tǒng)籌布局。
來源:中國科學(xué)院大數(shù)據(jù)挖掘與知識管理重點實驗室《2019 年人工智能發(fā)展白皮書》、雷鋒網(wǎng)