★ 中國自動化學會專家咨詢工作委員會孫柏林
1 引言
世界主要國家競相將發展數字經濟作為搶抓新一輪科技革命和產業變革新機遇的重要抓手,紛紛制定并出臺戰略和規劃,加快構建國家競爭新優勢,搶占國際競爭制高點。日前,國務院印發《“十四五”數字經濟發展規劃》,提出要發展戰略性新興產業,推動互聯網+、大數據、人工智能等產業深度融合。
在此背景下,百度研究院預測:2021年,數字人、虛擬人將大批量出現,生命科學成為AI應用新領地,各行各業加速轉型。隨著人工智能、虛擬現實等技術的發展和融合,數字人正在以高度擬人化進入生產、生活各個領域,彰顯數字經濟發展的“新動能”,為Z世代新消費市場以及產業數字化轉型構筑巨大的想象空間和應用前景。
2021年,稱得上的是元宇宙元年。而隨著元宇宙概念的大熱,虛擬數字人的發展獲得飛躍式提升,從外觀數字化逐漸深入到行為的交互化、思想的智能化。以虛擬主播、虛擬偶像、虛擬員工等為代表的數字人進入大眾視野,并以多元的姿態在影視、游戲、傳媒等眾多領域大放異彩。
許多專家認為,“未來在生活和工作當中,必將有大規模的數字人與人類共存。”數字人具有哪些特征?其市場價值、產業生態和發展趨勢如何?諸多業內人士力圖從認知、生態、能力、實踐和展望等維度展現數字人發展的未來圖景。
新一輪科技革命和產業變革加速發展,大數據、云計算、人工智能、區塊鏈等數字技術向經濟社會各領域廣泛滲透,引發生產生活方式和產業生態的革命性變革。數字經濟帶來了新的就業形態、新的創業形態和新的經濟生態,為老百姓獲取收入提供了新方式、新途徑。而數字人則賦予數字經濟發展的“新動能”,值得人們關注。
2 什么是數字人?
所謂虛擬數字人,就是由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產物。
“數字人”的概念于2011年在美國首次提出,隨后開始在全球流行并一躍成為最炙手可熱的詞語之一。2018年,在新華社新媒體上出現了由AI合成的虛擬主播,國家電網山東濟南營業廳也出現了數字人——“國網機器人”。2019年,百度與浦發銀行聯手打造的國內首個虛擬數字員工“小浦”正式上崗,虛擬數字人開始出現在越來越多的地方。
根據百度網“科普中國·科學百科”的解釋,狹義的數字人,是利用信息科學對人體進行虛擬仿真,是一種信息科學與生命科學融合的產物,最終目的是建立多學科、多層次的數字模型,達到對人體從微觀到宏觀的精確模擬。廣義的數字人,是指數字技術在人體解剖、物理、生理及智能的各個層次、各個階段的滲透。
從最小的范疇說起,虛擬數字人具備三方面的特征:一是擁有類人的外觀,具有特定的相貌、性別和性格;二是擁有類人的行為,能夠用語言、面部表情和肢體動作進行“自我”表達;三是擁有類人的思考方式,能夠識別外部環境,并與人交流互動。
數字人既包括基于某個知名人物生成的孿生型數字人,也可以是完全憑空設計的原生型數字人。綜合來看,就是具備四方面的能力,即形象能力、感知能力、表達能力和娛樂互動能力。如果我們下次再看到有新的虛擬數字人,就可以結合這些特征和能力來判斷這個虛擬數字人的可信度。
在當下數字技術手段的支撐下,虛擬數字人已經可以模擬真人的會話、表情和動作,在各種不同的場景進行交互應用。
目前,已有大量虛擬數字人在各種場景中頻繁上崗亮相,替代了一部分真人的簡單重復的工作,中央電視總臺在2022年北京冬奧會期間上線了原生型的手語虛擬主播,“央視頻”平臺在今年的兩會報道中推出了基于真人評論員的孿生型數字人,抖音、騰訊、阿里等其他互聯網平臺也紛紛推出各自的數字人形象,虛擬數字人技術正在迎來發展熱潮。
3 數字人的原理
了解了什么是數字人,接下來要搞清楚數字人的原理,它到底是怎么說話、互動的,是背后有真人在操控,還是完全通過技術生成?顯而易見,數字人能否走遠,核心在技術。數字人的誕生發展和AI人工智能密不可分,想了解數字人的運作原理,首先要知道數字人的通用系統框架。數字人系統一般情況下由人物形象、語音生成、動畫生成、音視頻合成顯示、交互等5個模塊構成,其中交互模塊為擴展項,根據其有無,可將數字人分為交互型數字人和非交互型數字人。
“數字人的擬人化以及生產制作的自動化程度,反映數字人系統整體進化和發展水平,代表著數字技術綜合運用能力和成熟度體現。”商湯科技數字空間事業群數字文娛事業部總經理欒青認為,根據“擬人化”和“自動化”兩個維度,可以將數字人分成L1~L5五個等級。
其中,人們將L4和L5等級的數字人統稱為AI數字人。專家說,只有達到L4級別及以上的數字人,才能真正地走入千行百業,在消費和產業領域大放異彩。
從產品技術趨勢看,未來數字人都將是由AI驅動內容生成,多模態AI技術是核心;交互會越來越智能;形象越來越逼真,由擬人到類人到同人。從行業應用趨勢看,未來幾年將是人類員工與數字人并存的方式,AI輔助/支持人類進行工作。從產業落地趨勢看,AI數字人將以平臺工具的形式輸出,賦能各行各業;在數字人平臺型公司以外,數字人運營賽道也有可能產出獨角獸。從整體發展趨勢看,未來另一高潛力賽道將是演藝型數字人。
“數字人的下一步,將逐步聚焦到‘數字人的大腦’的升級,大腦的智能性提升,能夠幫助虛擬人拓展到更多開放領域,為社會帶來更多價值。”專家說,當前數字人的發展面表現為多種類型百花齊放,各個賽道在技術上快速迭代升級,但數字人的“大腦”仍存在很大升級空間,如情緒理解、智能問答、自然交互等。
未來,隨著人工智能等相關技術的不斷精進及其在數字人形象生成、動作驅動、語言交互等環節應用的不斷深入,數字人將更智能化和平民化。
4 數字人的應用案例
2021年以來,虛擬“數字人”市場快速升溫,多家科技企業發布了“數字人”相關產品。近日,百度發布國內首個可在App內互動的超寫實“數字人”。此前,阿里巴巴開發的超寫實“數字人”AYAYI正式“入職”阿里,成為天貓超級品牌日的數字主理人;OPPO發布的基于虛擬人多模態交互的手機智能助手,可實現與用戶在多個場景生態下實時交互;B站專門為虛擬主播開設分區。不知不覺,虛擬“數字人”已經開始走進我們的生活。
數字人應用目前可大致分為三種類型:真人分身、模擬員工和虛擬偶像。
數字/虛擬人是多維度人工智能的組合技術,也是數字經濟發展下各場景效率提升、體驗提升的重要支撐能力,應用場景將越來越普遍。下面舉例闡述。
4.1 擬人化應用
近日,由北京理工大學參與研制的全國首個高精度京劇數字人“梅蘭芳孿生數字人”在北京亮相。該項目以京劇大師梅蘭芳先生26歲時的模樣為原型,對其進行復現。項目由中央戲劇學院、北京理工大學共同發起,騰訊公司提供技術支持,受到“北京高校卓越青年科學家”計劃資助,并得到了多家單位和梅蘭芳先生家人及弟子的大力支持。
江蘇衛視2022跨年演唱會的虛擬人“鄧麗君”;
2021年萬科總部最佳新人獎的數字人員工“崔筱盼”;
冬奧會期間,央視主播王冰冰的虛擬形象在《冰冰帶你說冬奧》專屬H5中亮相;
北京冬奧會中,具“AI虛擬與教練系統”雙重身份的“觀君”,輔助運動員徐夢桃、齊廣璞雙雙摘得金牌,成為超級自然虛擬人對運動員輔助訓練的成功案例。在這屆冬奧會期間,多款虛擬數字人亮相,包括由百度智能云提供支持的央視新聞AI手語虛擬主播,騰旭3D手語數智人“聆語”,以及AI虛擬氣象主播“馮小殊”等,虛擬數字人也因此更多地被大眾知道。
2022年“兩會”期間,央視“冠察兩會”欄目中,超仿真主持人王冠就是真實主持人王冠的數字人“分身”。
例如,虛擬VUP洛天依,是國內最早的虛擬歌手,連續幾年登上央視;虛擬KOL翎Ling,中央電視臺推出的臺網互動少年團選秀節目《上線吧!華彩少年》中的虛擬學員;明星虛擬形象千喵,天貓首位品牌代言人易烊千璽的虛擬人物。
4.2 企業應用
“過往行業普遍認為,AIbeing的應用場景很窄,基本就是娛樂、偶像、代言人等領域。其實并非如此。包括企業數字化轉型、體育、金融等各類垂直領域的應用場景,AIbeing同樣可以實現落地。”有專家強調,小冰在誕生之初,就更關注人工智能在擬合人類情商維度的發展,強調人工智能情商而非任務完成在人機交互中的基礎價值。
小冰進入金融、汽車、內容生產、體育等垂直領域,聚焦于人工智能和人類的協同,并非硬性地替代人類,而是將AI交互體驗滲透到行業關鍵應用場景中,滿足行業對AI應用和數字化轉型的各種業務創新需求,推動“有溫度的”產業化升級。
商湯AI數字人面向全行業提供企業級解決方案,目前已落地金融網點、手機銀行、購物中心、黨建展廳、政務前臺、品牌營銷、智慧車艙等多個場景。廣州新塘的永旺夢樂城與商湯聯合打造了超寫實型AI數字人“小糖”,其在客服咨詢、導航導購等方面,回答準確率超過90%。初步估計,在客服環節至少能夠幫助商場節約50%以上的人力成本。
科大訊飛AI虛擬人也已經在媒體、金融、醫療、教育、文旅、文娛、企業、政務等多場景應用,虛擬人使用企業和開發者超過上千家。基于訊飛開放平臺生態,未來該交互平臺將發揮更大的數字經濟價值。
事實上,AI虛擬數字人此前就已經在各個領域被應用,包括虛擬KOL、虛擬偶像、明星虛擬形象、虛擬模特、虛擬主播。數字人更重要的是重塑商業模式,元宇宙賦予了虛擬數字人新的活力,數字人連同數字藏品一起,背后是元宇宙統領下的生產力與生產關系的脈搏,帶來新一輪的IP孵化與商業化,數字人及其人機交互有望得到變革與重塑。
此外,還有企業機構數字人,應用于企業展廳、運營商營業廳、銀行網點、線下零售店等,包括:(1)智能迎賓,通過AI虛擬客服,實現“面對面”的問題咨詢,覆蓋天氣、交通等技能,也可支持客戶自定義業務問題,如樓盤信息等;(2)企業宣傳,一體機具備廣告機功能,在展廳支持多個企業和產品視頻廣告片的循環播放,展示企業和品牌形象;(3)信息發布,通過后臺系統針對多臺機器進行信息通知發布,觸達各級網點。
4.3 公共場所數字人
公共場所:車站、機場、地鐵站、旅游景點、電教館、博物館等。
(1)咨詢導引,為客戶面對面提供業務咨詢辦理服務,如附近交通、火車、航班查詢、地鐵車次查詢、景點介紹、實時天氣情況、博物館展品介紹等。
(2)廣告宣傳,通過視頻、文字等形式,展示車站、旅游景點等信息,傳播公共服務理念和人文精神。
4.4 政府機構數字人
政府機構:辦事窗口、政務大廳、宣傳部門等。
(1)智能客服,一體機通過AI智能客服“面對面”進行業務咨詢,提供業務辦理流程、辦理材料、辦理問題的回答,顯著降低辦事人員的接待量,提高服務效率、提升整體的服務接待體驗;
(2)黨政宣傳,通過在辦事大廳、政務大廳放置一體機,進行黨政建設信息宣傳、最新政務動態、黨政宣傳片的視頻宣傳。
4.5 教育界數字人
通過對與數字人相關的國內外文獻及案例的梳理與分析,發現數字人的發展給教育帶來了極大的沖擊。數字人的發展給教育帶來了機會,如虛擬教師構建個性化學習環境、虛擬學生實現像人一樣學習和思考、虛擬學伴陪伴并指導用戶學習、虛擬教育主播可以面向社會群體傳播知識、虛擬導游可以提高社會教育的趣味性和靈活性,激活了教育元宇宙的生態。
國內學者對教育數字人的研究尚少,基于此,筆者在對教育數字人的概念、特征與技術分析的基礎上,從學校教育型數字人和社會教育型數字人兩方面剖析其應用及國內外相關案例,對教育數字人所面臨的挑戰及實施建議進行了分析總結,以期為數字人促進教育發展提供思路,推動數字人與教育的初步融合發展邁向創新發展階段。
4.5.1 元宇宙場域下的教育數字人概念與特征
教育數字人是教育元宇宙的敲門磚,其教育性、交互性、虛擬性和擬人性對增強教育元宇宙的真實感、互動感和沉浸感具有非常重要的作用。
(1)教育數字人的概念
教育元宇宙為教育相關主體創建數字身份,實現真實人和數字人的教育交互。從狹義上講,教育元宇宙是基于VR等智能技術實現讓人沉浸式教與學的虛擬世界;從廣義上講,教育元宇宙涵蓋了數字教育世界的所有概念,包括當前的互聯網+教育和未來虛實融合的數字化教育世界,而在這個教育世界中最重要的主體是真實人和數字人。教育數字人是計算機通過復制或模擬真實世界中教育主體的體格而生成的實體,可以擺脫與人類身體互動相關的物理、空間和時間限制,與其他真實或虛擬對象、人或系統進行交互。
簡言之,教育數字人意指具有數字化外形的與教育息息相關的虛擬人物,不僅擁有人的外觀、行為和思想,還具有識別外界環境、與人交流互動的能力。教育數字人有兩種主要類型——教育數字人化身(由人控制)和教育虛擬代理(由計算機控制)。教育數字人化身是由實時用戶控制的教育數字人,集成了人體生理、心理、生物力學等特征,能夠將真實教育世界的動作、意圖和想法遷移到虛擬世界中。教育虛擬代理是由計算機程序創建并控制的教育數字人,用于支持真實教育主體與虛擬環境的交互。
(2)教育數字人的特征
第一,教育數字人具有教育性。在高度仿真的虛擬教學場景中,師生能打破時空限制,通過控制虛擬化身以具身認知體驗和沉浸式體驗的方式進行情境性、探究性的學習活動和交互,形成虛擬人、教師和學生數字孿生體三位一體的局面,相比傳統教學方式效率更高、互動性更強,空間成本、時間成本被顛覆性降低,教育效率被顛覆性提升。如虛擬教師除了可以模擬真人教師的姿態、形象、行為和表情之外,還可以完成既定的教學任務,展現高度擬人化的虛擬教師形象。虛擬學生也可以理解人的想法,實現像人一樣學習和思考,主動生成符合用戶需求的互動,直觀、全面地捕捉人的需求。
第二,教育數字人具有交互性。教育數字人可以在教育元宇宙中和真實人類傳遞信息。根據信息傳輸的方向,教育數字人與人類的交互可以分為三類。(1)信息可以從人傳遞到教育數字人來指導真實的人在虛擬教育環境中的動作(人→教育數字人),如清華大學虛擬學生華智冰唱歌;(2)信息的傳遞可以從人到教育數字人再到人(人→教育數字人→人),如虛擬教育主播播報新冠疫情防控通知等;(3)信息可以通過教育數字人從一個人傳遞給另外一個人(人A→教育數字人A→教育數字人B→人B),如A同學和B同學使用ASOUL平臺通過數字人進行學術交流和互動。教育數字人的交互性極大地促進了教育的情感感知與強交互,替代真實的教育相關者完成許多真人完成不了的教育任務。
第三,教育數字人具有虛擬性。教育數字人打破了物理空間和虛擬空間的界限,教育主體通過虛擬化身,在教育元宇宙中獲得全息化臨場感,如瞬間傳送或物體重力下落等。教育數字人的沉浸性有三種方式,分別是空間、時間和情感沉浸。首先,教育數字人的生成伴隨著對用戶的感知系統的數字化復刻,這意味著真實的人通過教育數字人可以在虛擬空間中獲得身臨其境的體驗;其次,教育數字人不會衰老,擺脫了時間的限制,這種自主性極大提高了對教育用戶的吸引力;再次,用戶通過教育數字人進行交互,產生情感共鳴,進而收獲情感沉浸。
第四,教育數字人具有高度擬人化的特點,擁有人的外觀及性格特征。教育數字人無論是微表情、發質,還是膚質,做到對真實人的還原,且教育數字人可以根據不同的光影條件做出對應的渲染和模擬,擁有貼近真正的教育相關者的虛擬形象。教育數字人被賦予了獨特的人物個性和飽滿的情感,在形象、言談舉止等方面無限接近于真實的教育相關者。
“數字人作為數字世界的基本組成之一,同樣面臨數據安全和網絡安全等治理挑戰。”專家指出,尤其當數字人在生產生活中的滲透性愈來愈高強、扮演越來越重要的角色時,其系統安全性將變得極為重要。此外,數字人作為人機交互媒介,同樣也會在日常應用中涉及用戶隱私和倫理問題。這些都需要通過建立一系列監管和保障機制,并輔助技術手段予以解決。
5 結束語
當前虛擬人產業處于前期培育階段。在不遠的未來,隨著人工智能、虛擬現實等相關技術的逐步成熟,通過深度學習和認知泛化,AI數字人將會全面突破應用邊界,升級成為數字世界的“超級助手”。
市場研究機構量子位智庫發布的《虛擬數字人深度產業報告》預計,到2030年,我國虛擬人整體市場規模將達到2700億元,其中,身份型虛擬人將在未來發展中占據主導地位達到約1750億元,服務型虛擬數字人則相對穩定發展,總規模也將超過950億元。
2022年6月28日,市場調研機構IDC發布的《中國AI數字人市場現狀與機會分析2022》報告顯示,中國AI數字人市場規模呈現高速增長趨勢,預計到2026年將達102.4億元。報告指出,政策、應用價值、市場需求、資本支出、技術成熟正合力推動AI數字人市場崛起。
目前,數字人的制作方式自動化程度還很低,生產門檻又很高,關鍵技術還不完全成熟。下一步,相關廠商和行業會繼續加大關鍵核心技術的創新,降低數字人的生產制作成本,提高對數字人面部和聲音的還原度,推進數字人開放平臺建設,增強技術可及性,最終實現更加自然、逼真的互動體驗。
因數字而變,因數字而興。展望未來,一系列新的數字應用加速走來,數字中國迎來更廣闊的發展前景。數字浪潮下,各種新業態、新模式不斷涌現。
希望人們在發展中把準方向,在變革中搶抓先機,不斷提高數字技術技能和數字經濟思維,爭做數字經濟的創新者、數字經濟的先行者,在追潮弄潮中實現人生價值。
作者簡介:
孫柏林(1936-),男,湖北黃陂人,軍事科學院研究員,少將軍銜,我國自動控制系統與軍事系統工程專家,中國自動化學會專家咨詢工作委員會名譽主任。
參考文獻:
[1] 李佳師. 虛擬數字人產業鏈漸成熟[N]. 中國電子報, 2021-7-23.
[2] 王軼辰. "數字人" 走進我們生活[N]. 經濟日報, 2021-12-10.
[3] 鄭見. 虛擬數字人產業進入加速期[J]. 計算機與網絡, 2022.
[4] 戴莉娟. 數字人走進現實[J]. 現代廣告, 2022.
[5] 閆佳佳, 石丹. 虛擬數字人 "破圈" 而來, 你了解多少[J]. 商學院, 2022.
[6] 王蕾. 虛擬數字人, 你要動誰的 "奶酪" [N]. 山西經濟日報, 2022-4-24.
[7] 婁方園, 齊夢娜, 王竹新, 王娟. 元宇宙場域下的教育數字人及其應用[J]. 圖書館論壇, 2022.
[8] 彭思雨. 上市公司扎堆布局虛擬數字人產業[N]. 中國證券報, 2022-6-29.
[9] 郭全中. 虛擬數字人發展的現狀、關鍵與未來[J]. 新聞與寫作, 2022 ( 7 ).
摘自《自動化博覽》2022年10月刊