您現在的位置是:首頁 > 攝影首頁攝影

從技術創新走向產業應用 越來越多虛擬數字人“上崗”了

由 北青網 發表于 攝影2023-01-30
簡介谷小雨還採用了語音驅動口型技術,透過適配各種音色、歌唱、語氣詞等不同型別的音訊輸入,學習種類繁多的情感語音資料,生成韻律自然、情感風格豐富和個性化的高表現力語音,再配合靈動準確的面部表情和口型,讓數字人的語音達到可媲美真人的效果

技術應用是什麼意思

隨著人工智慧、虛擬現實等技術的發展,數字虛擬人頻頻出現在公眾的視野。作為以數字形式存在於數字空間中並具有擬人或真人外貌、行為和特點的虛擬人物,數字人是如何研發的?有哪些應用?

走進人們日常生活

“大家好,谷小雨有禮了!”近日,在南宋德壽宮遺址博物館開館儀式上,一位身著古裝的虛擬數字人擔任主持人,吸引了觀眾的注意。仔細瞧,這位數字人柳葉細眉、衣袂飄飄、氣質素雅、靈動可愛。它便是浙江廣電集團旗下浙江衛視推出的宋韻文化推廣人。

“我們推出谷小雨,既是向傳統文化靠近,也是向年輕群體靠攏。”浙江衛視谷小雨工作室負責人接受本報採訪時表示,谷小雨是由浙江衛視研發的首個數字國潮產品。這個產品把宋韻元素與新媒介、新技術、新應用融合,創新性地打造出谷小雨這個形象。“我們希望用可親可愛的人物形象、可感可觸的數字手段,讓廣大受眾尤其是年輕人喜歡上宋韻文化。”

谷小雨已在多種場合亮相——電視節目中,它吟唱宋詞、介紹宋代蹴鞠文化;世界網際網路大會烏鎮峰會期間,它與嘉賓透過H5線上合拍;在南宋德壽宮遺址博物館,它成為導覽員,對答遊客提問應答如流……最近,谷小雨參與的“南宋人的一天” 對外文化交流雲展覽,還陸續在紐西蘭、德國、荷蘭、巴基斯坦等國的中國文化中心上線。

與谷小雨類似,越來越多的數字人在文旅、金融、政務等服務領域“上崗”,走進人們日常生活。例如,以敦煌飛天為藍本打造的國風虛擬數字人天妤,在全網已擁有500餘萬粉絲;在2022世界人工智慧大會上亮相的中信金控新員工——數字人小信,可以擔任客戶的專屬財富規劃師;開啟湖北省仙桃市人民政府入口網站,紅衣白裙的數字人“桃桃”笑盈盈地對影片新聞、政策解讀進行播報……《數字人產業發展趨勢報告(2023)》指出,隨著互動智慧技術的加速發展,數字人正在從技術創新走向產業應用。

有趣的內涵不能少

如此逼真的數字人是如何打造出來的呢?以谷小雨為例,數字人首先要做到“形似人”。按照人物概念設計,谷小雨來自南宋臨安,生於穀雨時節,有“雨生百穀,欣欣向榮”的美好寓意。浙江衛視特地與宋韻文化研究傳承中心合作,邀請相關宋韻專家組成顧問團,為谷小雨的人物造型、形象設計、內容呈現等提供全程專業級指導把關。亮相一檔歌唱節目時,谷小雨的舞臺造型是一套現代改良的宋制漢服,上身是改良褙子、宋抹疊穿,袖口造型以西湖荷葉為靈感,下身是水墨印花長裙,妝容參考的是南宋仕女珍珠妝。

作為技術支援方,騰訊團隊打造出一個超200萬面數的高精度寫實虛擬人,滿足大型舞臺節目錄制以及智慧多模態互動的多樣化需求。騰訊相關負責人劉明亮告訴記者,谷小雨的麻花辮由30萬根髮絲組成,不同材質的衣物有5層,為了達到形神兼備的效果,團隊基於遊戲引擎進行實時互動模擬,使得人物在不同燈光、不同動作下的表現都非常真實。

除了“好看的皮囊”,數字人還要具備“有趣的內涵”。例如,在出任導覽員之前,谷小雨進行了400G開放資料和30億引數量的超大規模語言模型訓練,再加上海量宋韻文獻和百科搜尋引擎的助力,谷小雨成功掌握了宋韻百科知識。為了使谷小雨能夠與遊客實時語音對話,技術團隊運用語音識別、自然語言理解、語音合成等技術,讓這位數字導覽員聽得懂、答得出、懂得多。

谷小雨還採用了語音驅動口型技術,透過適配各種音色、歌唱、語氣詞等不同型別的音訊輸入,學習種類繁多的情感語音資料,生成韻律自然、情感風格豐富和個性化的高表現力語音,再配合靈動準確的面部表情和口型,讓數字人的語音達到可媲美真人的效果。

產業增長勢頭強勁

目前,數字人已在企業服務、影視動畫、文化傳媒等領域得到廣泛應用。艾媒諮詢《2022-2023年中國虛擬人行業深度研究及投資價值分析報告》稱,在娛樂需求增加、人工智慧等技術不斷迭代的背景下,中國虛擬人產業高速發展,元宇宙的熱潮加速推動虛擬數字人產業升級。資料顯示,2021年中國虛擬人帶動產業市場規模和核心市場規模分別為1074。9億元和62。2億元,預計2025年分別達到6402。7億元和480。6億元,呈現強勁的增長勢頭。

記者瞭解到,虛擬數字人的製作流程一般包括模型繫結、動作捕捉、動畫解算、實時渲染等步驟,其中要運用到大量的現實增強、深度學習、虛擬製片等高科技前沿技術。比較簡單的動漫形象數字人,一般1個月就能完成;而製作一個更寫實的3D數字人,從角色設計到完成渲染需要3至6個月甚至更久。數字人越是“精緻”“逼真”,越花費時間、人力成本。

劉明亮表示,算力提升、引擎升級等技術迭代,正推動數字人制作效能和智慧水平持續提升。一方面,製作數字人的成本更低、效率更高;另一方面,數字人的互動性越來越強,提供的服務和陪伴等“人”的屬性更強。

業內人士認為,從關注動畫、渲染的身份型數字人到融合語言理解能力、表達能力、學習能力、互動能力的服務型數智人,從線上服務到在場體驗,隨著元宇宙相關技術的進一步發展,數字人將進入大規模應用期,加速轉化為現實生產力。(人民日報海外版 記者:葉 子)