數字化浪潮下,金融業的商業模式與服務形態正在重新被定義,價值潛力也在不斷被挖掘,“虛擬數字人”日漸成為金融機構打造智能化交互體驗的“新寵”。
例如:浦發銀行和百信銀行相繼發布的虛擬數字員工等。不可否認的是,作為金融業數字化轉型的創新產物,活躍于金融場景的虛擬數字人不僅迎合了金融業務降本增效的需求,也為用戶提供了全新的交互體驗,增強了用戶黏性。
此次,興業證券攜手火山引擎推出的虛擬數字人便是打響了新年“第一槍”!與此前諸多的虛擬數字人不同的是,此次興業證券推出的虛擬數字人“小知”,是業內首款以自有員工為原型、集“播報+服務”于一體的真人數字分身。
整體來看,“小知”不僅從外形上深度還原了興業證券明星投顧的形象,更重要的是其口唇形、微表情與動作也都達到了較高的仿真度與自然度。僅從屏幕上看,這樣的自然度幾乎與真人無異。
這一切的背后均離不開“火山語音”,在打造小知的過程中運用了多項業界領先的核心技術。作為火山引擎金融虛擬數字人解決方案的技術提供方,火山語音通過使用行業領先的非自回歸模型的唇形生成網絡,合成與輸入文本或語音完全匹配的唇形,準確率高達98.55%;基于創新的Motion Graph技術,能讓“小知”可以輕松做到毫秒級動作切換延遲且自然無感知。為了讓“小知”的動作更加自然,創新引入了style embedding動作切換技術,能做到毫秒級動作切換延遲,達到動作自然切換無感知。
值得一提的是,“小知”在火山語音業內領先的端到端語音合成技術加持下,還具有開心、悲傷、驚訝、憤怒、恐懼、厭惡、平和等豐富的情感演繹能力,還可通過控制音色的重音、停頓等,賦予“數字人”多樣的語氣,實現笑聲、哭腔等非語言現象建模能力,讓AI演繹更貼近真人的同時為用戶提供更有溫度的服務。
據了解,在火山語音的AI虛擬員工解決方案支持下,火山引擎目前已建立了包括2D、3D卡通和3D超寫實在內的虛擬數字人產品矩陣;從場景適配出發,包括“播報型數字人”和“交互型數字人”兩種類型。
其中播報型數字人,即輸入文本或語音,就可生成自然生動的數字人播報視頻;交互數字人作為播報型數字人的形態升級,依托于火山語音長期積累的成熟語音交互技術,可以做到“善聽”、“會說”、“能想”,與用戶面對面實時交互。交互數字人集成了全雙工語音交互鏈路,前向兼容語音以及文本輸入,后向兼容2D與3D數字人表現力,整體端到端交互延遲在500ms左右,性能效果達到業內領先水平。
目前該方案已經具備標準平臺的快速交付能力,面向金融、大消費、泛互等行業提供涵蓋“金融客服”、“智慧導覽”、“智能助理”、“虛擬直播”等場景細分解決方案,為用戶帶來全新的互動服務和便捷體驗。而且顯然的是,火山語音這樣類似助力興業證券打造虛擬數字人的技術解決方案,未來可以廣泛運用到各個領域之中,不止是金融行業。