手語AI合成主播

手語AI合成主播

5月17日,搜狗CEO王小川在“搜狐科技5G & AI峰會”期間的主題演講上正式發布了最新一代搜狗AI合成主播——全球首個手語AI合成主播。基於搜狗的人工智慧和AI分身技術,幫助聽障人士更好融入社會,更好享受數位化生活。

基本介紹

  • 中文名:搜狗AI合成主播
  • 外文名:SOGOU AI synth anchor
簡介,主要特點,意義,發展動態,

簡介

手語AI合成主播立足於搜狗數字人技術體系——搜狗分身,集成了超寫實3D數字人建模、機器翻譯、多模態數字人生成、遷移學習、實時面部動作生成及驅動等多項領先AI技術,實現了超寫實3D數字人自然可懂的手語主播能力,使機器可以基於輸入口語文本生成逼真度高、手語表達準確的3D數字人視頻內容。
手語AI合成主播
手語AI合成主播

主要特點

“小聰”使用行業領先的3D重光照掃描還原、面部肌肉驅動、表情肢體手勢捕捉技術,生產出高度還原真人髮膚、形象逼真、動作自然生動的數字人模型。數字人寫實度的大幅突破能夠顯著提升手語播報的真實感與親切感,從而提高播報用戶體驗。
在手語表達方面,“小聰”基於《國家通用手語詞典》,能夠實現健聽人語言與聽障者手語語言的機器翻譯能力,基於輸入的健聽人語言能夠低延遲生成高準確率的手語語言表征,通過搜狗分身的多模態生成技術,實時預測生成對應的超寫實3D數字人驅動參數,進而快速生成數字人手語播報視頻,在測評中可懂度可以達到85%以上,能有效幫助聽障者克服理解障礙,達成信息有效傳遞。
在手語展現方面,“小聰”可以完整實現手控信息及非手控信息的表達,通過機器翻譯生成手語表徵信息,覆蓋手部動作、面部表情、口動唇動等多個維度,並基於搜狗多模態端到端生成模型進行聯合建模及預測,生成高準確率的動作、表情、唇動等序列,從而達成自然、地道、接受度更高的手語表達效果。

意義

手語AI合成主播“小聰”能夠幫助廣大聽障人士更好地接收資訊、更好地生活,更好地“看”世界,它的廣泛運用不僅可以造福國內聽障人士,甚至可以走出國門、造福全球,彰顯中國“智”力。
手語AI合成主播“小聰”的誕生,既是搜狗分身技術的再一次疊代突破,又是搜狗聚焦更加需要幫助的聽障特殊人群,將“以人為本,賦能於人”貫徹得更加徹底、更有溫度的體現,同時也充分彰顯了搜狗的社會責任感和企業擔當。

發展動態

在MTV中,“小聰”通過其標準到位的手語肢體動作、比擬真人的細微表情,不僅準確傳遞出了這首歌的內容,甚至演繹出了歌曲中家國自豪的澎湃情感。

相關詞條

熱門詞條

聯絡我們