搜狗AI開放平台是搜狗公司推出綜合性AI人工智慧解決方案平台
基本介紹
- 中文名:搜狗AI開放平台
- 別名:人工智慧平台
- 核心技術:語言互動技術
- 推出單位:搜狗公司
簡介,產品服務,特色技術,熱門解決方案,平台優勢,合作案例,
簡介
搜狗AI開放平台專注打造行業+AI解決方案,將AI技術轉化成業務落地,推進產業智慧型化升級。搜狗AI開放平台具有搜狗分身、搜狗同傳、語音變聲、多模態識別等多項特色技術,是全球領先的綜合人工智慧和解決方案平台。
產品服務
語音識別:對音頻流進行識別,支持一句話識別、實時語音識別、錄音檔案識別、電話語音識別、語音喚醒、離線語音識別、離線命令詞識別、遠場語音識別等各種形式的語音識別需求。
語音合成:通過先進的深度神經網路技術,將文本快速轉換成生動擬人、穩定流暢的音頻,賦予產品“說話”的能力,支持通用語音合成與個性化語音合成。
語音分析:通過提取說話人聲音的主要特徵,自動核驗說話人身份,支持聲紋識別與說話人歸檔。
自然語言處理:集成業內先進的語義理解和對話管理引擎,為廣大開發者和廠商提供可定製化的對話系統。可定製對話類型包括任務型對話及開放領域的問答和聊天,支持語義對話。
機器翻譯:採用新一代NMT神經網路機器翻譯技術,可以實現中文與多個語種之間的互譯,支持文本、語音、拍照翻譯等多種形式。
特色技術
搜狗分身:“搜狗分身”技術是能夠利用搜狗的AI能力,從圖像表情、聲音語言習慣、邏輯思維等層面對AI進行擬人化訓練,然後克隆製造人類的AI分身。
搜狗同傳:搜狗同傳是搜狗推出的一款同傳產品 ,可支持大會演講、辦公會議、視頻直播、視頻字幕製作等多場景的音視頻轉寫和翻譯服務。
語音變聲:通過表征學習,風格遷移等AI技術,實現人工智慧實時變聲,變聲效果真實自然,說話風格與用戶一致。
多模態識別:依託音視覺技術實現的多模態識別能力,通過對用戶唇形、語音、表情的多維度分析,輸入視頻即可將視頻內的語音更準確地轉寫為文字。
熱門解決方案
搜狗AI開放平台具有豐富多彩的AI解決方案,提供一站式接入,支持私有化部署和個性化定製,已在智慧媒體、會議服務、智慧型客服、教育學習等多個場景落地。 一、AI合成主播 僅需少量音視頻數據,即可快速、低成本生成主播形象,實現多語言音視頻自動播報,主播的表情、唇動保持自然一致,基本與真人無異。
二、金融虛擬客服 能夠基於少量真實音視頻數據,快速遷移生成虛擬客服,具備聽說能力,替代人工客服從事金融行業審核、諮詢等工作。
三、會議同傳 依託於搜狗語境引擎,搜狗同傳能根據大會演講、辦公會議、直播等會議現場PPT實時最佳化同傳效果,品質優於市場上傳統AI同傳,實戰經驗豐富。 四、字幕製作 支持實時AI轉寫字幕,也可上傳音視頻生成單 、雙語srt字幕檔案,一個小時的音視頻機器十分鐘內即可完成轉寫或翻譯。適用於課堂教學、VLOG、彈幕留言、影視製作等場景。
五、搜狗聲咖 上傳少量的音頻數據即可快速、低成本生成聲音模型,合成內容富有情感,表達自然流暢,可以大幅降低音頻製作者的生產成本。
六、音色定製 支持定製專屬個性音色,保留錄音人的音色特徵、情感與韻律,音色與發音人高度相似,流暢自然,富有感情。
平台優勢
一、豐富的解決方案,可提供智慧媒體、會議服務、智慧型客服、教育學習四個方向的解決方案,AI合成主播、金融虛擬客服、會議同傳、字幕製作、搜狗聲咖、音色定製等熱門解決方案,已落地新華社、平安普惠等數百個客戶。
二、行業先進的AI能力 語音識別準確率最高可達98%,錄音檔案1小時音頻5分鐘出稿;語音合成媲美真人發音,5分鐘定製專屬音色;語音分析遠、中、近場效果有保障,多人對話可自動歸納;自然語言支持自由翻譯與自由對話,支持語言多種語言且準確率高達90%;圖像識別實時手寫、唇語、文字識別準確率可達90%以上。
三、專業的團隊的服務 優質的AI技術, 歷經各行業檢驗,提供穩定可靠的服務支撐;易用的API、SDK等開發組件,實現靈活調用快速集成;分段式階梯計價,量大從優,同時享受多種服務免費試用。
合作案例
2016年11月,世界網際網路大會搜狗秀AI 搜狗推出實時機器翻譯;
2017年4月,搜狗同傳獨家支持前哨大會,11月,搜狗機器同傳登入達沃斯商業圓桌,12月,鈦媒體國際峰會連續三天全場焦點 搜狗同傳全程支持;
2018年8月,蔚來汽車語音助手NOMI 通過搜狗音色定製創造了專屬的個性化音色。11月,搜狗聯合新華社推出全球首個“AI合成主播”;
2019年8月,聯合平安普惠正式推出全球信貸領域首個AI視頻面審機器人。9月,搜狗同傳為蘋果發布會全程提供中英雙語字幕直播。12月,搜狗同傳3.0對極客公園創新大會獨家全程支持;
2020年1月,搜狗聲咖與黃子韜達成合作,共同豐富二次元形象“韜斯曼”。1月,搜狗聯合中國氣象網發布AI氣象主播。