企業介紹
標貝科技堅持“語音連線場景、數據服務技術“的理念,通過場景化的語音互動方案,簡化人機互動的溝通方式。,截至2021年,標貝已與百度、阿里、騰訊、微軟、京東、滴滴、位元組跳動、網易、360、三星等國內外百餘家企業客戶建立合作,服務項目累計超過百項,包括有聲閱讀、智慧型客服、智慧金融、AI教育、泛娛樂、自動駕駛、智慧城市等領域。
發展歷程
2016年02月 標貝科技成立
2017年11月 完成Pre-A輪千萬級融資
2018年02月 標貝科技首發TTS評測系統
2018年12月 完成A輪5000萬融資,深創投領投,恒生電子跟投
2019年01月 成立深圳分公司
2019年08月 成為騰訊AI加速器成員
2019年12月 標貝悅讀一站式智慧型配音服務平台上線
2020年03月 推出留聲機方案
2020年05月 情感合成語音解決方案上線
2020年06月 推出AI聲音轉換解決方案
2020年07月 推出虛擬數字人產品方案
2021年03月 全新升級TTS3.0整體解決方案
2021年04月 推出標貝智慧型語音開放平台
2024年4月,該公司標貝語音合成算法備案通過,主要套用於音頻生成場景,服務於企業端客戶,根據用戶輸入的文本,生成語音、歌聲或目標人聲等。備案號為網信算備370212280862501240011號。
榮譽資質
2017年11月 獲得國家高新技術企業認定
2018年09月 榮獲AI企業級套用產品實力榜
2019年08月 榮獲中國初創企業商業落地初創企業TOP100榜單
2019年09月 標貝語音論文入選全球語音大會INTERSPEECH2019
2019年12月 榮登2019全球人工智慧TOP50
2020年10月 榮登2020科創中國 ·科技創新創業大賽TOP10企業
2021年05月 入選北京市2021年度第一批擬認定“專精特新”中小企業名單
2022年2月10日,入選2021年度第二批擬認定北京市專精特新“小巨人”企業名單。
標貝科技語音技術產品
語音合成
提供線上、離線合成能力,支持多語種、多音色,支持公有雲調用和私有化部署,以及標準化和個性化合成語音定製。適用於智慧型客服、智慧型設備互動、有聲服務、新聞播報等多個場景。
語音識別
提供一句話識別、長語音識別、錄音檔案識別等多項語音機器轉寫服務,支持8K/16K採樣率。適用於實時語音輸入、IOT設備語音互動、會議內容實時記錄、演講內容實時上屏、海量語音數據批量轉寫等場景。
聲音復刻
為用戶提供個人定製音色服務,實現聲音復刻和聲音合成功能,保留真人說話的語氣音調。適用於虛擬數字人、有聲閱讀、客服助手、智慧型硬體、車載智慧型設備等場景。
語音轉換
在保留原說話人的語氣、語調、停頓等風格特色基礎上,實現聲音遷移。適用於虛擬員工、影視創作及新聞主播等媒體配音場景。
情感合成
基於深度神經網路學習技術及自有情感資料庫,可以提供高興、憤怒、恐懼、哀嘆、悲傷等六大情感聲音。適用於有聲閱讀、兒童教育、泛娛樂、車載設備等場景。
標貝開放平台
通過公有雲調用或私有化部署的形式,向企業及個人開發者提供AI語音技術輸出,助力開發者構建自己的AI語音產品。
解決方案
基於語音互動技術,標貝打造場景化智慧型語音互動解決方案,包括AI虛擬人、智慧型客服、智慧型會議、智慧媒體等解決方案。
標貝悅讀
線上文字轉語音工具平台,提供合成配音服務,如自媒體文章配音、兒童故事配音、小說配音、視頻配音、課件朗讀、英語朗讀配音等。
恐龍貝克
基於標貝語音合成能力以及聲音復刻功能,結合故事內容文本,家長錄製上傳聲音,即可復刻自己聲音給孩子講故事,是一款兒童智慧型陪伴慧讀產品。
標貝科技數據服務
一站式數據采標平台
提供音頻、文本、圖片、視頻等方向的數據標註及預加工處理,通過完整的服務流程體系,滿足各企業客戶的數據定製化需求,進行數據加工處理,提升訓練算法模型。採集:對各類規定文本、指定圖片,各種環境下的語音、視頻進行採集;採集過程中可實現對其內容的篩選、文本化等相關任務。標註:通過對音頻、文本、圖像、視頻等信息進行蒐集、評估、歸類,最終完成標註;標註過程中可實現對內容進行關鍵字等內容的提取、清洗、脫敏、校驗等相關任務。
數據定製
根據客戶需求,提供多語言多類型數據採集製作、語音合成技術建模和測試需要的標註加工和分析處理等數據服務。支持跨地區、跨語種、跨年齡段等多種複雜採集任務,支持3D點雲、語義分割、情感判定、TTS等數據標註。
數據工場
AI數據採集APP,標貝將數據格式算法融入其中,通過操作平台控制前端採集格式,避免數據在採集和上傳的過程中因壓縮出現質量損失問題。
可視化數據大屏
可視化數據大屏將數據項目管理線上化,客戶可以實時了解數據項目狀態、項目實施情況、人員工作狀態,把控項目進展,實現對數據項目的管控;同時全流程閉環管理,對數據生產過程和服務過程進行管控。
自有資料庫
自有資料庫規模總時長超過10萬小時。其語音合成自有庫超過100餘種數據,涵蓋成人、青少年、兒童等不同年齡段類型及十餘種方言和外語類型;自有語音識別庫超過50種,包括英日韓等3大外語及成人、青少年/兒童中文、地方方言等。覆蓋智慧型硬體、智慧型客服、AI教育、有聲閱讀、車載導航等套用場景。