廣州深聲科技有限公司

廣州深聲科技有限公司

廣州深聲科技有限公司成立於2018年03月22日,註冊地位於廣州市天河區棠東毓南路19號303室(僅限辦公),法定代表人為周俊明。

基本介紹

  • 公司名稱:廣州深聲科技有限公司
  • 外文名:Guangzhou DeepSound Tech. Co. Ltd.
  • 所屬行業:科學研究和技術服務業
  • 成立時間:2018年3月
  • 總部地點:廣州市天河區棠東東路3號遠洋創意園219-221單元 
  • 公司類型有限責任公司
  • 公司口號:讓聲音服務好每個人的生活
  • 創始人:周俊明
  • Address:219-223, Ocean Creative Park, No. 3 Tangdong East Road, Tianhe District, Guangzhou, China
公司介紹,經營範圍,發展歷程,公司特色,產品與服務,公司文化,

公司介紹

深聲科技成立於2018年3月,專注於智慧型語音技術研發,以“智慧型互動”為核心,自主研發了包括高質量中英文語音合成、智慧型去噪、人聲分離等語音AI技術, 從語音合成的整條鏈路上來看,深聲科技是業內少有的擁有語音合成全鏈路技術能力的公司,主要包括語料庫製作、文本分析模組、高表現力的語音合成後端、高性能聲碼器。
深聲科技創始人周俊明是中科院計算技術研究所計算機博士,以“讓聲音服務好每個人的生活”為使命創建了公司團隊,成員覆蓋中科院、中山大學、華南理工、早稻田大學等海內外頂級院校。
通過為用戶提供一整套系統性的智慧型語音技術解決方案,從“能聽、會說、懂你”多維度地提升用戶體這些技術已套用於包括金山、小米及小米生態鏈企業等客戶的智慧型客服、有聲讀物、新聞播報、語音助手等場景。

經營範圍

經營範圍包括電子、通信與自動控制技術研究、開發;軟體開發;網路技術的研究、開發;計算機技術開發、技術服務;人工智慧算法軟體的技術開發與技術服務;通信工程設計服務;計算機信息安全產品設計;通信系統設備產品設計;網路信息技術推廣服務;軟體技術推廣服務;信息系統集成服務;信息技術諮詢服務;智慧型機器系統技術服務;遊戲軟體設計製作;軟體測試服務;信息電子技術服務;通信技術研究開發、技術服務;軟體批發;軟體零售;商品批發貿易(許可審批類商品除外);商品信息諮詢服務;

發展歷程

2018年3月 深聲科技在廣州天河區註冊成立
2018年7月 獲得小米科技天使投資
2018年10月 深聲科技發布高質量語音合成技術 DSTTS v1.0
2019年7月 榮獲Blizzard Challenge2019國際語音合成大賽亞軍
2019年12月 榮獲雷鋒網2019AI最佳掘金案例年度榜單最佳語音合成獎

公司特色

深聲科技是業內少有的擁有語音合成全鏈路技術能力的公司,主要包括語料庫製作、文本分析模組、高表現力的語音合成後端、高性能聲碼器。
語音合成語料庫
深聲科技自主研發的數據標註平台,採用自動標註+人工校正的模式,在確保高質量的前提下,大大節省了語料庫製作成本和時間周期,使深聲能夠快速回響客戶聲音定製化的需求。套用場景包括智慧型音箱、配音服務、有聲讀物、智慧型客服、兒童玩具、虛擬偶像等。
文本分析模組
深聲科技的文本分析模組包含文本正則化、G2P(文本轉音素)和韻律分析,藉助深度學習技術,準確率相比行業的主流方法有較大的提升,即便在遇到多音詞如“打的”,“美的”,“朝陽”時,也能輕鬆辨別。
高表現力的語音合成後端
深聲科技研發的高表現力語音合成後端採用了可控的端到端技術,無論在情感的表現力上,還是在合成的準確率、音質穩定性、音色可控性上都超越當前行業的主流方法。
高性能聲碼器
深聲科技研發的高性能聲碼器結合語音算法和網路模型,在提升合成效率的同時,解決了噪聲、沉悶、機械感強等音質問題,合成出清晰流暢的、與真人相媲美的聲音,不僅能夠滿足大規模的實時語音互動套用的需求,還能滿足對音質長時間使用場景的嚴苛需求。

產品與服務

語音合成:採用可控的聲學模型和卓越的聲碼器模型,提供快速接入、低延遲、高可靠的語音合成服務,具有音質清晰,真實自然、極富表現力的合成效果;根據廣泛的實時語音互動套用的需求,合成清晰乾淨的聲音。
聲音定製:對接客戶需求,評估業務特點,明確數據要求和採集規範,完成數據採集及標註工作,為客戶提供發音人資源,在多種音色風格中挑選最適合的聲音,同時支持客戶自有數據的聲音定製服務,套用深聲研發的高質量語音合成技術,深度定製TTS聲音,啟動模型訓練,測試並調優合成效果。
語音分離:保留原始音頻信號中的所有細節,能夠完美地將任意一首帶有人聲和背景音樂的歌曲分離成人聲和伴奏聲兩個獨立音軌。
語音降噪:結合人類聽覺機理和環境噪聲特點,採用深度神經網路技術,提供複雜環境下的語音智慧型降噪服務。
音頻處理算法:語音集與播放、語音編解碼與傳輸、語音前後處理等全鏈路語音技術方案。
語音識別:自然語言處理技術結合多場景語音識別技術,為您提供高準確率、低成本、低時延(百毫秒級)的語音識別和語音轉寫服務。
語音轉換:高質量的聲音轉換技術,可將任何人的語音轉換為目標人的聲音。

公司文化

使命:讓聲音服務好每個人的生活
經營理念:為社會持續創造價值,不斷以產品和服務滿足用戶需求
價值觀:誠實守信、敢於挑戰、追求極致、開放共贏、簡單高效

相關詞條

熱門詞條

聯絡我們