公司簡介
數據堂成立於2011年,專注於人工智慧數據服務,致力於為全球人工智慧企業提供數據獲取及數據產品服務,。實現數據價值最大化,推動人工智慧技術、套用和產業的創新。 作為為中國人工智慧數據服務領域的領頭羊,數據堂已經在全國中小企業股份轉讓系統(新三板)掛牌,成為中國
AI數據服務行業第一家掛牌企業。
數據堂的主要業務範圍包括為客戶提供涵蓋語音、圖像、視頻、點雲文本等全類型多場景人工智慧數據解決方案,旗下產品包括成品
數據集、數據定製服務、數據標註工具。
主要業務
【成品數據集】
數據堂擁有豐富的成品數據集並分別取得了著作權。成品
數據集覆蓋20萬小時語音數據、50萬ID圖像視頻數據、4.5TB文本數據等,涵蓋80多種語言及方言,適用於各種常見的AI套用場景,能夠做到即時交付,快速建立並提升
客戶側AI模型準確率。
【數據定製】
數據堂自主研發基於Human-in-the-loop智慧型輔助標註技術,通過豐富的AI數據項目實施經驗與完善的項目管理流程,可以快速回響客戶需求和技術方案對接要求,提供專業個性化數據採集定製與標註服務,助力客戶高效展開算法模型訓練與
機器學習。
數據堂擁有多套專業數據
採集設備、工具和多種類實施環境。項目經理均擁有2年以上豐富的採集經驗及質量管控經驗,可以滿足客戶多種場景與類型的數據採集需求。在數據標註方面,數據堂在國內擁有3個大型標註基地,現有5000名以上經驗豐富的專業標註人員,支持語音、圖像、視頻、點雲、文本等專業數據標註定製服務。
【數據標註工具】
依據多年標註項目的實施經驗,數據堂自主研發了數據標註工具,現有26套成熟的標註模板,可全面覆蓋語音、圖像視頻、
雷射雷達3D點雲和文本數據標註需求。標註工具內置人機互動半自動標註與質檢功能,靈活支持SaaS、獨立、私有化等部署方式。
場景化解決方案
【智慧型駕駛數據解決方案】
高質量的訓練數據可幫助智慧型駕駛AI模型更加準確,以創造更加安全舒適的駕乘體驗。數據堂面向智慧型駕駛研究領域,提供3D圖像標註,場景語義分割,行人識別,車道線識別,障礙物識別等AI數據產品,以及智慧型駕駛數據採集、智慧型駕駛數據標註的定製服務。
【遊戲與娛樂數據解決方案】
自建多套人臉、人體著作權數據集,可套用於遊戲娛樂場景身份認證、直播互動、自動美顏、視頻特效等功能研發。覆蓋50萬採集人,授權真實有效,數據安全有保障。數據堂面向遊戲娛樂領域數據,涵蓋人臉圖像數據、手勢識別數據、人體圖像數據、場景識別數據等,同時提供手機套用數據採集、標註等定製數據服務。
【智慧型家居數據解決方案】
語音互動、手勢識別、面部識別等AI技術進入家庭。多樣化的數據不斷提升AI智力。讓智慧型家居產品更理解主人需求,人機溝通更加智慧型化。數據堂面向智慧型家具領域數據,針對家居長多自研多套優質訓練數據集,覆蓋身份驗證、語音互動、手勢控制、異常情況監控。目標檢測等,同時提供手機套用數據採集、標註等定製數據服務。
【新零售數據解決方案】
自研2D及3D人臉、人體摳圖、服飾分割、Re-ID等多套數據產品並支持個性化定製。大規模高質量訓練數據可以幫助AI模型更快推向市場,改善
消費體驗。數據堂面向新零售領域數據,涵蓋
3D人臉圖像數據、活體檢測數據、手勢識別數據、人體圖像數據、場景識別數據等,同時提供手機娛樂場景的數據採集、標註等定製服務。
【智慧型客服數據解決方案】
使用數加加標註平台對原始客服語音數據進行提取、分類、標註等一系列處理,快速提升智慧型客服AI模型性能, 同時提供手機套用數據採集、標註等定製數據服務。
【語音識別數據解決方案】
擁有約60000小時的自有著作權語音數據集,包括各國人說英語的語音數據集、歐洲語系語音數據集、
中文國語語音數據集、中國地區方言語音數據集、亞洲語系語音數據集和一些其他語種的語音數據集等,均獲得採集人授權。這些高質量語音數據集可以為您的語音識別
算法最佳化提供非常好的幫助。
【語音合成數據解決方案】
基於海量語音文本數據標註經驗與領先的人工智慧語音合成技術,針對客戶提出的不同場景、音色、音色、類型等需求,快速合成定製化聲音效果。讓機器像人類一樣能說會道。
大事記
2019年11月:數據堂日本子公司成立
2019年2月 :數據堂上海、深圳分公司成立
2018年3月 :數據堂啟動保定數據加工基地
2017年6月 :數據堂啟動合肥數據加工基地
2015年11月:數據堂完成B輪融資
2015年4月 : 數據堂完成A輪融資
2014年12月:數據堂在新三板掛牌,股票代碼:831428
2014年1月 : 數據堂完成Pre-A輪融資
2011年9月 :數據堂在北京正式成立