基本介紹
- 中文名:百度智慧型數據服務平台
- 外文名:EasyData
- 隸屬公司:百度
- 產品定位:一站式數據處理服務平台
- 官方網站:https://ai.baidu.com/easydata
產品介紹,產品優勢,數據採集,數據清洗,數據標註,發展歷程,
產品介紹
EasyData是百度大腦推出的智慧型數據服務平台,為具有AI開發需求的企業及個人開發者提供一站式數據處理服務。EasyData支持圖片、文本、音頻、視頻等多種類型數據的處理,以及機器學習數據的存儲。針對AI開發過程中的數據採集、數據標註、數據清洗等環節提供了軟硬一體的自動化數據採集方案、智慧型標註、定製化清洗等領先能力。同時EasyData已與EasyDL零門檻AI開發平台和BML全功能AI開發平台的數據管理模組打通,可以將EasyData處理的數據套用於EasyDL、BML的模型訓練。
產品優勢
數據採集
EasyData支持“攝像頭採集圖片數據”和“雲服務數據回流採集圖片數據”兩種採集方式。
1.攝像頭採集圖片數據
提供本地採集軟體,支持客戶通過手動截圖、視頻抽幀(支持設定自定義抽幀規則)等靈活採集方式將圖片即時同步到EasyData進行後續管理。
2. 雲服務數據回流採集圖片數據。AI模型需要持續疊代來最佳化效果,客戶可通過調用EasyDL雲服務接口來查看實際業務數據與識別結果,並根據識別結果的準確度來反向高效的挖掘難例,獲取對模型效果提升更有助力的高質量數據。
數據清洗
客戶在EasyData中可對數據集中的圖片進行去模糊、去近似、旋轉、鏡像等多種通用清洗服務,同時支持對圖片進行過濾無人臉圖片、過濾無人體圖片等高級清洗,以進一步提升數據質量,提升下一步數據標註工作的效率。
1.圖片去模糊
過濾清晰度較低的圖片,保證數據質量
2.圖片去重
過濾大量重複的圖片,提高關鍵圖片處理效率
3.圖片批量裁剪
批量裁剪圖片中的無關元素,提升數據質量
4.圖片旋轉
校正採集圖片的角度,方便進行下一步的處理
5.過濾無人臉圖片
從清洗前數據集版本中過濾掉無人臉圖片,快速構建模型訓練的有效數據
6.過濾無人體圖片
從清洗前數據集版本中過濾掉無人體圖片,快速構建模型訓練的有效數據
數據標註
EasyData提供了豐富的標註模板,並具備智慧型標註功能,通過為數據自動打標籤,最高可降低客戶90%的數據標註人力成本。同時支持多人標註功能,客戶可發起團隊協作任務進行分發、標註、驗收等工作,以提高數據標註效率。
1.豐富的標註模板
支持圖像分類、物體檢測、圖像分割、文本分類、短文本相似度、文本實體抽取、情感傾向分析、音頻分類、視頻分類等豐富易用的標註工具。
2.智慧型標註
提供人機互動協作智慧型標註能力,系統可自動識別標註難例,只需人工標註少量難例數據後,系統將自動完成剩餘數據的標註工作,最高可降低90%的標註人力成本。
3.多人標註
管理員可通過傳送任務連結至標註員信箱,標註員可靈活選擇信箱登錄、平台登錄等不同的輕量級協作方式快速完成標註任務,任務完成後支持管理員進行任務驗收。
4.百度眾測及數據服務商標註支持
EasyData已全面對接百度眾測及百度AI市場中的優質數據服務商,可通過EasyData平台向百度眾測提交詳細的數據標註需求。
發展歷程
2020年5月,EasyData正式上線,支持攝像頭採集和雲服務回流兩種採集方式,支持智慧型標註和多種數據清洗方式。
2020年7月,新增支持情感傾向分析標註模板,支持是否有無人臉/人體的清洗方式。
2020年9月,新增文本實體抽取標註模板和多人標註功能。
2020年11月,新增文本數據清洗功能。