百度大腦3.0已開放110多項能力,AI技術能力也在不斷提升。百度大腦3.0最大的優勢,就是多模態深度語義理解技術。
基本介紹
- 中文名:百度大腦3.0
- 發布日期:2018年7月4日
發展歷程,視覺語義,版本功能,
發展歷程
2016年9月正式發布“百度大腦”,從1.0進階到3.0。王海峰介紹,百度大腦1.0完成基礎能力搭建和核心技術初步開放,2.0形成了完整的技術體系,開放60多項AI核心能力,3.0的核心是“多模態深度語義理解”,同時開放110多項AI能力。
2018年7月4日,百度AI開大者大會上,百度高級副總裁王海峰上台,開始介紹百度大腦3.0,百度大腦3.0 的多模態深度語義理解包含視覺、語音、自然語言、數據語義以及多元語義這些因素。
視覺語義
多模態深度語義理解”是指對文字、聲音、圖片、視頻等多模態的數據和信息進行深層次多維度的語義理解,包括數據語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。
視覺語義化技術套用於世界盃視頻解析,能夠全面識別視頻中的球員、裁判、球、以及球門、球場線等人、物和場景,可以捕捉射門、進球、角球、自由球、換人等事件。
基於這些語義化知識,既可以完成機器人自動解說,也可以進行精彩片段集錦、以及各種數據統計分析等。而在實際生活的超市購物場景中,百度的視覺語義化技術通過識別人物、動作、物品並關聯時間序列,將數位化的視頻轉化為結構化的語義知識,既能實現顧客在無人超市購物的完整體驗,還可以幫助商店經營者分析和最佳化商店經營。
語音語義一體化技術使得遠場語音識別準確率提升了10個百分點;在語音合成方面,WaveNet+拼接的情感語音合成技術,使得流暢度和自然度也大幅提升。
版本功能
百度大腦3.0已經對外開放了110多項領先的AI能力。
百度大腦的深度學習訓練,已經閱讀了一千億文章,相當於六萬個國家圖書館的容量。同時百度深度學習平台paddlepaddle也迎來的3.0版本。
“百度大腦3.0首次將晶片納入技術體系,它使百度大腦具備了更完備的軟硬一體化能力,帶動百度大腦算力爆發式增長。AI晶片還將與百度自主研發的PaddlePaddle深度學習框架深度結合,推動AI行業生態快速發展“,王海峰講到。
百度大腦每天調用次數超過4千億次,調用的人中既有AI工程師,也有零“AI”基礎的初入門者,還有來自各行各業希望用AI創新業務、為業務轉型升級的企業。他們雖然身份不同、目標不同,但都從百度找到了最適合的AI接入方式。