文心(百度語義理解技術與平台ERNIE中文名)

文心(百度語義理解技術與平台ERNIE中文名)

文心(ERNIE)語義理解技術與平台,依託百度深度學習平台飛槳打造,集先進的預訓練模型、全面的NLP算法集、端到端開發套件和平台化服務於一體,提供一站式NLP開發與服務,讓開發者更簡單、高效地定製企業級文本模型。

“文心”出自中國南朝文學家劉勰的《文心雕龍·序志》,原指用雕鏤龍紋那樣精細的功夫研究文字的內涵和魅力,我們藉此表示用心做語義理解的決心。

文心已廣泛套用於百度搜尋引擎、信息流、智慧型音箱等幾十個產品。同時,文心也通過百度大腦AI開放平台面向開發者和企業進行開放,已套用於金融、通信、教育、網際網路等行業,與合作夥伴一起助推企業智慧型化轉型。

2020年7月,文心(ERNIE)語義理解技術與平台正式發布,並榮獲2020世界人工智慧大會最高榮譽SAIL獎(Super AI Leader,卓越人工智慧引領者)。

基本介紹

  • 中文名:文心
  • 外文名:ERNIE
  • 隸屬公司:百度
  • 上線時間:2020年7月
背景,發展歷程,主要產品,文心公有雲開發平台,文心私有化開發平台,核心技術,平台特點,業界領先的語義理解技術,形態多樣的NLP開發平台,工業級的套用實踐能力,全流程的企業級服務支持,

背景

隨著企業智慧型化轉型的深入,多樣的NLP套用需求蓬勃而出,通用的文本模型無法滿足各行業多樣的套用需求,而傳統定製文本模型的方法存在成本高、耗時長、可疊代性差等劣勢,為了解決這些問題,語義理解技術與平台——文心(ERNIE)應運而生。
基於領先的語義理解技術,文心為企業/開發者提供一整套NLP定製與套用能力。包括零門檻公有雲開發平台EasyDL和針對企業客戶的私有化開發平台BML,滿足不同類型開發者的模型訓練、部署需求。

發展歷程

2019年3月,百度發布並開源知識增強的預訓練模型ERNIE1.0,模型在語言推斷、語義相似度、命名實體識別、情感分析、問答匹配等自然語言處理各類中文任務上的效果超越BERT。
2019年7月,百度發布持續學習的語義理解框架ERNIE2.0,在16箇中英文任務上超越了BERT和XLNet,取得了SOTA效果。
2019年11月,在2019年深度學習開發者秋季峰會上正式向業界發布ERNIE語義理解開發套件,包含輕量級預訓練模型ERNIE Tiny以及一鍵式數據蒸餾工具ERNIE Slim,預測速度提升達到1000倍。
2019年11月,ERNIE2.0論文《ERNIE 2.0: A Continual Pre-Training Framework for LanguageUnderstanding》被人工智慧頂級會議AAAI錄用並被選為Oral展示。
2019年12月,ERNIE以超越人類3個百分點水平摘得自然語言處理權威數據集GLUE全球第一,在9個任務平均得分首次突破90大關,刷新該榜單歷史。
2019年12月,ERNIE成果受到國際頂級科技商業雜誌《MIT Technology Review》官方報導。
2020年1月,推出首個基於多流(multi-flow)機制生成完整語義片段的預訓練模型ERNIE-GEN,在摘要生成、問題生成、多輪問答等五個語言生成任務上刷新了SOTA效果。
2020年3月,在全球規模最大的語義評測比賽SemEval 2020中,ERNIE斬獲5項世界冠軍,囊括視覺媒體的關鍵文本片段挖掘、多語攻擊性語言檢測和混合語種的情感分析。
2020年4月,語言生成預訓練模型ERNIE-GEN論文被人工智慧頂級會議IJCAI錄用,在5個生成類任務上取得了SOTA效果。
2020年5月,在2019年深度學習開發者夏季峰會上正式向業界發布動靜合一的ERNIE開發套件,即“一套代碼,兩種運行方式”,使得開發者更加高效使用ERNIE解決工業生產中的各類NLP問題。
2020年5月,基於知識增強的持續學習語義理解技術ERNIE榮獲《2020年度中國人工智慧學會優秀科技成果》。
文心(百度語義理解技術與平台ERNIE中文名)
2020年7月,發布ERNIE-ViL,首次將場景圖知識融入多模態預訓練,刷新了5項多模態任務紀錄,並登頂權威榜單VCR。
2020年7月,正式發布預訓練時代的NLP開發與服務平台文心(ERNIE),基於領先的語義理解技術,為開發者提供一整套NLP定製與套用能力。
2020年7月,語義理解技術與平台文心(ERNIE)摘得2020世界人工智慧大會最高榮譽SAIL獎。
文心榮獲SAIL獎文心榮獲SAIL獎

主要產品

文心公有雲開發平台

通過零門檻AI開發平台EasyDL提供平台化服務,企業/開發者可通過公有雲平台使用文心(ERNIE)提供的NLP定製與服務能力。
適用於AI初學者及AI專業工程師。內置豐富的NLP預置算法,可在少量訓練數據上達到更優的訓練效果,支持定製文本分類、短文本匹配、序列標註等NLP經典任務;支持智慧型標註,最高可節省90%的標註成本,只需少量數據可達到優異的模型效果;支持將模型部署為公有雲API、私有化部署、軟硬一體產品,最快5分鐘即可集成,性能優異。

文心私有化開發平台

通過百度BML平台提供私有化服務,企業可通過私有化部署方式使用文心(ERNIE)提供的一站式智慧型文本開發能力。適用於企業級有深度定製需求的用戶。文心向用戶提供深度學習環境,實現從數據管理、數據預處理、模型訓練與管理、預測推理服務管理、全服務監控等全工作周期的智慧型文本能力,依據企業需求提供開發服務,靈活高效。

核心技術

文心(ERNIE)語義理解技術是百度NLP自研的基於知識增強的語義理解技術,開創性地將大數據預訓練與多源豐富知識相結合,通過持續學習,不斷吸收海量文本數據中辭彙、結構、語義等方面的新知識,實現模型效果不斷進化,顯著提升了產品智慧型化水平。
核心技術全景圖核心技術全景圖

平台特點

業界領先的語義理解技術

文心提供多種百度自研、效果領先的預訓練模型,可以幫助用戶快速提升文本模型訓練效果,取得更優秀的產業套用效果。

形態多樣的NLP開發平台

文心面向企業開發者提供多種開發方式,包括:公有雲開發平台、私有化開發平台。公有雲開發平台適用於模型疊代高頻、需要快速集成的業務,可輕鬆實現AI能力與業務系統整合,穩定承載高並發請求,支持業務規模化發展;私有化開發平台適用於深度定製的業務,可提供一整套靈活定製的能力和多種交付形式來滿足企業的AI開發需求。

工業級的套用實踐能力

產品已套用於搜尋引擎、智慧型音響、智慧型客服、機器翻譯、信息流推薦、金融風控、智慧型地圖、智慧型創作等各類產品,多家外部企業基於文心平台進行技術研發。文心經過了真實工業場景淬鍊,擁有更優秀的工業級套用能力。

全流程的企業級服務支持

以企業客戶需求為中心,提供公有雲服務、私有化服務兩類產品相關的業務問題分析、技術選型指導、模型最佳化指導、開發者使用培訓等全流程技術配套服務,真正做到“授之以漁”。
結合四大特點,文心(ERNIE)可為NLP開發者帶來效果佳、易上手、使用靈活的NLP開發體驗。

相關詞條

熱門詞條

聯絡我們