發展歷程 2018年7月,開源框架 v0.14發布 ——提供從數據預處理到模型部署在內的深度學習全流程的底層能力支持。官方首次開源CV/NLP/語音/強化學習等10個模型。
2018年10月,開源框架 v1.0穩定版本發布 ——提供更穩定、向後兼容的API,易用性大幅提升。提供
MacOS 下的多種安裝方式,新增對Python 3.5的支持。並開源8個CV、NLP 方向主流模型。
2018年11月,開源框架 v1.1發布 ——支持萬億規模稀疏參數大規模多機異步訓練。移動端預測新增Mali GPU、Adreno GPU、FPGA等硬體支持。開源5個推薦領域模型,大幅最佳化CV、NLP模型的訓練速度和顯存占用。
2018年12月,開源框架 v1.2發布 ——CPU多機異步訓練升級包括worker異步並發和IO、通信最佳化在內多項功能,整體吞吐大幅提升。支持Python 3.6及以上各版本。模型庫新增圖像分類任任務的預訓練模型、語言模型任務新增基於cudnn的LSTM實現、分散式word2vec模型。
2019年3月,開源框架 v1.3發布 ——統一Executor和ParallelExecutor接口,正式發布AnalysisConfig 預測接口,支持計算圖分析、運算元融合等最佳化;模型庫新增發布飛槳視頻模型庫,提供5個視頻分類經典模型以及適合視頻分類任務的通用骨架代碼;新增支持NLP語義表示BERT模型,支持多機多卡訓練,支持混合精度訓練,訓練速度對比主流實現提升50%+;發布大規模稀疏參數伺服器Benchmark。
2019年4月,開源框架 v1.4發布 ——正式發布模型壓縮工具包PaddleSlim和模型預測服務Paddle Serving,全面提升飛槳部署能力。正式發布視頻分類工具包,覆蓋主流視頻分類模型;正式發布PaddleNLP,工業級中文NLP工具與預訓練模型集。正式發布PaddleHub預訓練模型管理工具,提供包括預訓練模型管理、命令行一鍵式使用和遷移學習三大功能。發布業界領先的超大規模並行能力,包括大規模稀疏參數伺服器解決方案、工業級數據處理、頻寬不敏感訓練能力等。
2019年7月,開源框架 v1.5發布 ——正式發布動態圖Preview版並提供 7個模型動態圖版本官方實現。PaddleHub共提供40+預訓練模型,覆蓋文本、圖像、視頻三大領域八類模型,並全面提升易用性,發布PaddleHub官網。模型壓縮框架PaddleSlim新增基於模擬退火的自動剪下策略和輕量級模型結構自動搜尋功能(Light-NAS)。官方模型庫正式發布PaddleDetection物體檢測統一框架、圖像生成庫;升級視頻識別與定位工具集;發布PaddleNLP-Research,包含百度在 NLP 領域近期研究工作。
2019年11月,開源框架 v1.6發布 ——訓練框架進一步最佳化了速度,完善了顯存最佳化機制,並支持在框架外部自定義C++/CUDA OP。分散式訓練新增LocalSGD、GEO-SGD等策略,大規模同步訓練、異步訓練速度繼續提升,並支持K8S + Volcano任務提交。伺服器端預測庫增加C API,並支持版本兼容檢查。發布Paddle Lite,定位高性能、多平台、輕量化的端側預測引擎,並可作為伺服器端預測庫的加速庫。PaddleServing新增超大規模分散式預估服務能力。PaddleSlim強化了量化訓練功能,增加了基於硬體的小模型搜尋功能。發布全新Seq2Seq相關API和文本生成模型樣例。語義表示庫新增XLNet預訓練模型;開源EMNLP2019閱讀理解競賽冠軍模型D-NET,同時支持18個不同抽取式閱讀理解數據集打榜。發布飛槳多任務學習庫PALM (PAddLe Multi-task learning),更便捷支持多任務機器學習調研。發布訓練部署端到端的圖像分割庫PaddleSeg。圖像分類新增EfficientNet等43個預訓練模型。PaddleDetection新增2019 Objects365 Full Track冠軍模型、BlazeFace等人臉檢測小模型,行人檢測和車輛檢測的預訓練模型。PaddleVideo新增ActivityNet Challenge 2019奪冠模型,擴展包含video caption、video grounding等模型。發布PaddleSpeech,包含語音識別模型DeepSpeech和語音合成模型 DeepVoice3。PaddleHub新增超參最佳化Auto Fine-tune功能,並全面提升Fine-tune功能的靈活性和易用性,預訓練模型數量大幅增加。飛槳圖學習框架PGL正式版發布,飛槳深度強化學習框架PARL並行能力進一步提升,支持進化算法。Paddle2ONNX和X2Paddle全面升級,飛槳和其他框架的模型互轉更加方便。發布飛槳聯邦學習框架PaddleFL。
2020年2月,開源框架 v1.7發布:
訓練框架: 增加自動
混合精度訓練 AMP接口和新
控制流 接口;最佳化Tensor使用方式和
顯存 分配策略;新增支持
NVIDIA DALI GPU
數據預處理 庫;持續最佳化基礎OP的功能和性能;動態圖的功能進一步完善,性能大幅提升,對Data Independent的動態
圖模型 提供轉為靜態圖可預測部署模型的功能;框架調試分析功能和易用性全面提升。
預測部署: 伺服器端 預測庫的
Python API大幅最佳化,新增
R語言 、
Go語言 的預測API,並增加相關的使用方法和示例,強化了量化支持能力;Paddle Lite支持無
校準數據 的訓練後量化方法生成的模型,加強對
OpenCL 的支持,支持崑崙XPU的預測;模型壓縮庫PaddleSlim重構裁剪、量化、蒸餾、搜尋接口,與模型庫充分打通,新增大規模可擴展知識蒸餾框架Pantheon。
分散式訓練: 參數伺服器模式下統一了Transpiler半異步、全異步和GEO的實現模式,後端實現上統一到Communicator中,前端接口統一到fleet中,通過fleet strategy靈活選擇不同模式;發布大規模分類庫PLSC,通過模型並行支持超多類別的分類任務。
基礎模型庫: 發布語音合成庫Parakeet,包括多個前沿合成算法;PaddleCV新增14個圖像分類預訓練模型,3D和跟蹤方向模型持續豐富;PaddleNLP的
分詞 和
詞性標註 模型支持jieba分詞;PaddleRec增加
多任務 模型MMoE;模型庫整體增加了廣泛的動態圖模型實現。模型庫整體
層次結構 做了調整最佳化。
端到端開發套件: PaddleDetection和PaddleSeg新增大量模型實現及預訓練模型,提升了典型模型的訓練速度和精度,大幅提高模型壓縮和部署能力,使用體驗得到了全面最佳化;發布ElasticRec推薦排序系統,通過K8S進行部署,支持流式訓練和線上預測服務。
訓練框架 :深度最佳化了命令式編程(動態圖)功能、性能和體驗,特別是增強了動靜轉換的能力,能支持依賴數據的控制流的動態圖實現進行靜態存儲部署,也可以轉為靜態
圖模式 訓練;Data Loader的功能和梯度裁剪的使用方式進一步最佳化;
聲明式編程 模式下多卡
運行時 fetch不定長Tensor等問題得到解決,混合精度配合重計算顯示出支持大Batch訓練很好的成效。新增了大量API,並新增 ComplexVariable,支持複數張量的表示和常見的複數運算。
預測部署 :Paddle Inference 新增
CUDA 下
多執行緒 多流支持、TRT子圖對動態shape輸入的支持,強化量化推理,性能顯著最佳化;Paddle Serving 全面升級,功能完善,易用性顯著提升;Paddle Lite進一步最佳化編譯安裝體驗,全面提升對支持晶片的
覆蓋度 (包括RK、MTK、
百度崑崙 、
寒武紀 、比特大陸、
華為 NPU 等等)以及對應的模型數量和性能;
PaddleSlim 量化、裁剪和
NAS 功能持續強化;發布國內首個開源
JavaScript 深度學習前端
推理引擎 Paddle.js,可以幫助用戶實現網頁端深度學習模型部署。
開發套件 :全新發布PaddleClas,包含23個圖像
分類網路 實現,117個圖像預訓練模型,並添加了數據增廣、SSLD蒸餾等輔助策略,以及特色套用案例;PaddleSeg人像分割系列模型全面升級,新增多種遙感相關的策略方案;PaddleDetection、PaddleOCR和語音合成套件Parakeet算法覆蓋更全面,速度顯著提升。
工具組件 :PaddleHub新增包括一系列視覺預訓練模型在內更多的模型,模型總數120+; PaddleFL發布1.0版本,開源基於Mulit-party Computation (
MPC )的聯邦學習,支持橫向、縱向等多個聯邦學習場景;PGL發布業界首個結合
語義信息 與結構信息的圖
神經網路模型 ERNIE Sage ;PARL開源工業界首個進化學習套用框架Evokit;全新發布量子機器學習框架量槳Paddle Quantum。
編程範式: 默認開啟動態圖模式開發和訓練模型,通過動轉靜的方式部署和加速模型訓練。如果需要使用靜態圖編程範式,可以通過paddle.enable_
static ()來切換到靜態圖模式。
API體系: 對API進行了補充,對
目錄結構 進行了調整,更加易用,詳情請參見API文檔,同時提供高層API簡化使用流程;詳情請參見飛槳高層API使用指南。
框架功能: 對數據載入、動態圖執行、OP性能、混合精度訓練、分散式訓練、動靜轉換等進行了功能增強和
性能最佳化 。
環境適配: 提供了對
ARM架構 CPU 的支持,增加了對Python 3.8、CUDA 10.1/10.2的支持,發布支持CUDA 11的
安裝包 (experimental),發布支持
百度崑崙 晶片的安裝包(experimental),詳情請參見官網的開始使用部分。
模型庫及開發套件: 飛槳的官方模型庫和套件的絕大部分模型已經升級至飛槳框架2.0.0版本。
PaddleHub:支持2.0動態圖,全面遷移動態圖編程範式,模型開發調試更加方便,Finetune接口更加靈活易用。
PaddleDetection: 支持2.0動態圖,覆蓋檢測方向主流算法(PP-YOLO、Faster-RCNN、SOLOv2),支持動靜轉換,打通預測部署,提供了更加模組化的組網方式。
PaddleClas: 支持2.0動態圖,提供了29個系列的分類算法和134個預訓練模型,提供了基於SSLD知識蒸餾的
最佳化方案 ,將分類模型的精度普遍提升3%以上。
PaddleSeg: 支持2.0動態圖,提供了50+的高質量預訓練模型,支持15+主流分割網路,提供了業界的SOTA模型OCRNet,很好的提升了產品易用性。
PaddleOCR: 支持2.0動態圖,PP-OCR系統、文字檢測模型(DB、EAST、SAST)與文字識別模型(Rosetta,CRNN,StarNet)完成2.0動態圖適配。
PaddleGAN:支持2.0動態圖,所有模型,包括風格遷移、
視頻增強 、唇形遷移、人臉動漫化等九種模型均基於動態圖開發。
PaddleRec:支持2.0動態圖,
免安裝 ,動靜組網統一,方便用戶的調研和上線,同時整理髮布了
推薦系統 經典數據集。
PaddleNLP:支持2.0動態圖,提供25+預訓練模型和易用的API方式,提升文本建模效率。
Parakeet:支持2.0動態圖,已發布的
聲學模型 及
聲碼器 均良好支持動態圖版本。
PaddleVideo:支持2.0動態圖,包含了視頻分類和視頻動作定位方向模型,包括: TSN、TSM、SlowFast、Attention
LSTM 、BMN模型以及特色套用預訓練模型VideoTag和FootballAction。
Amazon DJL:易用流暢的
Java 推理接口,支持各類作業系統平台(Mac/Windows/Linux),支持飛槳預訓練模型部署,更多的信息請參考DJL支持Paddle的官方文檔。
環境適配: 增加了對Python 3.9、CUDA 11.2的支持;提供了對ROCm平台的支持(experimental);提供了對
昇騰AI 處理器的支持(experimental);增加了可在百度崑崙晶片上運行的模型數量;詳情請見:開始使用。
分散式訓練: 在已有靜態圖的多維混合併行的基礎上,新增動態圖實現。
框架功能: 完成了多項功能增強和性能最佳化,特別的,新增了以下重要功能:
自定義運算元:提供了在框架外部自定義運算元的新方案,簡化了自定義運算元寫法與訓練推理部署流程,詳情請見:自定義外部運算元。
新增inplace操作:新增可降低顯存占用與提升性能的inplace操作,包括View策略,與12個inplace API。
高層API相關:新增支持混合精度訓練的高層API;新增通過paddle.hub來查看、共享、載入模型。
自動混合精度訓練最佳化: 最佳化了混合精度訓練中slice、where、
range 等多個op的計算性能,提升了在MaskRCNN、ERNIE等模型上的加速效果。
oneDNN下BF16訓練:新增支持了AMP(AutoMixedPrecision) pure_BF16模式; 新增支持了BF16類型的SGD和
initializers 初始值設定並減小了記憶體;新增支持了大部分
word 2vec BF16訓練需要的前向和反向op。
模型庫及開發套件:
PaddleHub: 新增輕量級中文對話模型plato-mini;新增基於VOC數據集的
高精度 語義分割模型2個,語音分類模型3個;新增圖像語義分割、文本語義匹配、語音分類任務的Fine-Tune能力;新增ONNX和PaddleInference模型格式的導出功能。
PaddleOCR : 開源百度自研端到端文本識別算法PGNet(
AAAI 2021發表),多
語言模型 支持種類提升到80+,英文
數字模型 效果進一步最佳化。
PaddleDetection: 新增3個業界最廣泛套用的多目標追蹤算法:JDE、DeepSort、FairMot,並全面打通預測部署;新發布人體
姿態預估 算法HRNet和HigherHRNet;旋轉框
檢測算法 S2ANet全面打通預測部署;新增PP-YOLO Tiny的移動端部署Demo;支持批量預測。
PaddleX: 支持2.0動態圖;新增RestFul API,支持用戶在本地控制遠程伺服器構建深度學習訓練任務;新增PaddleX Deployment模組,並與飛槳其他開發套件(PaddleClas,PaddleDetection,PaddleSeg等)打通,支持用戶用更少的代碼快速完成C++ Inference部署預測。
PaddleGAN: 新增動作驅動模型First Order Motion,支持單人及多人臉部動作遷移;新增視頻
超解析度 模型EDVR,發布視頻修復的複合解決方案。
PaddleSeg: 新增全景分割場景,其中Anchor-Free算法PanopticDeepLab業界SOTA;高精度的人像分割模型humanseg升級為動態圖版,並顯著最佳化邊緣鋸齒問題;新增10中學習率策略;新增Weighted Cross Entropy Loss,針對樣本類別不均衡場景最佳化效果顯著;部署能力進一步完善,新增移動端部署和Web部署,並支持添加
後處理 運算元(argmax/softmax)。
PaddleClas: 新增RexNet、MixNet、ViT和DeiT部署模型;增加面向不同能力開發者的中文文檔;更新whl安裝包。
PaddleNLP: 新增千言等特色中文數據集,及NLP數據處理通用API;新增XLNET、ERNIE、RoBERTa、ALBERT、GPT、Unified_Transformer等中文預訓練模型;新增
知識關聯 WordTag、語義解析Text-to-SQL、語義匹配SimNet、文本圖學習ERNIE-Sage、
情感分析 SKEP、通用對話PLATO、小樣本學習P-Tuning等套用場景;新增Transformer解碼模組,支持高性能推理。
PaddleRec: 新增召回模型MIND,升級PLE, FFM等5個模型到2.0API和支持動態圖;新增可視化支持,引入VisualDL;支持
開源工具 Milvus用於向量存儲和召回服務,並提供教程;新增推薦系統公開數據集12個;支持單機多卡,多機多卡等多GPU訓練環境;支持inference預測庫和serving部署能力;支持Perf的
DNN 、DeepFm、Wide&Deep的Benchmark功能;新增完善動轉靜,預測部署,可視化等文檔。
Parakeet: 新增音色克隆功能;集成VisualDL實現
可視化分析 。
PaddleHelix: 全面從靜態圖升級到動態圖。新增2個新套用:分子生成和藥物聯用;新增6個新模型:
蛋白質 化合物親和力預測2個,分子生成3個,藥物聯用1個;新增多個數據集和升級基礎模組;修復已知
bug 。
Paddle Quantum: 新增量子
數據編碼 模組,支持量子
核方法 的模擬,並提供相關教程;增加新的
噪聲模型 ,模擬真實
量子計算 環境;新增多個雙量子比特門,包括
離子阱 量子計算設備原生門;新增列印電路功能,方便查看電路結構及參數;新增
變分 影子量子學習(AAAI 2021發表)、
旅行商問題 等多個教程。
Paddle Lite: 提升opt和推理庫體積壓縮的易用性;支持armv8.2 FP16指令計算;大幅提升OpenCL相關計算性能;新增支持Intel
FPGA 。
Paddle Serving: 集成
開源框架 2.1 inference;支持FP16和INT8的低精度推理;通過Kubernetes部署Serving服務;新增
安全網關 與Serving協同部署;X86 + XPU環境部署Serving服務。
Paddle.js : 完善WebGPU/NodeGL後端; 新增Float16模型格式及
WebGL Pack加速功能;新增運算元OP總數達到43個;封裝數據處理API,引入numjs。
2023年12月,百度首席技術官(CTO)王海峰表示,飛槳開發者達到1070萬。
領先技術 飛槳全景圖
飛槳
深度學習框架 基於編程一致的
深度學習 計算抽象以及對應的前後端設計,擁有易學易用的前端編程界面和統一高效的內部核心架構,對普通開發者而言更容易上手並具備領先的訓練性能。飛槳自然完備兼容
命令式 和聲明式兩種編程範式,默認採用命令式編程範式,並實現了業內首個動靜統一編程範式,開發者使用飛槳可以實現
動態圖 編程調試,一行代碼轉靜態圖訓練部署。飛槳框架還提供了
低代碼 開發的高層
API ,並且高層API和基礎API採用了
一體化設計 ,兩者可以互相配合使用,做到高低融合,兼顧開發的便捷性和靈活性。
飛槳突破了超大規模深度學習模型訓練技術,率先實現了千億稀疏特徵、萬億參數、數百節點並行訓練的能力,解決了超大規模深度學習模型的線上學習和部署難題。此外,飛槳還覆蓋支持包括模型並行、流水線並行在內的廣泛並行模式和加速策略,推出業內首個通用異構參數伺服器架構、4D混合併行策略和
端到端 自適應分散式訓練技術,引領大規模分散式訓練技術的
發展趨勢 。
飛槳對推理部署提供全方位支持,可以將模型便捷地部署到雲端、邊緣端和設備端等不同平台上,結合訓推一體的優勢,讓開發者擁有一次訓練、隨處部署的體驗;飛槳從硬體接入、調度執行、
高性能計算 和模型壓縮四個維度持續對推理功能深度最佳化,整體性能領先;在硬體接入方面,飛槳擁有硬體統一適配方案,攜手各大硬體廠商軟硬一體協同最佳化,大幅降低硬體廠商的對接成本,並帶來領先的開發體驗,特別是對國產硬體做到了廣泛的適配。
飛槳建設了大規模的官方
模型庫 ,算法總數達到500多個,包含經過產業實踐長期打磨的主流模型以及在國際競賽中的奪冠模型;提供面向語義理解、
圖像分類 、
目標檢測 、
圖像分割 、
文字識別 (
OCR )、
語音合成 等場景的多個端到端
開發套件 ,滿足企業低成本開發和快速集成的需求,助力快速的
產業套用 。飛槳的模型庫是基於豐富的產業實踐打造的產業級模型庫,服務企業遍布能源、金融、工業、農業等多個行業。其中產業級知識增強的
文心大模型 ,已經形成涵蓋基礎大模型、任務大模型和行業大模型的三級體系。
建設成果 基於百度飛槳的視覺工具套件,華夏天信(北京)機器人有限公司開發出了輸煤膠帶智慧型巡檢機器人,不僅能實現高頻次、無間歇巡檢,還能通過攝像儀將實時視頻
回傳 並智慧型識別分析,解決了
工作效率 、惡劣環境、作業安全等多項難題。目前,華夏天信生產的這類機器人已經在國內多家主要煤礦企業成功實施上線,為煤礦安全生產和管理提供了高效、智慧型的保障。
建設成果
上海哲元科技
發展 有限公司與飛槳展開合作,基於飛槳EasyDL零門檻AI開發平台僅使用20個工時就訓練出食品
生產流水線 數量清點及
外觀檢測 模型,成功打造出食品
自動化生產 質檢系統。該系統已套用於多家一線食品品牌實際產線中。2021年9月,在上海哲元提供的智慧型化質檢系統加持下,某知名冰淇淋品牌的
江蘇太倉 工廠被認證為世界級“
燈塔工廠 ”,成為全球冰淇淋行業的第一家“燈塔工廠”。哲元為該冰淇淋品牌定製的檢測模型,能夠做到
蛋卷 皮外觀、
朱古力 噴塗、灌料、撒料、壓蓋、包裝全流程14道工序智慧型化質檢,檢測速度從人工質檢的1個/秒提升到自動化檢測11個/秒,保障了食品安全生產的同時,保證了
檢測質量 與效率。
復亞智慧型 基於飛槳的PaddleDetection、PaddleSlim研發出一套全自主無人機
巡檢系統 ,為電網作業巡檢提供不依賴三維點雲和預設航線的全自主電力桿塔與通道巡檢系統。通過
地面站 系統可一鍵上傳飛行任務後,能實現4分鐘一級塔的全自主巡檢,同時還會綜合考慮巡視人員水平不一、巡視質量參差不齊、變電站分布分散、多處偏僻地段等因素。通過電力全自主巡檢系統,巡檢時間預計可縮短30%以上。
截至2022年5月,飛槳已累計凝聚477萬開發者、服務18萬
企事業單位 、創建56萬AI模型。
2022年7月,中國信通院最新報告顯示,百度飛槳深度學習平台居中國市場套用規模第一。報告指出,以飛槳為代表的自主可控全棧平台和生態加速了我國技術普惠與
產業賦能 ,是構建國產化生態體系的重要一環。
截至2022年11月,飛槳平台已凝聚535萬開發者,服務20萬企事業單位,基於飛槳創建了67萬個模型。
截至2022年12月,通信通院最新報告顯示,飛槳已經成為中國深度學習市場套用規模第一的深度學習框架和賦能平台。已匯聚535萬開發者,服務20萬家企事業單位,基於飛槳構建了67萬個模型。
2023年3月訊息,NVIDIA召開了全球開發者大會GTC 2023,GPU晶片與百度飛槳深度學習平台的合作持續深入。
截至2023年8月,飛槳開發者數已達800萬,模型數超80萬,服務22萬家企事業單位。
硬體生態 飛槳硬體生態持續繁榮,包括英特爾、
英偉達 、
ARM 等諸多晶片廠商紛紛開展對飛槳的支持,並主動在開源社區為飛槳貢獻代碼。飛槳還跟
飛騰 、海光、鯤鵬、
龍芯 、申威等CPU進行深入融合適配,並結合麒麟、統信、
普華作業系統 ,以及百度崑崙、海光DCU、寒武紀、比特大陸、
瑞芯微 、
高通 、英偉達等
AI晶片 深度融合,與
浪潮 、
中科曙光 等伺服器廠商合作形成軟硬一體的全棧AI基礎設施。當前已經適配飛槳的晶片或IP超過30種,處於業界領先地位。
開發套件 ERNIE
飛槳語義理解套件, 基於持續學習語義理解預訓練框架,使用多任務學習增量式構建預訓練任務,支持各類訓練任務的Fine-
tuning ,保證極速推理的Fast-Inference API,兼具靈活部署的ERNIE Service和具備輕量方案的ERNIE Tiny系列
工具集 。
PaddleClas
飛槳圖像分類套件PaddleClas,目的是為工業界和學術界提供便捷易用的圖像分類任務預訓練模型和工具集,打通模型開發、訓練、壓縮、部署全流程,輔助其它高層視覺任務組網並提升模型效果,助力開發者訓練更好的圖像分類模型和套用落地。
PaddleDetection
飛槳目標檢測開發套件PaddleDetection,旨在幫助開發者更快更好地完成檢測模型的訓練、精度速度最佳化到部署全流程。PaddleDetection以模組化的設計實現了多種主流目標檢測算法,並且提供了豐富的數據增強、
網路組件 、
損失函式 等模組,集成了模型壓縮和
跨平台 高性能部署能力。目前基於PaddleDetection已經完成落地的項目涉及工業質檢、遙感圖像檢測、無人巡檢等多個領域。
PaddleSeg
飛槳圖像分割套件PaddleSeg,覆蓋了DeepLabv3+、OCRNet、BiseNetv2、Fast-SCNN等高精度和
輕量級 等不同方向的大量高質量分割模型。通過模組化的設計,提供了配置化驅動和API調用等兩種套用方式,幫助開發者更便捷地完成從訓練到部署的全流程圖像分割套用。
PaddleOCR
飛槳文字識別開發套件PaddleOCR,旨在打造一套豐富、領先且實用的OCR工具庫,開源了基於PP-OCR實用的超輕量中英文OCR模型、通用中英文OCR模型,以及德法日韓等多語言OCR模型。並提供上述模型
訓練方法 和多種預測部署方式。同時開源文本風格數據合成工具Style-Text和半自動文本圖像
標註工具 PPOCRLable。
PaddleGAN
飛槳
生成對抗網路 開發套件PaddleGAN,集成風格遷移、超解析度、動漫畫生成、圖片上色、人臉屬性編輯、妝容遷移等SOTA算法,以及預訓練模型。並且
模組化設計 ,以便開發者進行二次研發,或是直接使用預訓練模型做套用。
PLSC
飛槳海量類別分類套件PLSC,為用戶提供了大規模分類任務從訓練到部署的全流程解決方案。提供簡潔易用的高層API,通過數行代碼即可實現千萬類別分類神經網路的訓練,並提供快速部署模型的能力。
ElasticCTR
飛槳
個性化推薦 開發套件ElasticCTR,可以實現分散式訓練CTR預估任務和基於Paddle Serving的線上個性化推薦服務。Paddle Serving服務化部署框架具有良好的易用性、靈活性和高性能,可以提供端到端的CTR訓練和部署解決方案。ElasticCTR具備產業實踐基礎、彈性調度能力、高性能和工業級部署等特點。
Parakeet
飛槳語音合成套件,提供了靈活、高效、先進的文本到語音合成工具,幫助開發者更便捷高效地完成語音合成模型的開發和套用。
豐富的工具組件
AutoDL
飛槳自動化深度
學習工具 ,旨在自動網路
結構設計 ,開源的AutoDL設計的圖像分類網路在CIFAR10數據集正確率達到 98%,效果優於目前已公開的10類人類專家設計的網路,居於業內領先位置。(
數據來源 :
內部測試 10種網路分別為:vgg_15_BN_64、vgg_16、resnet_32、resnet_56、resnet_110、resnet_v2_bottleneck_164、wide_resnet、densenet_BC_100_12、resnet_29_8x64d、shake_shake_64d_cutout,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考)
PARL
飛槳深度
強化學習 框架PARL,在2018、2019、2020奪得強化學習挑戰賽
三連冠 。具有高靈活性、
可擴展性 和高性能的特點。實現了十餘種主流強化學習算法的示例,覆蓋了從單
智慧型體 到
多智慧型體 ,離散決策到
連續控制 不同領域的強化學習算法支持。基於GRPC機制實現數千台CPU和GPU的高性能並行。
PALM
飛槳多任務學習框架PALM,一個靈活、通用且易於使用的NLP大規模預訓練和多任務學習框架,旨在快速開發高性能NLP模型的上層框架。使用PALM可以非常輕鬆靈活的探索具有多種任務輔助訓練的“高
魯棒性 ”閱讀理解模型,基於PALM訓練的模型D-Net在EMNLP2019國際閱讀理解評測中奪得冠軍。
PaddleFL
飛槳聯邦學習框架PaddleFL,研究人員可以很輕鬆地用PaddleFL複製和比較不同的聯邦學習算法,便捷地實現大規模分散式集群部署,並且提供豐富的橫向和縱向聯邦學習策略及其在
計算機視覺 、
自然語言處理 、
推薦算法 等領域的套用。此外,依靠著飛槳的大規模分布 式訓練和Kubernetes對訓練任務的彈性調度能力,PaddleFL可以基於全棧
開源軟體 輕鬆部署。
PGL
飛槳圖學習框架PGL,業界首個提出通用訊息並行傳遞機制,支持百億規模巨圖的工業級圖學習框架。PGL基於飛槳動態圖全新升級,極大提升了易用性,原生支持異構圖,支持分散式圖存儲及
分散式學習 算法,覆蓋30+圖學習模型,包括圖語義理解模型ERNIESage等。歷經大量真實
工業套用 驗證,能夠靈活、高效地搭建前沿的大規模圖學習算法。
Paddle Quantum
PaddleHelix
飛槳
螺旋槳 生物計算 框架PaddleHelix,開放了
賦能 疫苗設計,新藥研發,
精準醫療 的AI能力。在疫苗設計上,PaddleHelix的Linear
RNA 系列算法相比傳統方法在
RNA摺疊 上提升了幾百上千倍的效率;在新藥研發上,PaddleHelix提供了基於大規模數據預訓練的分子表示,助力分子性質預測,
藥物篩選 ,
藥物設計 等領域;在精準醫療上,PaddleHelix提供了利用
組學 信息精準定位藥物,提升
治癒率 的高性能模型。
PaddleHub
飛槳預訓練模型套用工具PaddleHub,覆蓋文本、圖像、視頻、語音四大領域超過200個高質量預訓練模型。開發者可以輕鬆結合實際業務場景,選用高質量預訓練模型並配合Fine-tune API快速完成
模型驗證 與套用部署工作。適用於個人開發者學習、企業POC快速驗證、參加AI競賽以及教學科研等多種業務場景。
PaddleX
飛槳全流程
開發工具 PaddleX,以低代碼的形式支持開發者快速實現深度學習算法開發及產業部署。提供極簡Python API和可視化界面Demo兩種開發模式,可一鍵安裝。針對CPU(OpenVINO)、GPU、
樹莓派 等通用硬體提供完善的部署方案,並可通過
RESTful API快速完成集成、再開發,開發者無需分別使用不同套件即可完成全流程模型生產部署。
可視化推理 界面及豐富的產業案例更為開發者提供飛槳全
流程開發 的
最佳實踐 。
VisualDL
飛槳可視化分析工具VisualDL,以豐富的圖表呈現訓練參數變化趨勢、
模型結構 、數據樣本、高維數據分布、精度召回曲線等模型關鍵信息。幫助用戶清晰直觀地理解深度學習模型訓練過程及模型結構,進而實現高效的模型調優、並將算法訓練過程及結果分享。
PaddleCloud
飛槳雲上任務提交工具,能夠幫助您一鍵發起深度學習任務,為您提供快速打通雲上
計算資源 通道,支持您快速發起單機/分散式飛槳核心框架訓練任務,致力於推動AI套用更廣泛地落地。
AI學習與實訓社區
AI學習與實訓社區,面向教育和學習場景,集開放數據、開源算法、免費
算力 於一體,為開發者提供高效易用的學習和
開發環境 、豐富的體系化課程、海量開源實踐項目、以及高價值的Al競賽,並提供教育版支撐高校和機構老師輕鬆實現Al教學,助力深度學習人才培養。目前AI Studio平台上已累計了80多萬開發者、80多萬的樣例工程和數據集、5000多精品
課程內容 、80餘場AI競賽,並提供海量免費GPU算力資源。
飛槳企業版針對企業級需求增強了相應特性。包括提供更全面和強大的功能、更易用的可視化界面,預置更豐富的
場景模型 ,提供更強化的安全
許可權管理 等。
相對於同類平台而言,飛槳企業版具有
自主可控 的底層飛槳開源框架支持,預置百度積累的大規模數據訓練而成的高精度預訓練模型,全面支持安全高效的公有雲和可靈活支持私有化或本地部署。數據更安全、部署更靈活、訓練精度更高、集成更便捷,讓各類企業享受高質量的一站式
AI開發 服務。
飛槳企業版包含EasyDL零門檻AI
開發平台 和
BML 全功能AI開發平台:
套用落地
中國商飛
針對項目落地面臨的數據量少、套用場景複雜、檢測精度要求高,以及AI開發能力薄弱等問題,商飛北研中心利用百度飛槳PaddleSeg開發套件順利完成了複合材料檢測算法的開發。首先,開發人員使用PaddleSeg集成的數據增強工具,結合
航空複合材料 超聲
圖像數據 的特徵,輕鬆完成了數據大規模擴張;然後,通過對PaddleSeg官方提供的預訓練模型U-Net和Deeplabv3進行訓練、測試和多維度結果分析,選用了跟業務場景更契合的經典模型U-Net完成語義分割;最後,利用PaddleSeg提供的完善的
配置檔案 ,非常便捷快速地完成了部署上線。
流程完成了智慧型化改進後,全流程用時僅5.3分鐘,檢測工時減少71%,
準確率 提升至95%,單批次試驗
人工成本 減少21.63萬元。有效減少了檢測人員工作量,極大地縮短了複合材料
超聲檢測 時長,有效加速了型號研製疊代速度,實現了勤儉研製大飛機的
企業目標 。
測試集推理結果示例
動力電池高精度質量檢測
作為動力電池製造龍頭企業,
寧德時代新能源科技股份有限公司 動力電池產量大、質檢嚴,僅
新能源車 領域需要檢測的參數就超過了3000個。為了保證電池品質,寧德時代要求產品線上的電池達到缺陷
漏檢率 小於1DPPB、單張產品圖像
缺陷檢測 平均時長<2ms檢測標準。但動力電池缺陷種類複雜且差距小,想要通過傳統質檢方法達到
安全生產 要求,需要耗費大量的人力財力:一條流水線就需要十幾個質檢工人,而且不同的生產線標準不一樣,需要人工逐個確認。
為了解決產業難點,寧德時代通過百度飛槳深度最佳化過的PP-YOLO和ResNet系列算法,提升了算法精度;通過調整預測Batch,採用多執行緒數據預處理、最佳化數據記憶體拷貝時間等策略,提升了檢測精度及預測效率,使其充分適應實際生產需求。
採用電池質量智慧型化檢測後,部分工序已經運用人工智慧算法進行升級,整體
產品檢測 相較於原本的傳統檢測算法過殺率降低了66.7%,缺陷漏檢率小於1DPPB。算法
泛化能力 和在多產線上進行遷移部署的效率也得到了全面提升。不僅進一步保障了寧德時代的動力電池質量,也在一定程度上實現了低成本高效復用經驗,大大降低了產線
研發成本 。
套用效果
5G智慧型園區車輛行為識別
隨著
物聯網 設備連線和互動能力的大幅提升,園區車輛
管理能力 再次成為
物流行業 的主要瓶頸。採用傳統的本地化監控系統,不僅監控位置不直觀、無法雲端觀看,還需要配備高頻次的人工巡檢。異常
處理時間 長、
作業效率 低、人工失誤不可避免。
京東物流運用飛槳PaddleDetection、PaddleSeg和PaddleSlim等開發套件,設計了一套完備的CV
監控方案 ,實現了車輛智慧型化管控。通過目標檢測和OCR來識別車牌、檢測車輛(進入/離開園區),並針對貨運車輛車牌形態多樣化,採取數據增強方式確保樣本覆蓋現有業務場景。在用目標跟蹤和狀態識別來
監控車輛 狀態的任務場景中,針對遇到的問題,
研發團隊 將多路攝像頭數據在訓練階段就混入了單模型的
訓練數據 中,提高了目標跟蹤過程的
精確度 ;在狀態識別過程中,充分考慮時序特徵,提高了最終的識別精確度。
升級為可遠端
高清直播 、可
自動分析 異常的智慧型化監控系統後,京東物流的車牌
識別率 大幅提升,人員、場站、生產、監控、巡檢五大領域管理能力實現了全面提升,迎來了從“被動型
傳統管理 ”到“主動型智慧型管控”的巨大轉型,降低了人工誤差的同時,有效提升了作業效率。
套用效果
OPPO自2018年起開始大舉進軍
網際網路業務 ,創立了
信息流 、
信息流廣告 、
套用商店 、遊戲中心、商業中心等諸多
業務線 ,並迅速積累了大量的用戶和數據。由於業務規模的急劇擴張, OPPO原來在單機上搭建的訓練系統不具備處理大規模數據和訓練大型推薦系統的能力,嚴重製約了網際網路的業務發展,急需更好的框架體系來滿足
業務方 對於模型訓練速度、效果指標增長的需求。
基於飛槳的能力對套用商店進行了升級:採取高性能數據讀取接口Dataset完成大規模數據的讀取;採用基於參數伺服器的大規模CPU分散式的全異步訓練模型,以較低的資源消耗來訓練海量的數據以及極大的稀疏參數。
性能強:全異步大規模訓練集群規模,業務模型訓練速度提升效果顯著;
參數規模大:Embedding規模&模型擴大數倍;
效果好:在多個場景(廣告,信息流等),線上關鍵指標提升效果顯著;
性價比高:參數伺服器訓練,大幅度減少記憶體開銷。
套用效果
南網科技
機器人安全巡檢
電能從生產到消費要經過發、輸、變、配、用五大環節,任何一個環節出問題,都會影響到電能的正常供應。其中,
輸變電 是電能通過電網傳輸的重要部分。電力巡檢的核心
工作內容 ,就是對輸變電設備進行運維,以確保其正常工作,保障
電力系統 的安全運行和電能的穩定供應。
南方電網電力科技股份有限公司 的技術攻關團隊引入飛槳開源深度學習框架,利用飛槳團隊實現的高性能目標檢測算法YOLOv3及語義分割算法U-Net,使機器人面向表計的深層次
特徵提取 能力大大提高,突破了
環境因素 的制約,方法的準確率和魯棒性顯著提升,在表計目標檢測、
示數 讀取等方面的效果尤為顯著。
在基於飛槳的錶盤檢測及錶盤分割項目中,錶盤檢測的最高mAP達到了0.9857,總體的讀數±2°誤差內準確率高達99.01%。藉助深度學習賦能的變電站智慧型裝備(機器人),人工巡檢耗時大幅減少。原來需要6小時才能完成的巡檢工作現在只需花10分鐘進行讀數覆核即可,實現了基於準實時自動巡檢的變電站智慧型運維。
套用效果
度小滿
網際網路金融 快速發展,每天在平台上會發生數以萬計的借貸、還款等行為。傳統人工處理不僅對從業審核人員要求非常高,而且效率、審核標準的統一性也無法保證。傳統的風控建模技術是基於小樣本的
監督學習 ,依賴於特徵挖掘,需要耗費大量人力且依賴個人經驗;傳統技術對於小樣本的文本類數據處理往往缺乏
上下文 的理解,未能提取其重點,導致對用戶的理解出現偏差。
百度自研知識增強語義理解框架ERNIE,充分利用
海量數據 和飛槳多機多卡高效訓練優勢,通過
深度神經網路 與多任務學習等技術,持續學習海量數據和知識,助力各NLP任務效果顯著提升。目前,百度對外發布基於該框架的ERNIE 2.0預訓練模型,該模型累計學習10億多知識,刷新16箇中英文NLP任務效果。
在度小滿風控場景中,利用ERNIE對業務信息進行語義層面深度建模,結合風控少量訓練數據進行精細Fine-tune,在較短的時間內即可完成
風控模型 的收斂並且具備更好的泛化能力。
度小滿金融 風控模型KS相對提升約6.35%,AUC相對提升超過1.55%,用戶排序最佳化約 21.5%。
三行科技
對項目標的主體公司的
風險評估 是金融機構開展業務的起點,而標的公司財務
數據分析 是量化評估業務風險的基礎。三行公司發現採用傳統人工的方式進行財務數據分析,不僅會耗費高額的
人力成本 ,而且人工錄入效率低、錯誤率高等特點,更是會給業務帶來不可預知的風險和損失。但想通過機器識別代替人工也並非易事,項目面臨著開發困難、精度要求高等一系列難題。
三行科技藉助飛槳開源深度學習平台的PaddleOCR工具輕鬆完成了審計報表(股票、
債券市場 公開披露的掃描版)的文字識別。首先,基於U-Net模型對表格線進行檢測,劃分出可見橫豎線和不可見橫豎線;然後,基於FastText進行科目標準化,解決報表科目表述不一致的問題;最後,通過CRNN解碼過濾無效字元,進一步提升精度(如有印章可先利用Noise2Noise去除)。
三行科技藉助PaddleOCR開發的文字識別算法,在文字檢測
召回率 上較之前算法提升5%,檢測速度提升30%,實現
財務報表 科目和金額的高效識別,成功完成了財務數據的結構化存儲,為後續多項
業務過程 提供數據基礎。
套用效果
連心醫療
腫瘤 治療中,醫生需要親自勾畫病灶區域(即
靶區 )來進行
精準放療 ,這一步驟決定了
放療 質量的60%。但這一工作通常需要基於不同部位的50-200張不等的
CT 或
MRI 二維影像中勾畫出三維立體靶區,不同的醫生會因為主管
評價標準 的差別使得勾畫範圍的結果差異較大,給這一步驟增加了許多不確定性,導致診療效率低下。
連心醫療基於飛槳語義分割套件PaddleSeg中的U-Net語義分割網路開發了基於CT和MRI
多模態 影像的鼻咽癌病灶靶區自動勾畫系統,基於放療醫生勾畫的CT/MRI
多通道 影像建立數據集,採用
圖像裁剪 和增強等預處理方法提升數據集的質量,採用假陰假陽的後處理抑制,最後採取
邊緣檢測 得到勾畫結果。
項目完成後,系統的精度達到醫生勾畫水平,並可以快速自動地勾畫出三維靶區,提供更精準的放療規劃方案,
輔助放療 臨床醫生 高效診療。
套用效果
更多案例
耕地地塊提取
傳統對
遙感圖像 的處理,依賴於大量擁有遙感專業背景的人工使用專業軟體進行分析。
衛星遙感 影像數據 存在畫幅巨大、肉眼解析度低、對識別人員專業要求能力高等問題,且人工標註需要大量重複勞動,非常費時費力,枯燥無味。
中科賽諾(北京)科技有限公司 基於飛槳的自動農耕地塊提取系統,可快速自動獲得農耕用地邊境及面積,從而達到進行有效的估產並輔助相關其它農事活動。套用飛槳 Deeplab V3實現
地塊面積 提取準確率達80%以上,對作物長勢、作物分類、成熟期預測、災害監測、估產等工作進行高效輔助,大大減少了傳統人力的投入。
桃子分揀機
智慧型
桃 子分揀機集成了圖像分類模型,將桃子智慧型分類模型訓練、
機械自動化 採集
樣本數據 ,完成桃子分揀自動化。提升桃子分揀準確率至90%以上;節省90%人力成本,每年為桃農直接節省近3萬元。(數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考。節省
費用估算 公式為人工勞務單日費用*工人數-設備成本開銷)
碩橙機器聽診大師
碩橙將飛槳用於
機器設備 噪聲識別,實現了設備
生產量 的實時統計,並評估設備的
運行狀態 。對於生產量統計,先將噪聲分解為多個維度的
機械運動 特徵量,然後截取一定長度的數據,送入一個深度神經網路,特徵量波形識別為
機械設備 的動作,從而實時判斷設備的生產量。
對於運行狀態的評估,仍然是先將噪聲分解為多個維度的機械運動特徵量,然後根據前述生產量統計套用得到的
生產周期 ,將一個生產周期內的全部特徵量構建成一個在
高維空間 中的分布,並根據
歷史記錄 尋找絕大部分樣本集中的區域
包絡面 ,最後使用One class SVM方法對每一次生產周期進行評分,實時給出整體運行狀態評價。
3D智慧型抓取機器人
矩視智慧型研發的缺陷
檢測系統 在飛槳的AI Studio環境下,將飛槳提供的圖像檢測模型與自主研發的算法相結合,對
鍵槽 軸心外觀
齒部 冷鍛 傷類型缺陷進行檢測,保證缺陷檢測系統準確率的同時,大大提升了
圖像處理 的速度。每齒輪檢測時間<300ms/幀,
連續運行 100次,誤判率≦1%。
瓷器及地板表面質量檢測
(數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考)
在合金熔煉的過程中,
合金元素 會根據爐內溫度、熔煉時間等因素髮生無法用機理進行判斷和解釋變化,傳統合金熔煉環節大多由有經驗的師傅進行補料,需要多次實驗和調整,廢料廢時。
精諾數據基於百度深度學習平台飛槳,研發了IAPBOA算法,利用歷史配料
數據建模 ,實現智慧型化計算。通過機器學習最佳化企業個性化配料方案,最終達到生產質量和
生產成本 的有效平衡點,從而指導熔煉生產,減少對經驗的依賴,達到提升熔煉效率、節省原材料的效果。
樓宇設備工況運行調控依賴人工, 而運維專業水平不齊,
運行效率 不高,導致能源浪費、無法及時根據外界
環境變化 來調整系統輸出,樓宇內
用戶體驗 不好。
百度科技園 將基礎運行積累的大數據與深度學習算法結合起來,提高了
機電系統 運行效率,完善
日常保養 策略,提供故障預警、保養提醒功能,實現智慧型運營。目標樓宇日均節電20%+,年節電約100萬度,節約電費30%+,有效提升樓宇運營效率。
AI控煙
在2018年
世界無菸日 ,百度科技園發起AI控煙公益項目,由百度工程師用飛槳的目標檢測模型成功識別下沉廣場的吸菸者,在廣場大螢幕給吸菸者實時傳送健康提示。該項目基於百度飛槳開源平台的深度學習能力,
對數 萬張吸菸動作圖片進行了43次深度學習模型訓練,可實現對吸菸動作的識別,通過視頻監控的數據從人群中識別出正在吸菸的人,將其圖像提取並標註保存。
4. 智慧型零售
生鮮進貨量智慧型預測
由於生鮮產品
保質期 極短,需要豐富的進貨經驗才能降低貨物過期報損率,然而店長經驗參差不齊,無法保證準確預估全部店鋪的進貨量。
通過利用商超生鮮的歷史銷售數據,從位置、時段、節假日、天氣等維度,提取出多個影響銷量的條件,使用DNN神經網路到建立銷量
預測模型 ,比店長預測更為準確,整體報損降低30%+、模型進貨
淨利潤 較店長進貨提升約20%。
智慧購物解決方案(以圖搜商品)
隨著
消費網際網路 流量紅利的逐漸殆盡,
移動網際網路 的主戰場轉向
產業網際網路 ,
家居行業 3D數位化進程高歌猛進,行業開始沉澱下了大量的與真實商品對應3D模型數據,如何套用真實商品的3D數據的多維度特點,來改善消費者的購物體驗具有重要意義。但如今,線下
實體店 仍然占據部分銷售額,線上流量無法直接轉化成
消費行為 是行業中的一大痛點。如何將
線上線下 的優勢結合,
最佳化資源配置 ,快速實現線下家居實體業的進化,成為家裝
企業發展 的重中之重。次元視界套用Faster
R-CNN 模型實現
2D 圖像的特徵提取,再生成3D模型,達到了模型
輪廓識別 準確率達到89%,FPR降低了32%,顯著的提升了套用效果。
5.智慧型推薦
雲腦科技使用飛槳搭建的Gated Model(GQM),是基於CNN、DSSM、C-DSSM等算法的文本匹配模型。GQM在上述模型架構的基礎上,最佳化了全局
語義特徵 的提取,以及查詢文本於候選匹配文本的語義特徵互動,進而達到更快速、單文本上下文特徵提取範圍更廣、文本對語義特徵互動最佳化、同時高準確匹配的效果。
綜合企業 需求與求職者的簡歷數據,實現企業與求職者雙方需求的高效率匹配。項目現運用於雲腦的合作夥伴
實習僧 的項目中,實現面試邀約成功率提升5倍。(數據來源:內部估算結果,計算方式一定時間內使用簡歷職位智慧型匹配系統後面試邀約平均成功率除以使用簡歷職位智慧型匹配系統之前的面試邀約平均成功率)
智慧型零件分揀機
零部件的質量,決定了
工業裝備 的整機性能。但是,由於小零件的數量龐大,人工執行質量檢測與分揀的效率低、成本高,迫切需要引入
智慧型機器 對人力替代。在此背景下,領邦智慧型面向市場推出了智慧型零件分揀機。
領邦 基於百度深度學習平台飛槳訓練CNN分類
網路模型 ,讓分揀機能夠自動學習良品和缺陷品的分類特徵,並對工件圖像實時做出自動判別與分類。智慧型分揀機能夠高效、準確識別零件種類與問題,檢測速度可達20ms/件。機器可以在精度上與人工檢測持平,同時在質檢速度上大幅提升。根據測算,一台檢測機器可以代替十多位熟練質檢工人,能夠幫助企業降低15%的生產成本。另外,分揀機的套用具有較好的拓展性,可支持數十種形狀各異、高精密的小零件分揀。
整合醫生專家的診斷邏輯,基於飛槳平台構建深度學習模型,對標註好的甲狀腺結節圖像進行訓練,抽取
圖像特徵 ,從而判定甲狀腺結節的良惡性,實現甲狀腺圖像智慧型識別系統,輔助醫生進行診斷。
智慧型醫療輔助診斷系統(AIMADS)
AIMADS可用於常見
皮膚病 和
腦腫瘤 的輔助診斷,用戶可通過在客戶端上傳患處圖片到伺服器,伺服器端通過本團隊設計的診斷算法在飛槳平台對上傳數據進行分析,在 APP 中顯示診斷結果。
8.趣味生活
猜拳機
2018年7月,小度猜拳手通過使用深度卷積神經網路
技術訓練 出能夠識別用戶出拳結果的模型,該模型可以識別石頭、剪刀、布的手勢。在用戶出拳過程中,系統會不斷採集用戶的手勢圖片,通過飛槳實時預判人的出拳機率。
9.社科類
當前學術界意識到了瀕危語言問題的重要性,積極倡導各國
語言學家 對本國語言、尤其是瀕危語言加以關注,並採取具體的行動進行
口語記錄 、語言典藏。2003年英國
倫敦大學 開展了對全球瀕危語言進行深度典藏的國際項目,2004年中國開始參與到項目之中,中國社會科學院民族學與人類學研究所的徐世璇教授作為中國參與國際瀕危語言典藏項目的負責人人,負責包括土家語的保存等重要項目。社科院利用飛槳實現了針對土家語預料的
標音 及意譯,算法準確率已經達到了約70%,達到人工標註水平,且效率提高了幾個
數量級 。在當前全球瀕危語言保護工作中起到了重要作用。
以上所有數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考。
社區與生態
PPDE | 飛槳開發者技術專家計畫
飛槳開發者技術專家計畫(PaddlePaddle Developers Experts)是飛槳社區為開發者提供的榮譽認證體系,支持開發者踐行開源理念,引領技術潮流,共建繁榮社區,通過技術成長與社區貢獻進階,開發者可以成長為PPDE、高級PPDE及資深PPDE,並且享受多樣頂級權益:
專享服務權益: 專人技術支持,技術大賽輔導等,助力技術成長與項目落地
PPDE大禮包: PPDE成員專享的神秘禮包,包含一系列個人身份認證與禮品
個人品牌打造: PPDE專屬身份認證、網頁展現、項目宣傳及相關活動擔任主講
官方活動主推: Wave Summit及百度其他技術峰會講師邀約
技術大咖交流: 獲得與技術大咖面對面交流的機會
PPDE Club: 定期與飛槳產品技術團隊面對面交流需求,對產品提出意見建議
全球技術遊學: 贊助前往國際國內頂會,作為百度開發者代表進行交流
頂級項目支持: 贊助具有重大科研價值或社會公益價值的項目
PPDE計畫迄今已有100多位成員,此計畫面向全球套用飛槳的技術
極客 、
開源項目 貢獻者、高校教授、技術博主、暢銷書作家等發出邀請,只要滿足以下3項條件之一,即可提交申請:
技術成果 :套用飛槳產出至少2篇優質技術文章或
視頻教程 ;或套用飛槳產出並開源至少4個優質項目;或在GitHub為飛槳至少提交過4次
PR
開源實踐: 樂於為飛槳
開源社區 的發展貢獻力量,成為至少2次線上/線下技術分享的主講人,積極為其它成員答疑解惑
其它: 包括不限於在實際場景中落地飛槳技術並開源項目、套用飛槳參加大賽取得優異成績並將項目開源、寫作飛槳套用實踐相關暢銷書籍、在高校開設飛槳
相關課程 等
飛槳開發者的興趣社區,為開發者們提供豐富的本地技術沙龍、Meetup及線上交流平台。飛槳
領航團 已建立150個社群,覆蓋29個
省級行政區 ,133個高校。歡迎開發者們加入領航團,結實更多本地技術同好,共建開源社區,共享開源成果與快樂。
官方學習資料:實時提供飛槳最新的學習資料及直播課程等
最新技術資訊:實時提供產業落地案例、產品功能升級、產業動態等一手資訊
線上線下活動:組織豐富的線上線下活動,包括黑客馬拉松、圓桌論壇,技術大咖交流、開發者meetup等
技術支持:為開發者的項目開發提供官方團隊及社區的技術支持
通過開放的社區形式與全球的開發者共同構建一個開放、多元和架構包容的生態體系。目前已建立的PP SIG包括計算機視覺、推理部署、工具效率組件等多個技術方向等。
飛槳特別興趣小組
飛槳博士會 | 100+博士已加入
中國深度學習俱樂部,助力會員交流
前沿科技 ,拓展行業高端人脈
核心開發者交流圈: 飛槳博士會成員皆為博士及以上學歷,具備深度學習多年研究和實踐經驗
線下高端技術沙龍: 定期舉辦,百度核心研發工程師主講深度學習前沿技術,與會員研討最新研發成果
科研合作資源支持: 博士會員如在科研中使用飛槳,可優先獲得 GPU算力、飛槳研發團隊技術支持等
商業生態優先合作: 博士會員所在科研院所或企業如有合作需求,可優先享有飛槳商業合作諮詢服務、飛槳研發團隊技術支持等特權
百度AI競賽 | 以賽引才、以賽促用、以賽興業
飛槳承辦了80餘場國內外大型AI賽事。賽題方向覆蓋人工智慧技術前沿領域,致力於打造全球領先的AI賽事,聚才興業,推動智慧型經濟發展。
飛槳開放多年辦賽先進經驗,提供一站式專業辦賽服務支持,誠邀各機構、公司、院校等合作夥伴,共同舉辦具有影響力的AI賽事。
專業辦賽服務支持:開放豐富辦賽經驗,提供一站式比賽管理平台,包括賽事發布、線上組隊、自動化評測及排名更新等功能,助力主辦方實時監控比賽數據,掌握比賽動向。
GPU算力支持:飛槳AI Studio提供線上開發環境,比賽專屬Tesla V100 GPU算力補貼,破除選手算力桎梏。
百度系全棧流量曝光:專業賽事宣傳服務,社群定向開發者邀約,最大化賽事影響力。
技術支持及人員線上培訓:飛槳技術專家坐鎮指導,提供全流程辦賽技術支持;資深比賽隊員線上分享大賽經驗。
AICA-首席AI架構師培養計畫 | 閉門小班,為中國產業界培養高端複合型AI人才
專注於深度學習產業落地套用,與百度最有經驗的AI專家閉門學習、研討,助力企業跨越鴻溝
頂尖師資:百度深度學習T10+架構師面對面深度交流,培育極其稀缺的產業+AI複合型人才
案例剖析:剖析百度AI業務及生態夥伴企業中,業務與深度學習結合的典型案例,舉一反三
經驗解鎖:授課老師、指導專家、助教三師制全程指導,解鎖百度核心業務中深度學習落地的關鍵技術
產業創新:企業AI項目一對一研討,助力企業形成AI方法論,解決實際業務問題,挖掘智慧型化新機遇
AI私享會 | 深入行業,定向研討,產研專家交流碰撞的高端沙
聚合產業精英與AI技術專家,破解行業技術難題,洞察未來發現機遇
AI快車道 | 支持10000家企業智慧型化升級
行業案例:匯聚行業場景真實案例,在多個案例的通用性和差異性中萃取行業技術經驗
技術詳解:結合飛槳產業級AI開發工具,詳細解讀深度學習開發全流程的技術方法和性能優勢
即學即用:深度學習,簡單開發,通過課程講解+答疑交流+課件材料深入淺出的指導快速開發
全國巡迴:過去2年已完成8個城市30餘場線下課程,2021將繼續開展高頻次的城市交流
飛槳技術夥伴計畫 | 全方位賦能夥伴企業深度學習
技術能力 提升,共享AI未來
以技術賦能為宗旨,產業落地為目標,助力合作夥伴客戶規模化落地
聯合研發:共同打造行業深度學習技術方案,提高項目交付質量
專項支持:合作夥伴專人對接,重要項目技術專家專項支持
官方推廣:優秀夥伴及案例可獲得飛槳官網等多平台展示推廣機會
業務支持:優質創業企業給予上下游產業資源、戰略投資等方面的資源支持
教育生態
深度學習7日打卡營
通過7日短平快的線上打卡學習,幫助開發者快速掌握深度學習技術
通過3-4個月的系統學習,助力開發者
零基礎 入行深度學習
豐富線上實戰課程
包含5000+小時AI深度學習實戰課程,不同開發者輕鬆找到匹配的學習路徑
豐富線上實戰課程
飛槳啟航計畫:攜手高校、破浪前行
預計總投入5億元
深度合作高校院所500所
聯合打造5000人專業教師隊伍
聯合培養50萬AI未來人才
AI人才產教融合培養方案
飛槳在
人工智慧 技術以及行業深入探索,力爭為高校提供一套涵蓋
教學體系 、
教學大綱 、教學方案、教材、教學教研產品等完整的、全流程、全體系的AI人才產教融合培養方案。著力為推進高校快速建立人工智慧專業及人工智慧人才培養和就業提供
生態環境 ,包括教學、科研、人才拓展、套用場景等多個方面的
服務體系 ,涵蓋機器學習、計算機視覺、自然語言處理、
語音識別 等多個領域,將項目套用開發和教學科研緊密結合,打造覆蓋人工智慧全行業的高質量複合型、創新型、
套用型人才 。
AI人才產教融合培養方案
高校教學支持計畫
提供
四位一體 的課程共建方案,支持200+高校開設人工智慧課程
師資培訓:新工科聯盟第一個深度學習師資培訓班,技能全方位提升
開課禮包:全套課程體系、課件PPT、實踐案例、教學視頻、專業教材
實踐平台:免安裝的實踐環境,完善的班級管理功能,免費的GPU資源
協同育人:支持高校實踐創新、教學創新,基金累計發放超過200萬元
飛槳高校深度學習師資培訓班
在教育部指導下,百度飛槳與全國重點高校聯合打造的深度學習
師資培養計畫 師資培養:已開辦15期師資培訓班,培養了2000+名深度學習專業教師
實踐導向:高強度代碼實踐,教師技術水平72小時飛躍式提升
教學研討:開課思路與教學法研討,從輸入到輸出,解鎖高校AI教學新思路
企業師資入駐
派駐企業師資,融入企業育人實踐,貫穿
學生成長 全過程。通過開設特色實踐課程、提供高質量的實踐及前沿指導,將產業理念、技術、
資源整合 到培養體系、課程及實訓中,最大程度共享及最佳化配置產教資源,培養高素質和具有產業套用視角的
創新人才 。
高校相關賽事
此外,還有
西安交通大學 國際大數據競賽、
百度之星 開發者大賽等熱門賽事,每年均會吸引海內外多所名校學子共同參與!
AI Studio教育版
提供領先的
教學管理 與實訓平台,深入促進實踐型AI人才培養
線上教學環境:雲端集成免安裝,線上聯網,便捷易用
免費算力支持:CPU/GPU 資源免費提供,降低高校開課門檻
內置教學實驗:豐富教學實驗案例,從入門到進階,一應俱全
實用教學管理:完備實用的教學管理功能,助力專業課堂教學
深度學習工程師能力認證
2020年,為了助力深度學習工程師的職業發展,百度飛槳和Linux Foundation開源大學合作推出國內首個深度學習工程師聯合認證。本次聯合認證全稱為 Certified
Open Source Officer & Deep LearningEngineer Associate,從名稱上可以看出,本次雙認證不僅注重開發者在深度學習方面的技術能力,也對開發者的開源
基本能力 提出了一定的要求。現已開通人才招募“綠色通道”,通過認證的開發者將獲得認證標籤並被納入AI專項
人才庫 ,百度AI技術崗位可以免筆試應聘,相關生態
合作企業 技術崗位也可優先錄用。
國家工程實驗室
WAVE SUMMIT深度學習開發者峰會
WAVE SUMMIT深度學習開發者峰會由深度學習技術及套用國家工程實驗室與百度聯合主辦,會上,來自百度、
英特爾 、華為、清華大學、北京航空航天大學等公司及高校的科學家及人工智慧專家共同探討深度學習時代的技術方向及產業前景,同時,深度學習平台飛槳發布多項新特性及服務,為深度學習開發者提供利器。
億元算力支持計畫
2019年4月23日,在首屆WAVE SUMMIT 2019深度學習開發者峰會上,百度宣布了AI Studio算力支持計畫,開放價值近億元
人民幣 的免費算力資源,助力開發者成功。免費算力主要以兩種模式提供,第一種是一人一卡模式,V100的訓練卡包括16G的顯存,可達2T的
存儲空間 。另外一種是遠程集群模式,飛槳提供
高性能集群 ,供開發者免費使用,登入AI Studio即可使用。
所獲榮譽
2020年9月,百度飛槳獲2020年服貿會“
科技創新 服務示範案例”。