簡介
內容是指各種類型文檔中包含的數據,其中以非結構化數據為主(如文本、
圖像、音頻、視頻等)。企業內容管理,即Enterprise Content Management(ECM)是指一種戰略和方法幫助企業獲取、管理、存儲、保護、利用與企業組織流程相關的數據(這裡所指的數據主要指非結構化數據)。
定義
企業內容管理系統(ECM系統)與ERP、OA、CRM、HRMS一樣屬於一種軟體類型。 國內ECM系統軟體領域包含了如企業網盤、文檔管理、知識管理、檔案安全交換外發,檔案管理、影像檔案管理,電子文檔安全管理、文檔雲、ISO質量檔案體系管理、GMP質量檔案體系管理、非結構化數據管理平台、工程設計協同內容管理以及與NLP自然語言處理,知識圖譜相關的AI產品和套用。ECM系統幫助企業內容管理戰略落地。通過內容的獲取,管理、存儲、保護、利用等挖掘和放大內容價值,最終幫助企業數位化轉型並獲得商業洞察和長遠競爭優勢。
結構化數據、非結構化數據與ECM的關係
由於企業外部壓力和內部驅動力,組織創建、管理、傳播和利用企業內容的方式在不斷改變。這在一定程度上體現出企業內容管理技術的演變歷程:從以集中式後端管理為主的軟體形式、轉變為分散式、服務導向的平台模式。2016 年,Gartner修正了ECM(企業內容管理)的定義:ECM(企業內容管理)是一種服務平台,可以分為CCP(內容協作平台)、CSP(內容服務平台)和數字型驗平台(DXP)。
核心技術
ECM底層架構技術
現代化的ECM需要滿足各種規模與場景下的國際化和集團化的部署:包括集群架構、分區域架構、聯邦架構、混合雲架構。同時要支持P級的分散式對象存儲並實現冷溫熱分層、自我恢復。同時支持10億級海量小檔案的極速定址。目前領先的ECM系統底層架構基於微服務和容器化的雲原生(Cloud Native)技術實現。
能夠滿足非結構化數據服務的技術
內容服務包括不同格式檔案轉檔與預覽服務、上傳下載線上編輯等檔案操作類、文檔許可權類、內容搜尋等,主要技術包括:CSB內容服務匯流排技術,滿足所有服務消費可視化、可計量和可調度;Metadata元數據技術,元數據建模、元數據策略、元數據套用和元數據安全等。可視化數據採集技術,實現與各種套用系統融合。內容數據匯聚一起,經治理後以WebAPI等標準內容服務方式輸出。
非結構化數據安全技術
數據存儲安全:基於數據塊和多副本技術的數據融災保障。數據使用安全:通過細顆粒度訪問許可權控制、密級許可權驗證和安全域邊界許可權等技術保證多層數據防護,基於圖許可權計算模型對深層億級海量檔案進行毫秒級許可權計算;數據流通安全:基於核心過濾驅動保證檔案在終端不落地,基於智慧型DLP敏感檢測的數據擺渡和外發。數據審計安全:基於大數據和知識圖譜技術,保證各種場景化的數據安全審計和分析。
與AI深度融合的非結構化數據處理技術
在ECM系統中,需要將AI關鍵技術機器學習、深度學習、NLP自然語言處理與大數據技術深度融合,實現了對文本與圖像的智慧型分類、智慧型標籤、智慧型OCR識別、智慧型抽取和生成等,保證從預料、算法、訓練、評估、發布和持續疊代的全生命周期管理。
結構化D2R自動建圖、半結構化Wrapper自動建圖和非結構化NLP文本抽取自動建圖等技術構成Graph知識圖譜,同時融合本體知識圖譜、基於語義抽象的主題圖譜和檔案關聯三大圖譜,並結合用戶畫像與行為日誌,實現啟發式可互動非結構化數據探索,可套用於智慧型搜尋、智慧型推薦、安全分析、知識創新和輔助決策等領域。
數位化轉型相關技術
為適應企業數據管理能力的提升,需要構建企業內容業務平台,涵蓋表單建模、BPM流程引擎和WCM展現引擎,可以實現了一次拖拽多端適配,讓業務人員具備了套用開發能力。另外,如果支持業務組件、接口集成平台、標準WCP工作流控制模式支持,可大大提高開發和維護成本。基於端到端技術的企業數位化能力,與內容形成閉環,能滿足企業業務的快速變化與持續創新。
與不同行業的生態融合技術
與SAP、OA、PDM/PLM、ERP,視頻會議等各行業產品快速融合技術,與各種類型存儲產品的整合技術,與數據安全加密軟體的深度融合技術。
企業內容管理成熟度模型
3(內容管理成熟度模型)" style="float: right;" picsrc="2934349b033b5bb5c9ea868f9c9ac239b6003af31622" data-layout="right" width="1920" height="1080" url="/img/7/185/vMWaw9SbvNmLz9mYlNmYu4GZj5yZtl2ai9yL6MHc0RHa.jpg2934349b033b5bb5c9ea868f9c9ac239b6003af31622?x-bce-process=image/resize,m_lfit,w_220,h_220,limit_1" compressw="220" compressh="123" useredit="1" />第一階段可以稱為內容協作(CCP)階段,此階段檔案呈離散型存儲在用戶的電腦上,僅能完成檔案之間的協作,不能與企業業務融合,但此種形態承載了企業80%以上的離散檔案,可以概括為離散檔案的協作管理階段。
第二階段可以稱為內容服務(CSP)階段,企業數據以業務系統檔案(比如SAP里票據影像),體系檔案(比如SOP作業標準文檔)等形式存在,通過內容元數據進行網狀式廣泛關聯,數據來源於業務,又輸出服務於業務。這是企業數據從檔案到內容的一個過渡階段,數據經匯聚、整理、處理後,以全內容服務形式開放,構建起一個統一的企業的非結構化企業管理平台。
第三階段稱為數字業務(CSA),在這個階段,行業數據經過不同維度的整理、提煉,圍繞業務的垂直領域性、體系性,進行立體式關聯與聚合,形成行業性的知識體系,對企業迅速應對市場變化和進行業務創新進行支持。
最高階段為人工智慧(AI)階段,這是一個通過深度學習,自然語言處理(NLP)、知識圖譜等技術對海量數據進行深度整理的階段,是一種立足於業務場景上內容智慧型,為企業提供降本增效、輔助決策的作用。