模式獲取

模式獲取指的是計算機領域的一種獲取目標的方式,基本特徵是需要通過文檔解析。

基本介紹

  • 中文名:模式獲取
  • 套用領域:計算機科學領域
  • 基本特徵:需要通過文檔解析
概述,解析步驟,目錄結構,目錄條目結構,

概述

1.Excel 2003檔案(即後綴為xls)是二進制檔案,存儲結構為複合文檔,POI讀取xls檔案有兩種方式:
用戶模式(usermodel):一次性將xls檔案讀入到記憶體,創建dom結構處理;
事件模式(eventusermodel):以流的形式讀取xls檔案,讀取xls檔案占用相對較小的記憶體。
2. 事件模式適用於願意學習一點低級API結構的中間開發人員。它使用起來相對簡單,但需要對Excel檔案j結構有個基本了解。

解析步驟

如下圖所示:
模式獲取

目錄結構

從上面我們知道以複合文檔為存儲格式的Excel 2003檔案是以各種單獨的子流SubStreams,各種子流SubStreams安按照一定的順序構成整個文檔流Workbook Stream.
那我們解析Excel 2003檔案時怎么進入各種子流SubStream呢?
這就要靠目錄結構Directory了:
  1. 目錄結構Directory是複合文檔一種內部控制流;
  2. 目錄結構Directory由一系列的目錄條目Directory Entry組成;
  3. 每一個目錄條目Directory Entry都指向複合文檔的一個倉庫Storage或流Stream;
  4. 目錄條目Directory Entry根據對應倉庫或流在檔案流中出現的順序被列舉;
  5. 目錄條目Directory Entry的索引從0開始,其索引稱為DirID;
  6. DirID為0的表示一個特殊的目錄條目,它代表根倉庫條目 -root storage entry。

目錄條目結構

  1. 每個目錄條目指向一個倉庫Storage或流Stream;
  2. 每個目錄條目Directory Entry固定大小為128位元組;
  3. 第一個目錄條目是根倉庫條目 - root storage Entry;
  4. 第二個目錄條目的名字是“Workbook”,它表示一個流。

相關詞條

熱門詞條

聯絡我們