定義,特點,信息系統,設計方法,手工試湊法,規範設計法,步驟,需求分析,概念設計,邏輯設計,物理設計,驗證設計,運行與維護設計,形成過程,設計技巧,設計資料庫之前,表和欄位的設計,選擇鍵和索引,數據完整性設計,其他設計技巧,
定義 (Database Design)是指根據用戶的需求,在某一具體的
資料庫管理系統 上,設計資料庫的結構和建立資料庫的過程。
資料庫系統 需要作業系統的支持。
資料庫設計是建立
資料庫及其套用 系統的技術,是
信息系統 開發和建設中的核心技術。由於
資料庫套用系統 的複雜性,為了支持相關程式運行,資料庫設計就變得異常複雜,因此最佳設計不可能一蹴而就,而只能是一種“反覆探尋,
逐步求精 ”的過程,也就是規劃和結構化資料庫中的
數據對象 以及這些數據對象之間關係的過程。
特點 資料庫建設是硬體、軟體和乾件的結合
三分技術,七分管理,十二分基礎數據
技術與管理的界面稱之為“乾件”
結構(數據)設計:設計資料庫框架或資料庫結構
行為(處理)設計:設計應用程式、事務處理等
結構和行為分離的設計
傳統的軟體工程忽視對套用中數據語義的分析和抽象,只要有可能就儘量推遲數據
結構設計 的決策。早期的資料庫設計致力於
數據模型 和建模方法研究,忽視了對行為的設計
信息系統 (1)資料庫是
信息系統 的核心和基礎,把信息系統中大量的數據按一定的模型組織起來,提供存儲、維護、檢索數據的功能,使信息系統可以方便、及時、準確地從資料庫中獲得所需的信息。
(2)資料庫是信息系統的各個部分能否緊密地結合在一起以及如何結合的關鍵所在。
(3)資料庫設計是信息系統開發和建設的重要組成部分。
(4)資料庫設計人員應該具備的技術和知識:
資料庫的基本知識和資料庫設計技術
計算機科學的基礎知識和程式設計的方法和技巧
軟體工程的原理和方法
套用領域的知識
設計方法 手工試湊法 設計質量與設計人員的經驗和水平有直接關係
缺乏科學理論和工程方法的支持,工程的質量難以保證
資料庫運行一段時間後常常又不同程度地發現各種問題,增加了維護代價
規範設計法 基本思想:過程疊代和逐步求精
典型方法:
(1)紐奧良(New Orleans)方法:將資料庫設計分為四個階段
S.B.Yao方法:將資料庫設計分為五個步驟
I.R.Palmer方法:把資料庫設計當成一步接一步的過程
步驟 需求分析 調查和分析用戶的業務活動和數據的使用情況,弄清所用數據的種類、範圍、數量以及它們在業務活動中交流的情況,確定用戶對
資料庫系統 的使用要求和各種約束條件等,形成用戶需求規約。
需求分析是在用戶調查的基礎上,通過分析,逐步明確用戶對系統的需求,包括數據需求和圍繞這些數據的業務處理需求。在需求分析中,通過自頂向下,逐步分解的方法分析系統,分析的結果採用數據流程圖(DFD) 進行圖形化的描述。
概念設計 對用戶要求描述的現實世界(可能是一個工廠、一個商場或者一個學校等),通過對其中諸處的分類、聚集和概括,建立抽象的
概念數據模型 。這個
概念模型 應反映現實世界各部門的
信息結構 、信息流動情況、信息間的互相制約關係以及各部門對
信息儲存 、查詢和加工的要求等。所建立的模型應避開資料庫在計算機上的具體實現細節,用一種抽象的形式表示出來。以擴充的實體—(
E-R模型 )聯繫模型方法為例,第一步先明確現實世界各部門所含的各種實體及其屬性、實體間的聯繫以及對信息的制約條件等,從而給出各部門內所用信息的局部描述(在資料庫中稱為用戶的局部視圖)。第二步再將前面得到的多個用戶的局部視圖集成為一個全局視圖,即用戶要描述的現實世界的
概念數據模型 。
邏輯設計 主要工作是將現實世界的概念
數據模型 設計成資料庫的一種邏輯模式,即適應於某種特定
資料庫管理系統 所支持的邏輯
數據模式 。與此同時,可能還需為各種數據處理套用領域產生相應的邏輯子模式。這一步設計的結果就是所謂“邏輯資料庫”。
oa工作流資料庫設計 物理設計 根據特定
資料庫管理系統 所提供的多種
存儲結構 和存取方法等依賴於具體計算機結構的各項物理設計措施,對具體的套用任務選定最合適的物理存儲結構(包括檔案類型、
索引 結構和數據的存放次序與位邏輯等)、存取方法和存取路徑等。這一步設計的結果就是所謂“物理資料庫”。
驗證設計 在上述設計的基礎上,收集數據並具體建立一個資料庫,運行一些典型的套用任務來驗證資料庫設計的正確性和合理性。一般,一個大型資料庫的設計過程往往需要經過多次循環反覆。當設計的某步發現問題時,可能就需要返回到前面去進行修改。因此,在做上述資料庫設計時就應考慮到今後修改設計的可能性和方便性。
運行與維護設計 在
資料庫系統 正式投入運行的過程中,必須不斷地對其進行調整與修改。
資料庫設計步驟 至今,資料庫設計的很多工作仍需要人工來做,除了關係型資料庫已有一套較完整的數據
範式理論 可用來部分地指導資料庫設計之外,尚缺乏一套完善的資料庫設計理論、方法和工具,以實現資料庫設計的自動化或互動式的半自動化設計。所以資料庫設計今後的研究發展方向是研究資料庫設計理論,尋求能夠更有效地表達語義關係的
數據模型 ,為各階段的設計提供自動或半自動的設計工具和
集成化 的
開發環境 ,使資料庫的設計更加工程化、更加規範化和更加方便易行,使得在資料庫的設計中充分體現
軟體工程 的先進思想和方法。
形成過程 1.
需求分析 階段:綜合各個用戶的套用需求(
數據流程圖(DFD)
2.概念設計階段:形成獨立於機器特點,獨立於各個DBMS產品的
概念模式 (E-R圖)
3.
邏輯設計 階段:首先將E-R圖轉換成具體的資料庫產品支持的
數據模型 ,如
關係模型 ,形成資料庫邏輯模式;然後根據用戶處理的要求、安全性的考慮,在基本表的基礎上再建立必要的視圖(View),形成數據的
外模式 4.物理設計階段:根據DBMS特點和處理的需要,進行物理存儲安排,建立
索引 ,形成資料庫
內模式 。
設計技巧 設計資料庫之前 1) 理解客戶需求,詢問用戶如何看待未來需求變化。讓客戶解釋其需求,而且隨著開發的繼續,還要經常詢問客戶保證其需求仍然在開發的目的之中。
2) 了解企業業務可以在以後的開發階段節約大量的時間。
3) 重視輸入輸出。
在定義資料庫表和欄位需求(輸入)時,首先應檢查現有的或者已經設計出的報表、查詢和視圖(輸出)以決定為了支持這些輸出哪些是必要的表和欄位。
舉例:假如客戶需要一個報表按照郵政編碼排序、分段和求和,你要保證其中包括了單獨的郵政編碼欄位而不要把郵政編碼糅進地址欄位里。
ER 圖表和數據字典可以讓任何了解資料庫的人都明確如何從資料庫中獲得數據。ER圖對表明表之間關係很有用,而數據字典則說明了每個欄位的用途以及任何可能存在的別名。對SQL
表達式 的文檔化來說這是完全必要的。
5) 定義標準的對象命名規範
資料庫各種對象的命名必須規範。
表和欄位的設計 表設計原則
1) 標準化和規範化
數據的標準化有助於消除資料庫中的
數據冗餘 。標準化有好幾種形式,但Third Normal Form(3NF)通常被認為在性能、擴展性和
數據完整性 方面達到了最好平衡。簡單來說,遵守3NF 標準的資料庫的表設計原則是:“One Fact in One Place”即某個表只包括其本身基本的屬性,當不是它們本身所具有的屬性時需進行分解。表之間的關係通過
外鍵 相連線。它具有以下特點:有一組表專門存放通過鍵連線起來的關聯數據。
舉例:某個存放客戶及其有關定單的3NF資料庫就可能有兩個表:Customer 和Order。Order 表不包含定單關聯客戶的任何信息,但表內會存放一個鍵值,該鍵指向Customer 表里包含該客戶信息的那一行。
事實上,為了效率的緣故,對表不進行標準化有時也是必要的。
2) 數據驅動
採用數據驅動而非
硬編碼 的方式,許多策略變更和維護都會方便得多,大大增強系統的靈活性和擴展性。
舉例,假如用戶界面要訪問
外部數據源 (檔案、XML 文檔、其他資料庫等),不妨把相應的連線和路徑信息存儲在用戶界面支持表里。還有,如果用戶界面執行
工作流 之類的任務(傳送郵件、列印信箋、修改記錄狀態等),那么產生工作流的數據也可以存放在資料庫里。角色許可權管理也可以通過數據驅動來完成。事實上,如果過程是數據驅動的,你就可以把相當大的責任推給用戶,由用戶來維護自己的工作流過程。
3) 考慮各種變化
在設計資料庫的時候考慮到哪些數據欄位將來可能會發生變更。
舉例,姓氏就是如此(注意是西方人的姓氏,比如女性結婚後從夫姓等)。所以,在建立系統存儲客戶信息時,在單獨的一個數據表里存儲姓氏欄位,而且還附加起始日和終止日等欄位,這樣就可以跟蹤這一數據條目的變化。
4) 每個表中都應該添加的3 個有用的欄位
dRecordCreationDate,在VB 下默認是Now(),而在SQL Server · 下默認為GETDATE()
sRecordCreator,在SQL Server 下默認為NOT NULL DEFAULT · USER
nRecordVersion,記錄的版本標記;有助於準確說明記錄中出現null 數據或者丟失數據的原因 ·
5) 對地址和電話採用多個欄位
描述街道地址就短短一行記錄是不夠的。 Address_Line1、Address_Line2 和Address_Line3 可以提供更大的靈活性。還有,電話號碼和郵件地址最好擁有自己的數據表,其間具有自身的類型和標記類別。
6) 使用角色實體定義屬於某類別的列
在需要對屬於特定類別或者具有特定角色的事物做定義時,可以用角色實體來創建特定的時間關聯關係,從而可以實現自我文檔化。
舉例:用PERSON 實體和PERSON_TYPE 實體來描述人員。比方說,當John Smith, Engineer 提升為John Smith, Director 乃至最後爬到John Smith, CIO 的高位,而所有你要做的不過是改變兩個表PERSON 和PERSON_TYPE 之間關係的鍵值,同時增加一個日期/時間欄位來知道變化是何時發生的。這樣,你的PERSON_TYPE 表就包含了所有PERSON 的可能類型,比如Associate、Engineer、Director、CIO 或者CEO 等。還有個替代辦法就是改變PERSON 記錄來反映新頭銜的變化,不過這樣一來在時間上無法跟蹤個人所處位置的具體時間。
7) 選擇數字類型和文本類型儘量充足
在SQL 中使用smallint 和tinyint 類型要特別小心。比如,假如想看看月銷售總額,總額欄位類型是smallint,那么,如果總額超過了$32,767 就不能進行計算操作了。
而ID 類型的文本欄位,比如客戶ID 或定單號等等都應該設定得比一般想像更大。假設客戶ID 為10 位數長。那你應該把資料庫表欄位的長度設為12 或者13 個字元長。但這額外占據的空間卻無需將來重構整個資料庫就可以實現資料庫規模的增長了。
8) 增加刪除標記欄位
在表中包含一個“刪除標記”欄位,這樣就可以把行標記為刪除。在
關係資料庫 里不要單獨刪除某一行;最好採用清除數據程式而且要仔細維護
索引 整體性。
選擇鍵和索引 (資料庫邏輯設計)
鍵選擇原則:
1) 鍵設計4 原則為
所有的鍵都必須唯一。
避免使用複合鍵。
外鍵總是關聯唯一的鍵欄位。
2) 使用系統生成的主鍵
設計資料庫的時候採用系統生成的鍵作為主鍵,那么實際控制了資料庫的
索引 完整性。這樣,資料庫和非人工機制就有效地控制了對存儲數據中每一行的訪問。採用系統生成鍵作為主鍵還有一個優點:當擁有一致的鍵結構時,(不讓主鍵具有可更新性)
在確定採用什麼欄位作為表的鍵的時候,可一定要小心用戶將要編輯的欄位。通常的情況下不要選擇用戶可編輯的欄位作為鍵。
4) 可選鍵有時可做主鍵
把可選鍵進一步用做主鍵,可以擁有建立強大索引的能力。
索引使用原則:
索引是從資料庫中獲取數據的最高效方式之一。95%的資料庫性能問題都可以採用
索引 技術得到解決。
1) 邏輯主鍵使用唯一的成組索引,對系統鍵(作為
存儲過程 )採用唯一的非成組索引,對任何
外鍵 列採用非成組索引。考慮資料庫的空間有多大,表如何進行訪問,還有這些訪問是否主要用作讀寫。
2) 大多數資料庫都索引自動創建的主鍵欄位,但是可別忘了索引外鍵,它們也是經常使用的鍵,比如運行查詢顯示主表和所有關聯表的某條記錄就用得上。
3) 不要索引
memo /note 欄位,不要索引大型欄位(有很多字元),這樣作會讓索引占用太多的存儲空間。
4) 不要索引常用的小型表
不要為小型數據表設定任何鍵,假如它們經常有插入和刪除操作就更別這樣作了。對這些插入和刪除操作的
索引 維護可能比掃描
表空間 消耗更多的時間。
數據完整性設計 (資料庫邏輯設計)
1) 完整性實現機制:
參照完整性:
父表中插入數據:受限插入;遞歸插入
DBMS對參照完整性可以有兩種方法實現:
外鍵 實現機制(約束規則)和
觸發器 實現機制
用戶定義完整性:
NOT NULL;CHECK;觸發器
2) 用約束而非商務規則強制數據完整性
採用
資料庫系統實現 數據的完整性。這不但包括通過標準化實現的完整性而且還包括數據的功能性。在寫數據的時候還可以增加觸發器來保證數據的正確性。不要依賴於商務層保證數據完整性;它不能保證表之間(外鍵)的完整性所以不能強加於其他完整性規則之上。
3) 強制指示完整性
在有害數據進入資料庫之前將其剔除。激活
資料庫系統 的指示完整性特性。這樣可以保持數據的清潔而能迫使開發人員投入更多的時間處理錯誤條件。
4) 使用查找控制數據完整性
控制數據完整性的最佳方式就是限制用戶的選擇。只要有可能都應該提供給用戶一個清晰的價值列表供其選擇。這樣將減少鍵入代碼的錯誤和誤解同時提供數據的一致性。某些公共數據特別適合查找:國家代碼、
狀態代碼 等。
5) 採用視圖
為了在資料庫和應用程式代碼之間提供另一層抽象,可以為應用程式建立專門的視圖而不必非要應用程式直接訪問數據表。這樣做還等於在處理資料庫變更時給你提供了更多的自由。
其他設計技巧 1) 避免使用觸發器
觸發器的功能通常可以用其他方式實現。在
調試程式 時觸發器可能成為干擾。假如你確實需要採用觸發器,你最好集中對它文檔化。
2) 使用常用英語(或者其他任何語言)而不要使用編碼
在創建
下拉選單 、列表、報表時最好按照英語名排序。假如需要編碼,可以在編碼旁附上用戶知道的英語。
3) 保存常用信息
讓一個表專門存放一般資料庫信息非常有用。在這個表里存放資料庫當前版本、檢查/修復(對 Access)、關聯設計文檔的名稱、客戶等信息。這樣可以實現一種簡單機制跟蹤資料庫,當客戶抱怨他們的資料庫沒有達到希望的要求而與你聯繫時,這樣做對非客戶機/
伺服器 環境特別有用。
4) 包含版本機制
在資料庫中引入
版本控制 機制來確定使用中的資料庫的版本。時間一長,用戶的需求總是會改變的。最終可能會要求修改資料庫結構。把版本信息直接存放到資料庫中更為方便。
5) 編制文檔
採用給表、列、觸發器等加注釋的資料庫工具。對開發、支持和跟蹤修改非常有用。
對資料庫文檔化,或者在資料庫自身的內部或者單獨建立文檔。這樣,當過了一年多時間後再回過頭來做第2 個版本,犯錯的機會將大大減少。
6) 測試、測試、反覆測試
建立或者修訂資料庫之後,必須用用戶新輸入的
數據測試 數據欄位。最重要的是,讓用戶進行測試並且同用戶一道保證選擇的數據類型滿足商業要求。測試需要在把新資料庫投入實際服務之前完成。
7) 檢查設計
在開發期間檢查資料庫設計的常用技術是通過其所支持的應用程式原型檢查資料庫。換句話說,針對每一種最終表達數據的原型套用,保證你檢查了
數據模型 並且查看如何取出數據。