人物介紹 1998年度的圖靈獎授予了聲譽卓著的資料庫專家詹姆士·格雷 (James Gray)或稱吉姆·格雷(JimGray,Jim是James的暱稱)。這是
圖靈獎 誕生32年的歷史上,繼資料庫技術的先驅查理士·巴赫曼(Charles W.Bachman,1973)和關係資料庫之父埃德加·考特(EdgarF.Codd,1981)之後,第3位因在推動資料庫技術的發展中做出重大貢獻而獲此殊榮的學者。
不幸的是,2007年1月28號,喜歡戶外運動的格雷獨自駕船在海上消失。很多人為搜尋他做出了很多努力,但人們再也未能見到這位天才。
經歷 在IBM期間,他參與和主持過IMS、System R、SQL/DS、DB2等項目的開發,其中除SystemR僅作為研究原型,沒有 成為產品外,其他幾個都成為IBM在資料庫市場上有影響力的產 品。
在Tandem期間,格雷對該公司的主要數 據庫產品ENCOM PASS進行了改進與擴充,並參與了系統
字典 、並行 排序、分散式SQL、NonStopSQL等項目的研製工作。
格雷的另一部著作是《TheBenchmark Handlook: for Database and Transaction Processing Systems》,第1版於1991年,第2版於 1993年出版,也是MorganKanfmann出版社出版的。格雷還是該出版社 “數據管理系統叢書”的主編。
詳細介紹 在DEC,他仍然主要負責資料庫產品的 技術。格雷進入資料庫領域時,關係資料庫的基本理論已經成熟,但各大公司在關係資料庫
管理系統 (RDBMS)的實現和產品開發中,都遇到了 一系列技術問題,主要是在資料庫的規模愈來愈大,資料庫的結構愈來愈複雜,又有愈來愈多的用戶共享資料庫的情況下,如何保障數據的完整性(Integrity)、安全性(Security)、並行性 (Concurrency),以及一旦出現
故障 後,資料庫如何實現從故障中恢復 (Recovery)。這些問題如果不能圓滿解決,無論哪個公司的資料庫產品都無法進入實用,最終不能被用戶所接受。正是在解決這些重大的技術問題,使DBMS成熟並順利進入市場的過程中,格雷以他的聰明才智發揮了十分關鍵的作用。
目前,各DBMS解決上述問題的主要技術 手段和方法如下: 把對資料庫的操作劃分為稱之"事務"(transaction)的
原子 單位, 對1個事務內的操作,實行"allornot"的方針,即“要么全做,要么全不做”。 用戶在對資料庫發出操作請求時,系統對有關的不同程度的數據
元素 (欄位、記錄或檔案)“加鎖”(locking);操作完成後再“解鎖 ”(unlocking)。 對資料庫的任何更新分兩階段提交。 建立系統運行日誌(log),以便在出錯時與資料庫的備份(backup) 一起將資料庫恢復到出錯前的正常狀態。
上述及其他各種方法可總稱為“事務處理技術”(transactionprocessingtechnique)。格雷在事務處理技術上的創造性思維和開拓性工作,使他成為該技術領域公認的權威。他的研究成果反映在他發表的一系列論文和研究報告之中,最後
結晶 為 一部厚厚的專著《Transaction Processing: Conceptsand Techniques》(Morgan Kanfmann Publishers,1993,另一作者為德國
斯圖加特大學 的A.Reuter教授)。事務 處理技術雖然誕生於資料庫研究,但對於分散式系統,client/server結構中的數據管理與通信,對於容錯和高可靠性系統,同樣具有重要的意義。
成就 格雷在資料庫學術界十分活躍。國際上 定期或不定期舉行的一些重要的資料庫學術會議如VLDB,SIGMOD 上,都能見到他的身影,聽到他的聲音。除了在公司從事研究開發外,他還兼職在母校伯克利、
史丹福大學 、
布達佩斯大學 從事過教學和講學活動。1992年,VLDB雜誌(TheVLDBjournal)創刊,他出任主編。
發展史 資料庫技術的發展已經成為先進信息技術的重要組成部分,是現代計算機信息系統和計算機套用系統的基礎和核心。資料庫技術最初產生於20世紀60年代中期,根據數據模型的發展,可以劃分為三個階段:第一代的網狀、層次資料庫系統;第二代的關係資料庫系統;第三代的以面向對象模型為主要特徵的資料庫系統。
第一代資料庫 代表是1969年IBM公司研製的層次模型的資料庫管理系統IMS和70年代美國資料庫系統語言協商CODASYL下屬資料庫任務組DBTG提議的
網狀模型 。層次資料庫的數據模型是有根的定向有序樹,網狀模型對應的是有向圖。這兩種資料庫奠定了現代資料庫發展的基礎。這兩種資料庫具有如下共同點:1.支持三級模式(外模式、模式、內模式)。保證資料庫系統具有數據與程式的物理獨立性和一定的
邏輯 獨立性;2.用存取路徑來表示數據之間的聯繫;3.有獨立的數據定義語言;4.導航式的數據操縱語言。
第二代資料庫 主要特徵是支持關係數據模型(數據結構、關係操作、數據完整性)。關係模型具有以下特點:1.關係模型的概念單一,實體和實體之間的連繫用關係來表示;2.以關係數學為基礎;3.數據的物理存儲和存取路徑對用戶不透明;4.關係資料庫語言是非過程化的。
第三代資料庫 產生於80年代,隨著科學技術的不斷進步,各個行業領域對資料庫技術提出了更多的需求,關係型資料庫已經不能完全滿足需求,於是產生了第三代資料庫。主要有以下特徵:1.支持數據管理、對象管理和知識管理;2.保持和繼承了第二代資料庫系統的技術;3.對其它系統開放,支持資料庫語言標準,支持標準網路協定,有良好的可移植性、可連線性、可擴展性和互操作性等。第三代資料庫支持多種數據模型(比如關係模型和面向對象的模型),並和諸多新技術相結合(比如分布處理技術、並行計算技術、人工智慧技術、多媒體技術、模糊技術),廣泛套用於多個領域(商業管理、GIS、計畫統計等),由此也衍生出多種新的資料庫技術。
分散式資料庫允許用戶開發的應用程式把多個物理分開的、通過網路互聯的資料庫當作一個完整的資料庫看待。並行資料庫通過cluster技術把一個大的事務分散到cluster中的多個節點去執行,提高了資料庫的吞吐和容錯性。多媒體資料庫提供了一系列用來存儲
圖像 、
音頻 和
視頻 對象類型,更好地對多媒體數據進行存儲、管理、查詢。模糊資料庫是存儲、組織、管理和操縱模糊資料庫的資料庫,可以用於模糊知識處理。
隨著科學技術的發展,計算機技術不斷套用到各行各業,數據存儲不斷膨脹的需要,對未來的資料庫技術將會有更高的要求。