詹姆士·格雷

詹姆士·格雷

格雷生于1944年,在著名的加州大學伯克利分校電腦科學系獲得博士學位。其博士論文是有關優先文法文法分析理論的。學成以後,他先後在貝爾實驗室、IBM、Tandem、DEC等公司工作,研究方向轉向資料庫領域。

  • 外文名稱
    James Gray
  • 姓    名
    詹姆士·格雷
  • 國    籍
    美國
  • 畢業院校
    加州大學
  • 主要成就
    獲得1998年度的圖靈獎
  • 職    業
    科學家
  • 出生日期
    1944年

簡介

1998年度的圖靈獎授予了聲譽卓著的資料庫專家詹姆士·格雷 (James Gray)或稱吉姆·格雷(JimGray,Jim是James的昵稱)。這是圖靈獎 誕生32年的歷史上,繼資料庫技術的先驅查理士·巴赫曼(Charles W.Bachman,1973)和關系資料庫之父埃德加·考特(EdgarF.Codd,1981)之後,第3位因在推動資料庫技術的發展中做出重大貢獻而獲此殊榮的學者。

不幸的是,2007年1月28號,喜歡戶外運動的格雷獨自駕船在海上消失。很多人為搜尋他做出了很多努力,但人們再也未能見到這位天才。

經歷

在IBM期間,他參與和主持過IMS、System R、SQL/DS、DB2等項目的開發,其中除SystemR僅作為研究原型,沒有 成為產品外,其他幾個都成為IBM在資料庫市場上有影響力的產 品。

在Tandem期間,格雷對該公司的主要數 據庫產品ENCOM PASS進行了改進與擴充,並參與了系統字典、並行 排序、分散式SQL、NonStopSQL等項目的研製工作。

格雷的另一部著作是《TheBenchmark Handlook: for Database and Transaction Processing Systems》,第1版于1991年,第2版于 1993年出版,也是MorganKanfmann出版社出版的。格雷還是該出版社 "資料管理系統叢書"的主編。

詳細介紹

在DEC,他仍然主要負責資料庫產品的 技術。格雷進入資料庫領域時,關系資料庫的基本理論已經成熟,但各大公司在關系資料庫管理系統(RDBMS)的實現和產品開發中,都遇到了 一系列技術問題,主要是在資料庫的規模愈來愈大,資料庫的結構愈來愈復雜,又有愈來愈多的使用者共享資料庫的情況下,如何保障資料的完整性(Integrity)、安全性(Security)、並行性 (Concurrency),以及一旦出現故障後,資料庫如何實現從故障中恢復 (Recovery)。這些問題如果不能圓滿解決,無論哪個公司的資料庫產品都無法進入實用,最終不能被使用者所接受。正是在解決這些重大的技術問題,使DBMS成熟並順利進入市場的過程中,格雷以他的聰明才智發揮了十分關鍵的作用。

詹姆士·格雷

目前,各DBMS解決上述問題的主要技術 手段和方法如下: 把對資料庫的操作劃分為稱之"事務"(transaction)的原子單位, 對1個事務內的操作,實行"allornot"的方針,即"要麽全做,要麽全不做"。 使用者在對資料庫發出操作請求時,系統對有關的不同程度的資料元素(欄位、記錄或檔案)"加鎖"(locking);操作完成後再"解鎖 "(unlocking)。 對資料庫的任何更新分兩階段提交。 建立系統運行日志(log),以便在出錯時與資料庫的備份(backup) 一起將資料庫恢復到出錯前的正常狀態。

上述及其他各種方法可總稱為"事務處理技術"(transactionprocessingtechnique)。格雷在事務處理技術上的創造性思維和開拓性工作,使他成為該技術領域公認的權威。他的研究成果反映在他發表的一系列論文和研究報告之中,最後結晶為 一部厚厚的專著《Transaction Processing: Conceptsand Techniques》(Morgan Kanfmann Publishers,1993,另一作者為德國斯圖加特大學的A.Reuter教授)。事務 處理技術雖然誕生于資料庫研究,但對于分散式系統,client/server結構中的資料管理與通信,對于容錯和高可靠性系統,同樣具有重要的意義。

成就

格雷在資料庫學術界十分活躍。國際上 定期或不定期舉行的一些重要的資料庫學術會議如VLDB,SIGMOD 上,都能見到他的身影,聽到他的聲音。除了在公司從事研究開發外,他還兼職在母校伯克利、斯坦福大學、布達佩斯大學從事過教學和講學活動。1992年,VLDB雜志(TheVLDBjournal)創刊,他出任主編。

資料庫發展史

資料庫技術的發展已經成為先進信息技術的重要組成部分,是現代電腦信息系統和電腦套用系統的基礎和核心。資料庫技術最初產生于20世紀60年代中期,根據資料模型的發展,可以劃分為三個階段:第一代的網狀、層次資料庫系統;第二代的關系資料庫系統;第三代的以面向對象模型為主要特征的資料庫系統。

詹姆士·格雷

第一代資料庫

代表是1969年IBM公司研製的層次模型的資料庫管理系統IMS和70年代美國資料庫系統語言協商CODASYL下屬資料庫任務組DBTG提議的網狀模型。層次資料庫的資料模型是有根的定向有序樹,網狀模型對應的是有向圖。這兩種資料庫奠定了現代資料庫發展的基礎。這兩種資料庫具有如下共同點:1.支持三級模式(外模式、模式、內模式)。保證資料庫系統具有資料與程式的物理獨立性和一定的邏輯獨立性;2.用存取路徑來表示資料之間的聯系;3.有獨立的資料定義語言;4.導航式的資料操縱語言。

第二代資料庫

主要特征是支持關系資料模型(資料結構、關系操作、資料完整性)。關系模型具有以下特點:1.關系模型的概念單一,實體和實體之間的連系用關系來表示;2.以關系數學為基礎;3.資料的物理存儲和存取路徑對使用者不透明;4.關系資料庫語言是非過程化的。

第三代資料庫

產生于80年代,隨著科學技術的不斷進步,各個行業領域對資料庫技術提出了更多的需求,關系型資料庫已經不能完全滿足需求,于是產生了第三代資料庫。主要有以下特征:1.支持資料管理、對象管理和知識管理;2.保持和繼承了第二代資料庫系統的技術;3.對其它系統開放,支持資料庫語言標準,支持標準網路協定,有良好的可移植性、可連線性、可擴展性和互操作性等。第三代資料庫支持多種資料模型(比如關系模型和面向對象的模型),並和諸多新技術相結合(比如分布處理技術、並行計算技術、人工智慧技術、多媒體技術、模糊技術),廣泛套用于多個領域(商業管理、GIS、計畫統計等),由此也衍生出多種新的資料庫技術。

分散式資料庫允許使用者開發的應用程式把多個物理分開的、通過網路互聯的資料庫當作一個完整的資料庫看待。並行資料庫通過cluster技術把一個大的事務分散到cluster中的多個節點去執行,提高了資料庫的吞吐和容錯性。多媒體資料庫提供了一系列用來存儲圖像、音頻和影片對象類型,更好地對多媒體資料進行存儲、管理、查詢。模糊資料庫是存儲、組織、管理和操縱模糊資料庫的資料庫,可以用于模糊知識處理。

隨著科學技術的發展,電腦技術不斷套用到各行各業,資料存儲不斷膨脹的需要,對未來的資料庫技術將會有更高的要求。

相關詞條

其它詞條