大規模Web服務開發技術

內容簡介

Hatena 是日本最大的Web 服務提供商之一，它提供的服務包括關鍵字（類似於維基百科）、部落格、相冊等。本書的內容主要來自Hatena 為學生們舉行的暑期實習的課程，內容涵蓋廣泛，介紹了性能最佳化、分散式、算法、系統架構等各個方面，甚至還介紹了硬體的經濟成本，是運維工程師們必不可少的參考書。該書中包括幾個算法實習課題，介紹了壓縮算法、全文搜尋等算法的實現方法，對於打算靠Web 創業的人不失為一本很不錯的參考書。

譯者序

去年 8 月份，fcicq 向我推薦了《大規模Web 服務開發技術》這本書。當時這本書剛剛出版，在日本著實火了一段時間。後來到網上一查，發現我以前在日本的同事也寫了一篇部落格推薦這本書，看樣子這本書已成為Web 技術人員人手必備的參考讀物了。

後來博文視點的策劃編輯張春雨找到我，希望我翻譯這本書。我在日本工作期間，就對日本的IT 技術十分佩服，尤其是Web 相關技術，很多知名的技術大牛，如伊藤直也、小飼彈等

都寫過許多深入研究技術的文章，見解也相當獨到。而在日本的書店裡，Web 技術的書籍也是琳琅滿目，其中不乏珍品。因此我很想找個機會把日本的技術書籍帶到中國來。於是，與張編輯一拍即合，當即接下了這本書的翻譯任務。

正如這本書的前言裡所說，這本書的內容主要來自Hatena株式會為學生們舉行的暑期實習課程，因此其形式也是以講義為主，風格和一般的技術讀物略有不同。其內容涵蓋範圍也很廣，從性能最佳化、分散式，到算法、系統架構，甚至還介紹了硬體的經濟成本。最吸引人的就是書中的幾個實習課題，介紹了壓縮算法、全文搜尋等算法的實現方法。

在翻譯該書時，我想到了以前做網站開發時的幾件事。

第一件就是性能最佳化的重要性。當時我們開發了一個類似於RSS 閱讀器的網站，其中有個推薦功能，可以根據訪問量、收藏人數等對文章進行社會化推薦。由於計算量很大，因此只能寫成批處理放到夜間執行，但執行效率實在不堪忍受——40 萬的數據量，計算一次就要3 個小時。後來我們對SQL 語句進行了最佳化，使得計算時間從3 小時一下子減少到了20 分鐘。

第二件就是維護工作的辛苦程度。網站對 Web 伺服器採用了分散式，將請求分散到32 台伺服器上。每次版本更新，都要制定嚴密的更新計畫，先改變負載均衡器設定，然後停掉一半伺服器，更新代碼，再然後逐台測試；之後再切換負載均衡器以更新另一半伺服器並測試。更新都是在深夜進行的，每次更新都會持續到凌晨3 點多才能下班。

第三件就是不可知事件的應對策略。這本書里提到了Yahoo!攻擊，這正是我們當年親身經歷過的。當時晚上9 點多，我們突然收到了大量報警郵件，報告相冊服務的負載過高。一看伺服器已經幾乎無法訪問了。調查之後發現，一名博主引用了相冊中的圖片，而這篇文章又被Yahoo!上的一篇新聞引用。於是來自Yahoo!的巨大流量湧入我們的相冊伺服器，導致服務中止。後來，我們改變了相冊服務的架構，並增加了快取機制，以避免這類事件再次發生。

對於運維高手來說，解決這些問題應該是輕車熟路了，但當時我們的團隊沒有類似的經驗，只能自己慢慢摸索解決方法。而Hatena 株式會的技術專家們將他們的運維經驗寫成了書，使我們有幸分享這些寶貴的經驗和知識。如果當時我們有這樣一本書，這幾個問題也就迎刃而解了。願這本書能對廣大網站運維人員（特別是初涉該領域的新手們）有所幫助。

大規模Web服務開發技術

基本介紹

內容簡介

譯者序

前言

作品目錄

相關詞條

熱門詞條