2009年10月13日

資料在雲端蒸發,怎麼辦?

最近有個連續劇般的新聞,我看了幾天...

10/10 Engadget 報導:"T-Mobile: we probably lost all your Sidekick data"。啥?T-Mobile 把手機客戶的聯絡人、照片的資料搞丟了?

10/11 ZD Net 文章:"The T-Mobile-Microsoft Sidekick data disaster: Poor IT management going mainstream"。「T-Mobile 微軟的資料災難:差勁的 IT 管理進入主流」,這種話都出來了,挨踢也是應該的。

10/12 The Inquirer 報導:"Danger no backups"。不論是外包給別人去升級 SAN 也好、是微軟和 Danger 系統整合有問題也好,資料還真的沒有備份?!

第一次看到這個新聞的時候,我還真不敢相信,所以才多看了幾天。

資料中心裡的客戶個人資料竟然沒有備份?

這樣也可以出來做生意?

我本來覺得歐巴馬上任不到一年獲諾貝爾和平獎一定是本月最離譜事件了,沒想到馬上被這件事追過!


網路上有關這個事件的部落格也是隨手找就一大堆,有人說這是雲端運算目前為止最大的災難,有人說這是無能的人經營的傳統資料中心,和新興的雲端運算無關

這個事件,算不算雲端運算的災難?


我所認同的「雲端運算」是「應用程式和資料都放在遠端伺服器,用任何可上網設備均可取用」的運算模式,不是任何單一技術或單一廠商,和資料中心傳不傳統、網管厲不厲害也沒有關連。

所以,不要牽拖,這就是雲端運算的大災難!

雲端運算不安全?

這個例子說明了,再先進的技術,在無能的營運或管理者的手上,都可能出問題!(唉喲,害我又想起張國龍教授當年批評核四安全性的說法...)

這個單一事件,不會阻止、但可能會減緩雲端運算模式的普及。因為:
  • 你的銀行外洩了所有信用卡客戶的資料,你會說整個信用卡的消費模式就此垮台嗎?
  • 還是你會說,這家銀行太爛了,趕快把卡剪了,換用另外一家的?
你也許要記住這次出包的雲端服務公司,以後在選擇服務業者時,考慮一下要不要選這家。


那麼,作為一個雲端消費者,要如何保護自己的資料?

依我看,有兩件事可以做:
  1. 自己的資料自己救!把所有上傳到 flickr/picasaweb 的照片、上傳到 YouTube/Vimeo 的影片,在 Pixnet/無名/Blogger 寫的部落格文章、在 Google docs 裡作的文件、用 Google Sites 做的網頁... 通通拷貝一份在家裡。

  2. 慎選雲端服務商。以後選擇只會更多,每個人因為穩定性、移植性、方便性、同儕推薦等等各種原因會選擇不同的服務商,但為了你辛辛苦苦寫的文章或難得拍到的小孩照片不要人間蒸發,千萬別漏了考慮「資料安全性」。

1.自己的資料自己救

這說來容易,做來難。不是空間的問題,一顆硬碟 1 TB 的時代,買個外接碟就能裝進幾百小時的影片、或一二十萬張照片、或幾十萬份文件,容量真的不是問題;問題是在維護上。

天下沒有不散的筵席,更沒有不壞的硬碟。

出去旅遊拍的照片和小孩幼稚園畢業典禮的影片,一旦失去就再也回不來了,小心的人都會自己備份;管理日漸成長的檔案和備份的最簡單方法,大概叫做「買兩顆硬碟回來對拷」吧!不過要有心理準備,這種事不太好請學長幫你做(你確定學長不會看到不該看的?),金錢和時間是要自己花的。而且有些東西是直接在雲端平台產生的(如這篇部落格),要如何備一份在家裡?這是另外一個課題,改天再來寫一篇。

不過,話說回來,連小心的一般使用者都會備份資料了,堂堂的手機廠商和配合廠商(好大的一間公司喔)竟然會沒有備份?我二個禮拜前才在台大教了 distributed file systemsGFS 的課,連大學生都大約知道容錯的分散式檔案系統是怎麼回事了,這些大公司是在用二十年前的技術存資料嗎?

2.慎選雲端服務商

如果在金錢或時間上有困難,實在沒辦法自己備份怎麼辦?只好仔細選家服務商,然後祈禱不會所選非人啦。

怎麼看一家雲端服務商的資料安全性好不好?
  1. 歷史記錄:以前有沒有掉過資料?掉了有沒有找回來?花多長時間?資料是否外洩過?
  2. 資料保全技術:它用什麼技術保全你的資料?有沒有容錯機制所以不怕單一硬碟的損壞?有沒有異地備援所以不怕單一資料中心發生火災?
  3. 人員素質和制度流程:它的工程師和 IT 網管的素質如何?有沒有完善制度和流程以避免人為疏失?
第一點在網路上搜尋或打聽,多少可以知道一些。

第二點比較困難取得,服務商不見得會揭露這些技術細節,但我認為雲端運算要漸趨成熟的話,這些是雲端服務商應該要揭露的內容。目前一般的做法是提供「服務等級同意書」(service level agreement),但就像安裝軟體大概超過 99% 的人都是 Next > Next > Next,雲端服務的 SLA 那頁應該也是沒看就「我同意」了吧?有心的人不妨注意一下 SLA。

第三點的話,每一家要嘛不說,要嘛一定是自吹自擂,這時候口碑就很重要了,尤其是在行家之間的口碑。


你可以反問:「我存錢到銀行都沒過問銀行是如何保全它金庫裡的錢了,存資料到雲端難道比存錢還要更小心?」

當然!

錢失去了,再賺就有,何況銀行被搶了,你還是可以憑存褶去領錢,如果把銀行擠兌倒了,還有存款保險寥表心意的理賠,要到的每一塊錢,都和你存進去的錢有一樣的效用。可是,你在金字塔前騎駱駝的照片萬一不見了,難道要摸神燈請燈神幫你變回來?業者最多只能賠你錢,但你寧願賠錢的狀況不要發生吧?

在雲端產業和法律配套還沒成熟的今天,業者必未會主動揭露資料保全的方式,所以,還是多搜尋多打聽吧!口碑很重要的,不是你身邊非行家的同學、同事、同鄉、同胞的口碑,而是網路上行家的口碑。

誰是行家?那就要由你來發現了。希望你不會和這幾十萬個 Sidekick 的客戶一樣,資料掉了還救不回來,也希望你永遠不會問我標題上的問題。


10 則留言 :

  1. 慎選廠商阿!
    翻了一下相關報導,Danger上一次上新聞
    也Sidekick手機,而且是通訊錄外洩
    原因是password reset強度太低被try出來
    導致一堆美國名人被迫更換手機號碼

    各種雲端出包事件整理
    http://www.networkworld.com/news/2009/101209-sidekick-cloud-computing-outages-short-history.html

    回覆刪除
  2. 那您有備份在這裏寫的東西嗎?

    回覆刪除
  3. 每家廠商就是龜笑鱉沒尾
    http://news.networkmagazine.com.tw/web/2009/10/15/15766/
    所以慎選到底是要選哪家

    回覆刪除
  4. 如同ping所說,也是因為Google Apps常常出問題,現在敝公司才會有IBM與M$的ssles每天跑CIO辦公室

    回覆刪除
  5. @かいお: 我「備份」部落格的方式很石器時代耶,就是在寫完後,切到 HTML 的編輯模式,把內容剪貼出來存檔。其實常常是倒過來,在 editor 裡打好文字,再剪貼到 blogger 排版。

    可是有時候會忘記做備份... (汗)

    而且這樣也沒存到標籤和回覆,還是用 Dataliberation.org 上寫的 脫離 blogger 這招來做比較好。

    @Mr. Cloud: Google Apps 的問題是斷線嗎?還是別的?

    回覆刪除
  6. 我跟您的想法差不多一樣傳統,認為資料自己留着比較好。

    您先用 EDITOR 打的方法才是最好的,我之前試過打到一半按到了 ‘前一頁’ 的鍵,害我重打三次。 = = 你知道有時候我們都寫得很長…

    我現在的備份方案是,買兩個 2.5 吋的外置硬碟,先放一個在公司,然後每晚備份後,上班跟公司的對調,這樣就永遠有三個拷貝,其中在公司的那個是防止家不幸燒掉的後着。

    當然,如果是中了城市級的導彈攻擊或者大天災,就沒有辦法。

    回覆刪除
  7. 城市中導彈的話,在異地資料中心的資料反而是相對安全的。 :)

    回覆刪除
  8. 當然,也有一個異地資料中心每天同步是最好;我沒有錢租頻寬。

    回覆刪除
  9. 也許2009年到2011年都找不到最好的解決辦法,但在2012年有了"金匱雲"就可以完全解決這些問題了。
    參考一下這個網站吧!
    http://mysafes.tw

    回覆刪除
  10. @孫悟空: 您的產品不就是加強版的保險櫃嗎?和雲端運算的關係是什麼?用到什麼雲端運算的技術?

    我的部落格不放產品廣告(不然我自己放 AdSense 就好了),請說明用到的雲端技術,不然恕我刪除您的留言。

    回覆刪除