Once Upon A Day 20 - Big Data

還記得以前用電話線上網的年代嗎?當時上網最高速也只有56Kbps,即使純文字的網頁也要數秒才能完成下載。之後寬頻的流行,漸漸才出現10、25、100,甚至1000Mbps的上網計劃,網頁的樣式隨著豐富起來,網絡的使用方法也隨之改變。以前如果想聽歌,大家會下載MP3到電腦或MP3機播放,如果想看電影,大家會BT,因為網速不夠快,串流技術在十多年前難以興起,但現在只要在手機打開KKBox、Spotify,成千上萬的音樂隨時播放,在Youtube看影片亦幾乎不需要等待緩衝。這些便利全賴於各項科技在十數年間漸趨成熟,網速提升、電腦處理速度提升、硬碟體積縮小等,背後的影響,除了讓我們更容易接觸資訊外,亦帶來了「大數據」的年代。

上圖總括了2016年我們在各大型網站每分鐘的使用情況,這代表甚麼?雖然找不到最新數據,但根據一份2015年的資料,這大概等於我們每天產生2500PB的資料,換算做比較熟悉的單位即是2,500,000,000GB,這些資料包括我們直接接觸到的圖片、音樂、影片、文書檔案等,亦包括我們在網絡上的行為例如「點擊」、「閱讀」、「離開網站」等,企業會透過分析這些數據來判斷用戶的行為,從而調整公司策略,由於傳統的系統和軟件並不足以處理如此龐大的數據量,因而這些數據被稱為「大數據」。「大數據」這詞雖然近年突然興起,不過要處理龐大數據量的機構並不是近年才出現,例如CERN的科學家早在1990年代已經要分析以TB計的數據,說穿了「大數據」只是一個Buzzword

空穴來風,當企業都說自己在用「大數據」,背後其實是因為「雲端技術」開始成熟,簡單來說就是有人預先準備好一大群電腦和軟件,企業只要經過相對簡單的設定,便可以開始分析數據,相比傳統需要成立幾隊專業團隊完成同樣的工作,雲端技術有助企業用較低成本達到目的。「大數據」成為潮流的另一個原因是iPhone的誕生,iPhone使我們進化到智能產品的年代,現在有多少人仍然使用實體行程表而非電話內置的日歷?現在有多少人還會買實體地圖而非使用Google Map?Apple Watch的誕生引伸到人們使用「智能手帶」去記錄每天的行路、睡眠、心跳等資訊,這些看似隨機的資訊,在企業看來就是「大數據」,他們可以推算到我們上下班的時間地點,推算到我們的生活圈子,甚至乎根據我們的健康狀況估算我們的壽命,進而針對性地向我們推銷產品。

當然大數據的應用不只限於用戶的個人層面,現在已經投入應用的還包括醫療、國防、天氣預測、自動車等範疇。不過我想再強調的是「大數據」本身並無特別意義,它只是企業的行銷口號,值得我們注意的是支撐其背後的技術和其引申的私隱問題。

Once Upon A Day: The challenge to write one thing I learned for the day.