文/產經研究室主任戴國良、研究員陳儀庭
Big Data正夯 SAS走在產業最前端
由於目前市場上各行各業幾乎都積極且瘋狂的嘗試導入Big Data相關技術或服務,來讓自家企業能獲得更好的獲利或更佳的生意機會,尤其是國內外金融業、實體零售業、電子商務業、電信業暨各類相關服務業…。
而也因此目前市場上有非常多國內外相關技術或服務的供應商出現,提供相關產品或服務的解決方案,這也讓各行各業的業者一則以喜有這麼多成熟且優異的解決方案,卻也一則以憂從這麼多解決方案中應如何挑選?尤其,有時候即使做了正確的服務選擇,但在實際導入的過程中,往往面對的挑戰是雙方溝通的適應及合作默契,都會影響最後導入的產出成果,而這些都是各行各業業主所頭痛的問題…。
◄SAS美國總公司最新的綠建築,曾出借給電影《鋼鐵人》拍過電影(圖/SAS提供)
本次《ETtoday東森新聞雲》產經研究室採訪賽仕電腦(以下簡稱SAS)副總經理高芬蒂,請其為廣大對Big Data有興趣的網友與企業人士,分享SAS這樣一個提供世界級統計分析產品與服務的企業,建議國內外企業應如何從BigData淘金?如何幫企業獲得期望的Big Data導入結果?
認識Big Data的特性:4個『V』
高芬蒂表示,大數據資料的特性就是指4個『V』,也就是資料的『volume(大量性)』、『variety(多樣性)』、『velocity(速度性,包含產生資料的速度、以及電腦處理的速度)』、『veracity(真實性,意指從海量資料背後統計分析出關聯與真相)』。亦即,當一個企業面對大量的資料快速生成,且資料的種類已經不限於單純的結構化資料,而是有更多種類的非結構化資料生成時,如何從這些資料中,透過電腦運算能力與高端統計技巧,成功觀察出如此海量資料背後的各類關聯關係,這樣的描述就符合所謂導入Big Data應用的情境。
舉例來說,未來進入物連網(又稱智慧連網)時代,人對人、人對物、物對物的溝通,將產生不可思議大量的資料,相關研究指出,其資料產生速度10年內將會比現在增加44倍以上,尤有甚者,未來很多資料的產生方式都不一樣了,且更多是屬於非結構化的資料…,這些『海量』資料未來如何透過Big Data技術分析出有意義的關聯,並據以讓政府、企業、法人組織乃至民眾得以有效運用,就是未來Big Data領域的重點顯學。
Big Data專注的不是『精準』,而是『關連』
意指,當資料大到無法用人力或一般資訊技術來做統計分析的程度時,Big Data就獲得了表現的舞台。舉例,Facebook或新浪微博這類大型社群網站會員非常多,其會員們每天產生的多媒體資料堪稱海量,此時若不使用Big Data技術,就無法快速且有效的分析出各種資料的關聯,也因此無法做出很多的行銷或廣告應用,當然,這些都是業主與廣告主最關心的資訊,因而可以想見,其業主於Big Data的分析投入一定是可觀的。
▲賽仕電腦(以下簡稱SAS)副總經理高芬蒂(圖/SAS提供)
同樣的,Amazon的成功也可歸功於Big Data的應用,其能透過BigData做到廣告與商品的精準推薦,因而讓其網站廣告的轉換率一向非常高並獲得廣告主青睞。而這些廣告主所關心的,也的確都不是『精準』,而是『關連』。例如,哪類商品推薦給哪類顧客轉換率會高?哪類廣告跟哪些商品放在一起時消費者會有興趣一起購買?這些關連性資訊,就是幫助廣告主、網路賣家與網站經營者淘金的關鍵。
另外,高芬蒂舉例, Amazon的Big Data應用已經發展到第三代了!第一代是於2001時Amazon推出的書評推薦服務、第二代是隔了幾年後推出的依據顧客過往買什麼、瀏覽記錄、購物車記錄…資料所做的『推薦書單』功能、第三代是開始透過『關連分析』,推薦消費者可能感興趣的看似不相關的衣物、電影、零嘴…商品。到了第三代時,Amazon早已不只是單純網路書店,而是網路超級百貨公司了。
另舉一例,Big Data不只對網路購物有幫助,對於政府與非營利組織更是有遠大的幫助。例如,當年H1N1流行時,各國平均要兩週以上才能找到病源並予以控制,其實這兩週的病毒擴散才是最可怕的風險。因此,當時Google便做了一個實驗,利用海量資料分析技術與建立4,500萬個數學模型,透過對5,000萬個關鍵字結合搜尋地區的相關連分析2008~2009年的資料,最後找到50個核心關鍵字,並發現只要這50個關鍵字於某地區網友搜尋出現評率高時,就可以提前兩個禮拜知道這個地區的H1N1將要大流行了。這樣的技術成功幫助各國政府未來可監控H1N1的擴散,而這樣的分析能力就是Big Data海量分析最重要的也是與傳統的統計分析最大的根本差異。
零售業(用於行銷)、銀行業(用於風險管控)、製造業(用於排程規劃)、半導體業(用於品管與設備維護)…是應用Big Data的先鋒產業
高芬蒂特別分享,過往大家對Walmart Big Data經典『啤酒尿布』案例的認識早已經是過去式了,現在式是Walmart每天都會結合POS機的交易資料、交易日期、天氣氣候、地理資訊、其他可得的各類與交易相關資訊…,全都投入做Big Data分析『關連』,然後立即把分析結果資料提供給相關供應商,讓供應商據以參考後,『及早』、『精準』的決定應提前備貨、鋪貨的數量與時間。透過這樣的資料,成功降低供應商的庫存與倉儲成本,並成功幫助供應商獲得更高營收。
高芬蒂並舉一國內案例,萬泰銀行為了針對刷卡服務做到較好的風險控管,原本月中才拿的到上個月底的刷卡客戶信用報告資料,這樣的時效性不夠並容易面對呆帳與欠款風險,因此首要需求是(1)希望能『即時』獲得daily的刷卡客戶信用報告分析資料。 (2)次要需求是該類分析報告必須能『視覺化』的呈現以利相關管理單位能夠更直觀、便利的據以快速做出正確決策。 (3)第三個需求是相關分析結果要能支援於『行動載具』上順暢呈現,如此一來,對於經常必須移動前往各處開會的主管,就能透過行動載具順利掌握風險控管情形。高副總表示,SAS已成功與萬泰銀行合作,解決了上列問題。
▲SAS總公司贊助員工自行車比賽(圖/SAS提供)
又例如新加坡摩根史坦利原本就是SAS的老客戶,為了服務好摩根史坦利並滿足其對於『分析速率』的追求,SAS不斷改進與提昇產品服務,近來獲得的成績是,過往摩根史坦利透過SAS服務原本要24小時才能算出的金融市場分析資料,現在SAS的新服務只要20分鐘,就能幫摩根史坦利透運算分析出來,成功解決客戶需求。
其它在台灣像是台北醫學大學醫療體系以及萬泰商業銀行,亦早已是Big Data導入的成功單位。
導入Big Data要成功,高芬蒂給大家的建議
1. 資料的準備:資料準備的工作沒完成,或資料蒐集與整理的不完整,都無法順利運作Big Data分析,當然也遑論分析出有意義的『關連』資料。因此,欲速則不達,從資料的準備開始一直到分析出有意義的關連資訊,一般來說平均需要半年左右的時間。建議有意願導入的企業不要著急,必須按部就班的紮穩基本功才能獲得好的成效。
2. 人才的專業:Big Data分析所需要的人才跟傳統統計分析需要的人才不一樣,因此,建議各單位對外尋找或對內培育相關Big Data人才時,應注意相關人才除了需具備最基本的統計分析能力外,更須具備資管能力(或有資管類人員支援)才更容易導入成功。也因此,SAS特別培育其自家全球近10,000多位Big Data相關成為統計、商業管理、資訊科學三合一人才。當然,很多企業客戶也提到目前Big Data人才很難找,高副總建議,可從國內外知名企管、工業工程、統計、經濟研究所尋找可造之才。至於判斷是不是Big Data人才的關鍵指標,就是人才的『邏輯分析』能力。
3. 用正確工具:高副總強調,選對Big Data工具真的很重要,例如SAS為了提供給客戶最好的服務與產品,幾乎每半年就更新釋出一個新版本產品,其並深信唯有不斷進化與進步,並強化各類功能,才能長久獲得客戶青睞。
讀者迴響