網路資訊/巨量資料浪潮來襲 是商機或「喪機」?

作/道格

企業是否正邁向巨量資料浪潮的顛峰?或者正朝著幻覺破滅的谷底邁進?

貴公司是否找到了巨量資料(Big Data)分析的運用案例?是否嘗試過像Hadoop之類的新平台?如果已經做過這些事,或許意味著已經知道希望從巨量資料中得到些什麼、以及有哪些問題需要解決。

知道自己的需求,代表有機會找出有用的商業資訊,而不只是儲存一大堆無用的資訊。

這裡所探討的技術,包括分散式運算(Distributed computing)、串流處理(Stream processing)、機器學習(Machine learning)、圖像分析(Graph analysis)等,可以增加分析的效能,讓分析更便宜、更容易使用。

[廣告]請繼續往下閱讀...

使用分散式運算與串流處理,公司可以從事過去做不到的大規模、快速分析。例如,銀行可以在1秒以內判斷一位客戶的資料,然後在網站上提供與他個人最相關的廣告。

另外也看到機器學習在複雜分析中發揮作用;例如,Memorial Sloan-Kettering癌症中心正在從事機器學習,以持續監控新的醫學文獻,並藉此提供癌症醫療建議,協助醫師診斷。

而且現在正目睹開放原始碼科技的出現,包括Apache Hadoop和R語言,讓公司可以使用更大、更廣的資料類型,並且用這些東西來解決新的商業分析問題。

舉例來說,共同基金公司American Century正在開發自己的R-based模型,使用圖像分析技術來找出公司之間的關連,就好比臉書(Facebook)可以找出人與人之間的關係一樣;這麼一來,American Century便可以強化自己的財報預測準度。

在這個階段,IT人員對於未來分析市場的願望清單還有一長串。大部分公司仍希望看到經過驗證的分析工具與方法,而不是還在測試階段的計畫。

他們想要簡單、容易上手的SQL或SQL類型分析,不受到限制的查詢能力、批次處理以及非即時處理。資料量不斷成長,而公司想要合理運用的資料來源種類也不斷增加。

在此同時,新創立的分析公司不斷提到Hadoop等巨量資料平台的問題,所以接下來的篇幅將會聚焦在現階段最新、最完整的資料使用方式。

開放原始碼可以解決難題

Apache Hadoop現在幾乎已經是巨量資料的同義詞,這種分散式資料處理架構可以用來打造大量分散式運算應用。Hadoop讓組織可以快速儲存大量不同的資料,無須關連式資料庫要求的所有管理工作。

不過,要在Hadoop上跑分析,目前仍需要更好的實例與技術,因此有待繼續努力。

以目前現有科技,公司可以在MapReduce中設計演算法,使用Hadoop的HBase NoSQL資料庫來擷取資料組,並利用Hive數據資料庫進行類似SQL的查詢。

但早期使用者發現了一些缺失,MapReduce程式很複雜,HBase不穩且不易管理,而Hive不但慢,且進行SQL分析的能力十分有限。

在Hadoop社群中,有越來越多參與者和新創公司正積極改善像是Hive這樣的工具,包括進行MapReduce設計的Apache Pig語言、以及部署機器學習演算法的Apache Mahout計畫。

這些新創公司發現Hadoop使用者很想要開發新的方法。

舉例來說,Opower賣的是可以讓電力公司追蹤其客戶電力使用狀況的系統。Opower使用Hadoop,結合數百萬電力客戶的資料、恆溫裝置、天氣與其它數據。

其中一份報告可以讓客戶知道自己的電力使用狀況,並且與當地相同規模的住家平均做比較。客戶還可以從網路上取得帳單金額預估,並獲得下一期的繳費提醒。

擁有這些資訊的消費者,就可以控制自己的用電量,諸如關掉家裡的恆溫裝置、改成經過設計的恆溫計,或調整成在用電離峰時間才使用。在2007年成立的Opower表示,使用其服務的1,500萬名客戶中,總共減少了2兆瓦電力,省下約2.2億美元。

不過這項服務的資料處理可不容易。就像許多Hadoop使用者一樣,Opower在Java上開發了客製化的MapReduce流程,可以從HBase擷取、處理數據,然後應用到分析模型中。

為了簡化流程,Opower使用WibiData開發的現成軟體來完成HBase分析工作。現任Opower基礎建設工程總監Drew Hylbert曾在雅虎(Yahoo)任職,他離開雅虎後開始投資MapReduce資料處理;他表示,這個軟體可以簡化2個步驟。

他說:「WibiData有助於完成資料更正,而資料更正是我們希望用自己的HBase架構完成的事;而且WibiData可以讓未來需要時能在HBase上增加資料。」

WibiData是支援Hadoop的眾多新創公司之一,由Cloudera創辦人Christophe Bisciglia創立。

WibiData提供Kiji函式庫給HBase架構發展,讓WibiData可以提供免費的開放原始碼軟體。這些函式庫讓大型HBase資料庫的資料儲存與擷取變得更容易。

該公司還提供開放原始碼的分析工具,也就是在HBase上運作的MapReduce模型與工具,並從顧問、企業支援與訓練獲得利潤。

Hylbert表示:「WibiData的想法是可以省略親自開發MapReduce的過程;與其尋找研究工程師與MapReduce工程師來完成開發,不如利用可重複的抽象化過程在多個應用中產生洞察(insight)。」

客戶可以重複使用軟體,不用每次有新的insight需求時就要開發新的MapReduce工作。

Opower還仰賴另一家新創公司Platfora來協助公司完成巨量資料視覺化工作,這又是另一個分析的分支。

Hylbert解釋,WibiData找來工程師研究第一手資料、並建立統計模型,不過其他Opower員工需要「看到數據、畫出圖表,然後用不同方式加以詮釋解讀;Platfora則在Hadoop與HBase上提供我們資料視覺化,並深入探索資訊。」

Opower正要開始部署Platfora;但如果發揮到極致,將可以取代SQL基礎的方法,讓Opower不必從Hadoop擷取資訊、再把資訊移到Infobright資料庫軟體、然後使用Pentaho資料圖像化工具完成分析。

Hylbert表示,Infobright與Pentaho軟體的結合固然「簡單好用」,但他寧可省去把資料從Hadoop移到SQL資料庫的過程。Platfora可以省略這個步驟,因為Platfora是直接在Hadoop上運作。

關鍵字: 網路資訊巨量資料分散式運算串流處理圖像分析原始碼

分享給朋友:

追蹤我們:

※本文版權所有,非經授權,不得轉載。[ETtoday著作權聲明]

推薦閱讀

2026出國玩注意!1張航空聯名卡掰了 中信銀擴大信用卡機場接送服務

2026出國玩注意!1張航空聯名卡掰了 中信銀擴大信用卡機場接送服務

國人出國善用信用卡機場接送、哩程數累積,甚至航空聯名卡享有買機票優惠,而迎來2026年新年度,發卡行新措施,中信銀針對鼎極卡在明年新增桃機/松機跨區接送服務預約,至於新光銀行的「日本航空聯名卡」明年起停止新戶申請。

2025-12-25 00:03

輝達停止測試18A晶片 英特爾股價跌近4%拉回

輝達停止測試18A晶片 英特爾股價跌近4%拉回

聖誕節前夕市場傳出輝達(NVIDIA)已停止測試英特爾(Intel)最先進的 18A 晶片製程技術,引發投資人對英特爾先進製程競爭力的疑慮。英特爾股價盤中一度下殺近 4%,隨後跌幅收斂。

2025-12-25 12:10

金價引爆「下車潮」!今年暴漲近7成創46年紀錄 貴金屬高檔震盪

金價引爆「下車潮」!今年暴漲近7成創46年紀錄 貴金屬高檔震盪

2025年全球貴金屬市場上演罕見大多頭行情,黃金、白銀、白金與鈀金價格今年全面暴漲,其中黃金年初至今漲幅逼近70%,創下自1979年以來最佳年度表現。不過,隨著價格接連改寫歷史新高,市場近期也開始出現獲利了結賣壓,貴金屬短線走勢轉為高檔震盪。

2025-12-25 11:17

輝達砸6300億買Groq資產 黃仁勳內部信曝「是吸收非併購」

輝達砸6300億買Groq資產 黃仁勳內部信曝「是吸收非併購」

AI 晶片霸主輝達(NVIDIA)再度出手,傳出以20億美元(約新台幣6300億元)的天價,取得 AI 晶片新創公司 Groq 的關鍵資產,創下公司史上最大規模交易,也震撼全球半導體與人工智慧產業。不過輝達強調,這並非併購整家公司,而是透過授權與延攬人才的方式,加速布局 AI 推論市場。

2025-12-25 10:09

元月效應 年初進場持有台股半年漲幅達7%

元月效應 年初進場持有台股半年漲幅達7%

時序進入年底,投資人已開始展望明年布局。歷史數據顯示,台股在年初往往具備強勁的元月效應與「紅包行情」,中國信託投信指出,根據彭博資訊統計過去十年數據,投資人若選擇在1月至2月期間進場布局台股,受惠於元月效應與農曆春節後的資金回籠,持有半年的平均漲幅可達7%以上,且上漲機率高達7至8成。此外國發會最新公布台灣景氣燈號續亮黃紅燈,顯示國內景氣仍延續成長態勢,歷史經驗也佐證 ,當景氣亮出黃紅燈時進場,台股平均報酬率達8.5%,顯示進場時機相對有利。

2025-12-25 06:05

聖誕送大禮!華邦電攜手南茂 認購700顆籃球捐贈20所偏鄉小學

聖誕送大禮!華邦電攜手南茂 認購700顆籃球捐贈20所偏鄉小學

華邦電(2344)與南茂(8150),於21日共同在台南市紀安國小與高雄市大樹國小,聯合舉辦「矽手相鏈,永續籃球」捐贈活動。透過實際行動,將循環經濟與永續發展理念帶入校園,展現企業攜手教育體系、落實公私協力的具體成果。

2025-12-25 06:00

旅行社股新兵到! 旅天下預計明年1月上櫃

旅行社股新兵到! 旅天下預計明年1月上櫃

旅天下聯合國際旅行社(6961)今日舉辦上櫃前業績發表會,並預計於 2026 年 1 月掛牌上櫃。旅天下2025年1至9月稅後淨利達9,586萬元,較2024年同期成長24%,創下歷史同期新高;每股盈餘(EPS)達4.06 元。

2025-12-24 18:12

陽明海運迎接53週年 二手貨公益義賣近70萬元回饋社會

陽明海運迎接53週年 二手貨公益義賣近70萬元回饋社會

陽明海運(2609)將於本月28日迎來成立53週年,特別於今(24)日聖誕節前夕,在陽明海運總公司七堵大樓舉辦53週年慶茶會及公益暨二手物品義賣市集活動,由陽明海運蔡豐明董事長及白崑榮總經理共同主持,回顧既往、擘劃未來,同時,延續公益理念,義賣市集活動所得近70萬元將全數捐贈予弱勢團體,藉此機會落實社會弱勢關懷。

2025-12-24 17:46

倒數計時!7、8月期統一發票還有2張千萬沒人領 明年1/5截止

倒數計時!7、8月期統一發票還有2張千萬沒人領 明年1/5截止

財政部臉書今(24)日公告,114年7至8月期統一發票領獎期限只到115年1月5日(星期一),距今剩不到半個月,民眾務必把握最後時間檢查手中發票,若不慎錯過期限,獎金將依法充公,與中獎擦身而過。

2025-12-24 17:45

一表看股價領先創高6檔台股ETF 統一00981A居績效王

一表看股價領先創高6檔台股ETF 統一00981A居績效王

年底績效趕進度!加權指數距離12月10日28400.72點歷史最高收盤價僅差28.75點,已有六檔台股ETF收盤價搶先一步創新高,分別主動統一台股增長(00981A)、台新臺灣IC設計(00947)、主動野村台灣50(00985A)、主動野村臺灣優選(00980A)、中信上櫃ESG 30(00928)、主動安聯台灣高息(00984A)等。

2025-12-24 16:54

讀者迴響

最夯影音

更多