提取大數(shù)據(jù)創(chuàng)造價值
數(shù)據(jù)一直以來具有決策價值,但是隨著數(shù)據(jù)量的不斷增加和處理數(shù)據(jù)能力的提升,數(shù)據(jù)已經(jīng)成為一類新的資產(chǎn)。通常采用“3V”來描述大數(shù)據(jù),即大容量(volumes)、數(shù)據(jù)處理的高速度(velocity)、信息來源的多種類(variety)。在傳統(tǒng)的“3V”基礎上,現(xiàn)在又增加了第四個V,即價值(value)。為了追求更高的價值,人們必須面對的問題是如何減少大數(shù)據(jù)的復雜性和降低其處理的難度。
大數(shù)據(jù)存在的形式多種多樣,可以是結構化的形式,比如金融交易數(shù)據(jù);也可以是非結構化的形式,比如圖片或者博客。大數(shù)據(jù)的高速增長伴隨著科技進步(比如射頻識別技術RFID)和社會發(fā)展(比如社交媒體的廣泛應用)。人們在討論、評述,以及網(wǎng)絡社交時都是數(shù)據(jù),而且規(guī)模巨大。我們在找什么?我們在讀什么?我們要去哪?諸如此類,幾乎所有可以想象的人類交往,都可以列入大數(shù)據(jù)的范圍。
大數(shù)據(jù)時代已經(jīng)來臨。它正在改變著人們的生活和商業(yè)模式,但成功地運用大數(shù)據(jù)所需要的不僅僅是數(shù)據(jù)。對于數(shù)據(jù)的價值創(chuàng)造,需要進行預測和決策模式的判斷。企業(yè)需要決定使用何種數(shù)據(jù),每個企業(yè)擁有的數(shù)據(jù)各不相同,差異很大。這些數(shù)據(jù)包括日志文檔、客戶的GPS數(shù)據(jù)或機器對機器的數(shù)據(jù),每個企業(yè)需要選擇用來創(chuàng)造價值的數(shù)據(jù)源。此外,創(chuàng)造價值需要用正確的方法提取數(shù)據(jù),以及用正確的分析方法分析這些數(shù)據(jù)。這就需要知道如何從各類大量的信息中分離出有價值的信息。
大數(shù)據(jù)的世界也引起了人們對隱私的關注。對于隱私和社會其他方面的問題,大數(shù)據(jù)所帶來的后果還沒有完全被認識到。一些專家呼吁對于任何由“群體智慧”創(chuàng)造的結果應保持謹慎。此外,軍事情報方面的大數(shù)據(jù)應用程序已經(jīng)引起了對隱私保護的擔憂。
事實上,人類現(xiàn)在生活在一個任何事物都能被測量的世界。人們?nèi)绻褂谜_的原則和指導方針,就應該能夠收集、測量和分析關于每個人和每個事物越來越多的信息和數(shù)據(jù),以做出對個人和集體更好的決策。



