關于什么是大數(shù)據(jù)和數(shù)據(jù)分析?
對于這一問題,答案是多種多樣的,此文分別從實踐者,觀察者和預言者三種角度來分析,看完會對您有所啟發(fā)。

觀點1,實踐者的角度來看:
大數(shù)據(jù) - 表示數(shù)據(jù)的幾個維度 - 可用數(shù)據(jù)的多樣性,速度,體積和可信度。此外,大數(shù)據(jù)相關技術使我們能夠處理和存儲4V的一個或所有特性。
數(shù)據(jù)分析 - 通常意味著探索性數(shù)據(jù)分析,可視化和報告。我們可以使用大數(shù)據(jù)或典型數(shù)據(jù)來了解和探索數(shù)據(jù),并更好地了解上下文。或回答幾個商業(yè)問題。
數(shù)據(jù)科學或更早的業(yè)務分析 - 讓我們建立統(tǒng)計學,數(shù)學和機器學習模型,以獲得更好的業(yè)務成果。我們可以使用大數(shù)據(jù)來做到這一點。

觀點2,實踐者的角度來看:
大數(shù)據(jù)只不過是非結構化數(shù)據(jù)的收集。這些數(shù)據(jù)不是特定的格式,因為它的數(shù)據(jù)集大小通常是巨大的 - 測量數(shù)十TB,有時跨越PB的門檻。大數(shù)據(jù)術語之前是使用數(shù)據(jù)庫管理系統(tǒng)(DBMS)進行管理的非常大的數(shù)據(jù)庫(VLDB)。
大數(shù)據(jù)分析是檢查大量和多樣化數(shù)據(jù)集(即大數(shù)據(jù))的過程,以發(fā)現(xiàn)隱藏模式,未知相關性,市場趨勢,客戶偏好和其他有用信息,可幫助組織做出更明智的業(yè)務決策。由專業(yè)分析系統(tǒng)和軟件驅動,大數(shù)據(jù)分析可以指出各種業(yè)務收益,包括新的收入機會,更有效的營銷,更好的客戶服務,提高運營效率以及競爭對手的競爭優(yōu)勢。
雖然這些定義可能聽起來很簡單,但它們是相當復雜的領域。大數(shù)據(jù)和分析涉及很多步驟和技術。其中一些是數(shù)據(jù)采集,出生的數(shù)字數(shù)據(jù),出生的模擬數(shù)據(jù),非關系數(shù)據(jù)庫,內(nèi)存數(shù)據(jù)庫系統(tǒng),混合數(shù)據(jù)存儲和處理系統(tǒng) - Apache Hadoop和數(shù)據(jù)挖掘。
此外,使用彈性搜索,變得更加容易理解大數(shù)據(jù)。它用于網(wǎng)頁搜索,日志分析和大數(shù)據(jù)分析。還有許多其他工具,但Elasticsearch更受歡迎,因為它易于安裝,擴展到數(shù)百個節(jié)點,沒有額外的軟件,并且由于其內(nèi)置的REST API而易于使用。
Google的AlphaGo計算機在Go游戲中擊敗了世界冠軍Lee Se-dol,Data已經(jīng)成為新的貨幣,全球政府已經(jīng)開始大力投資智慧城市。圍繞大數(shù)據(jù)的炒作終于結束了,在2017年的今年,我們可以預期數(shù)據(jù)在數(shù)量和種類上都會大幅增長。

觀點3,預言者角度分析:
HADOOP將成為WIDESPREAD
今年,我們將看到Hadoop采用的激增以及組織的其他相關解決方案。隨著Hadoop的采用,任何規(guī)模的組織都可以使用高級分析來處理大量和多種數(shù)據(jù)。采用更高級的數(shù)據(jù)庫,如MemSQL,Exasol等,已經(jīng)成為組織成功的關鍵。
IOT,云和大數(shù)據(jù)的收斂
隨著幾個互聯(lián)網(wǎng)連接的IoT設備的出現(xiàn),大量的結構化和非結構化數(shù)據(jù)的涌入。這些數(shù)據(jù)中的大部分部署在云服務中。該數(shù)據(jù)將駐留在包括Hadoop集群到NoSQL數(shù)據(jù)庫的幾個關系和非關系系統(tǒng)中。云遷移十大注意事項
混合現(xiàn)實
混合現(xiàn)實將改善數(shù)據(jù)可視化AR和VR在過去幾年中贏得了客戶的極大的關注。隨著神奇寶貝的推出,增強現(xiàn)實在幾個星期內(nèi)就已經(jīng)獲得了大約1億用戶。雖然AR或VR可能對大公司來說可能不是很有用,但混合現(xiàn)實的概念可能非常好。混合現(xiàn)實將虛擬世界與現(xiàn)實世界結合起來,像微軟全能組織這樣的設備已經(jīng)在吸引人。混合現(xiàn)實將為組織提供更好的執(zhí)行任務以及更好地了解數(shù)據(jù)的巨大機會。chatbots上升的前五大平臺
深度學習
深度學習是基于神經(jīng)網(wǎng)絡的高級機器學習形式。深度學習有助于從大量非結構化數(shù)據(jù)中識別特定的興趣項目。從大量的結構化和非結構化數(shù)據(jù)中學習是非常有用的。因此,企業(yè)和組織應該更多地關注深度學習算法來應對數(shù)據(jù)的大量涌入。
數(shù)據(jù)虛擬化
今年數(shù)據(jù)虛擬化將呈現(xiàn)強勁勢頭。數(shù)據(jù)虛擬化能夠從大量數(shù)據(jù)中解鎖隱藏的概念和結論。它還允許企業(yè)和組織隨時檢索和操縱數(shù)據(jù)。
結論
如前所述,今年將是一個令人興奮的一年,大數(shù)據(jù)和分析系統(tǒng)將成為組織的首要任務。這些系統(tǒng)預計運作良好,履行對企業(yè)價值的承諾。



