計算機有關大數據的應用論文
計算機有關大數據的應用論文
在大數據環(huán)境下,計算機信息處理技術也面臨新的挑戰(zhàn),要求計算機信息處理技術必須不斷的更新發(fā)展,以能夠對當前的計算機信息處理需求滿足。下面是學習啦小編給大家推薦的計算機有關大數據的應用論文,希望大家喜歡!
計算機有關大數據的應用論文篇一
《計算機軟件技術在大數據時代的應用》
摘要:大數據的爆炸式增長在大容量、多樣性和高增速方面,全面考驗著現代企業(yè)的數據處理和分析能力;同時,也為企業(yè)帶來了獲取更豐富、更深入和更準確地洞察市場行為的大量機會。對企業(yè)而言,能夠從大數據中獲得全新價值的消息是令人振奮的。然而,如何從大數據中發(fā)掘出“真金白銀”則是一個現實的挑戰(zhàn)。這就要求采用一套全新的、對企業(yè)決策具有深遠影響的解決方案。
關鍵詞:計算機 大數據時代 容量 準確 價值 影響 方案
1 概述
自從計算機出現以后,傳統的計算工作已經逐步被淘汰出去,為了在新的競爭與挑戰(zhàn)中取得勝利,許多網絡公司開始致力于數據存儲與數據庫的研究,為互聯網用戶提供各種服務。隨著云時代的來臨,大數據已經開始被人們廣泛關注。一般來講,大數據指的是這樣的一種現象:互聯網在不斷運營過程中逐步壯大,產生的數據越來越多,甚至已經達到了10億T。大數據時代的到來給計算機信息處理技術帶來了更多的機遇和挑戰(zhàn),隨著科技的發(fā)展,計算機信息處理技術一定會越來越完善,為我們提供更大的方便。
大數據是IT行業(yè)在云計算和物聯網之后的又一次技術變革,在企業(yè)的管理、國家的治理和人們的生活方式等領域都造成了巨大的影響。大數據將網民與消費的界限和企業(yè)之間的界限變得模糊,在這里,數據才是最核心的資產,對于企業(yè)的運營模式、組織結構以及文化塑造中起著很大的作用。所有的企業(yè)在大數據時代都將面對戰(zhàn)略、組織、文化、公共關系和人才培養(yǎng)等許多方面的挑戰(zhàn),但是也會迎來很大的機遇,因為只是作為一種共享的公共網絡資源,其層次化和商業(yè)化不但會為其自身發(fā)展帶來新的契機,而且良好的服務品質更會讓其充分具有獨創(chuàng)性和專用性的鮮明特點。所以,知識層次化和商業(yè)化勢必會開啟知識創(chuàng)造的嶄新時代??梢?,這是一個競爭與機遇并存的時代。
2 大數據時代的數據整合應用
自從2013年,大數據應用帶來令人矚目的成績,不僅國內外的產業(yè)界與科技界,還有各國政府部門都在積極布局、制定戰(zhàn)略規(guī)劃。更多的機構和企業(yè)都準備好了迎接大數據時代的到來,大數據的內涵應是數據的資產化和服務化,而挖掘數據的內在價值是研究大數據技術的最終目標。在應用數據快速增長的背景下,為了降低成本獲得更好的能效,越來越趨向專用化的系統架構和數據處理技術逐漸擺脫傳統的通用技術體系。如何解決“通用”和“專用”體系和技術的取舍,以及如何解決數據資產化和價值挖掘問題。
企業(yè)數據的應用內容涵蓋數據獲取與清理、傳輸、存儲、計算、挖掘、展現、開發(fā)平臺與應用市場等方面,覆蓋了數據生產的全生命周期。除了Hadoop版本2.0系統YARN,以及Spark等新型系統架構介紹外,還將探討研究流式計算(Storm,Samza,Puma,S4等)、實時計算(Dremel,Impala,Drill)、圖計算(Pregel,Hama,Graphlab)、NoSQL、NewSQL和BigSQL等的最新進展。在大數據時代,借力計算機智能(MI)技術,通過更透明、更可用的數據,企業(yè)可以釋放更多蘊含在數據中的價值。實時、有效的一線質量數據可以更好地幫助企業(yè)提高產品品質、降低生產成本。企業(yè)領導者也可根據真實可靠的數據制訂正確戰(zhàn)略經營決策,讓企業(yè)真正實現高度的計算機智能決策辦公,下面我們從通信和商業(yè)運營兩個方面進行闡述。
2.1 通信行業(yè):XO Communications通過使用IBM SPSS預測分析軟件,減少了將近一半的客戶流失率。XO現在可以預測客戶的行為,發(fā)現行為趨勢,并找出存在缺陷的環(huán)節(jié),從而幫助公司及時采取措施,保留客戶。此外,IBM新的Netezza網絡分析加速器,將通過提供單個端到端網絡、服務、客戶分析視圖的可擴展平臺,幫助通信企業(yè)制定更科學、合理決策。電信業(yè)者透過數以千萬計的客戶資料,能分析出多種使用者行為和趨勢,賣給需要的企業(yè),這是全新的資料經濟。中國移動通過大數據分析,對企業(yè)運營的全業(yè)務進行針對性的監(jiān)控、預警、跟蹤。系統在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。
2.2 商業(yè)運營:辛辛那提動物園使用了Cognos,為iPad提供了單一視圖查看管理即時訪問的游客和商務信息的服務。借此,動物園可以獲得新的收入來源和提高營收,并根據這些信息及時調整營銷政策。數據收集和分析工具能夠幫助銀行設立最佳網點,確定最好的網點位置,幫助這個銀行更好地運作業(yè)務,推動業(yè)務的成長。
3 企業(yè)信息解決方案在大數據時代的應用
企業(yè)信息管理軟件廣泛應用于解決欺詐偵測、雇員流動、客戶獲取與維持、網絡銷售、市場細分、風險分析、親和性分析、客戶滿意度、破產預測和投資組合分析等多樣化問題。根據大數據時代的企業(yè)挖掘的特征,提出了數據挖掘的SEMMA方法論――在SAS/EM環(huán)境中,數據挖掘過程被劃分為Sample、Explore、Modify、Model、Assess這五個階段,簡記為SEMMA:
3.1 Sample 抽取一些代表性的樣本數據集(通常為訓練集、驗證集和測試集)。樣本容量的選擇標準為:包含足夠的重要信息,同時也要便于分析操作。該步驟涉及的處理工具為:數據導入、合并、粘貼、過濾以及統計抽樣方法。
3.2 Explore 通過考察關聯性、趨勢性以及異常值的方式來探索數據,增進對于數據的認識。該步驟涉及的工具為:統計報告、視圖探索、變量選擇以及變量聚類等方法。
3.3 Modify 以模型選擇為目標,通過創(chuàng)建、選擇以及轉換變量的方式來修改數據集。該步驟涉及工具為:變量轉換、缺失處理、重新編碼以及數據分箱等。
3.4 Model 為了獲得可靠的預測結果,我們需要借助于分析工具來訓練統計模型或者機器學習模型。該步驟涉及技術為:線性及邏輯回歸、決策樹、神經網絡、偏最小二乘法、LARS及LASSO、K近鄰法以及其他用戶(包括非SAS用戶)的模型算法。
3.5 Assess 評估數據挖掘結果的有效性和可靠性。涉及技術為:比較模型及計算新的擬合統計量、臨界分析、決策支持、報告生成、評分代碼管理等。數據挖掘者可能不會使用全部SEMMA分析步驟。然而,在獲得滿意結果之前,可能需要多次重復其中部分或者全部步驟。
在完成SEMMA步驟后,可將從優(yōu)選模型中獲取的評分公式應用于(可能不含目標變量的)新數據。將優(yōu)選公式應用于新數據,這是大多數數據挖掘問題的目標。此外,先進的可視化工具使得用戶能在多維直方圖中快速、輕松地查閱大量數據并以圖形化方式比較模擬結果。SAS/EM包括了一些非同尋常的工具,比如:能用來產生數據挖掘流程圖的完整評分代碼(SAS、C以及Java代碼)的工具,以及交換式進行新數據評分計算和考察執(zhí)行結果的工具。
如果您將優(yōu)選模型注冊進入SAS元數據服務器,便可以讓SAS/EG和SAS/DI Studio的用戶分享您的模型,從而將優(yōu)選模型的評分代碼整合進入工作報告和生產流程之中。SAS模型管理系統,通過提供了開發(fā)、測試和生產系列環(huán)境的項目管理結構,進一步補充了數據挖掘過程,實現了與SAS/EM的無縫聯接。
在SAS/EM環(huán)境中,您可以從SEMMA工具欄上拖放節(jié)點進入工作區(qū)的工藝流程圖中,這種流程圖驅動著整個數據挖掘過程。SAS/EM的圖形用戶界面(GUI)是按照這樣的思路來設計的:一方面,掌握少量統計知識的商務分析者可以瀏覽數據挖掘過程的技術方法;另一方面,具備數量分析技術的專家可以用微調方式深入探索每一個分析節(jié)點。
4 結束語
在近十年時間里,數據采集、存儲和數據分析技術飛速發(fā)展,大大降低了數據儲存和處理的成本,一個大數據時代逐漸展現在我們的面前。大數據革新性地將海量數據處理變?yōu)榭赡?,并且大幅降低了成本,使得越來越多跨專業(yè)學科的人投入到大數據的開發(fā)應用中來。
參考文獻:
[1]薛志文.淺析計算機網絡技術及其發(fā)展趨勢[J].信息與電腦,2009.
[2]張帆,朱國仲.計算機網絡技術發(fā)展綜述[J].光盤技術,2007.
[3]孫雅珍.計算機網絡技術及其應用[J].東北水利水電,1994.
[4]史萍.計算機網絡技術的發(fā)展及展望[J].五邑大學學報,1999.
[5]桑新民.步入信息時代的學習理論與實踐[M].中央廣播大學出版社,2000.
[6]張浩,郭燦.數據可視化技術應用趨勢與分類研究[J].軟件導刊.
[7]王丹.數字城市與城市地理信息產業(yè)化――機遇與挑戰(zhàn)[J].遙感信息,2000(02).
[8]楊鳳霞.淺析Excel 2000對數據的安全管理[J].湖北商業(yè)高等專科學校學報,2001(01).