大數(shù)據(jù)時(shí)代讀書心得一:
《大數(shù)據(jù)時(shí)代》是英國(guó)維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國(guó)外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點(diǎn)就在于作者利用上百個(gè)例子來對(duì)大數(shù)據(jù)的方方面面做了詳細(xì)解說,讓外行也很容易理解。結(jié)構(gòu)上,作者通過大數(shù)據(jù)時(shí)代的思維變革、商業(yè)變革和管理變革三個(gè)角度依次闡述,條理清晰。
所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計(jì)算機(jī)運(yùn)算速度和存儲(chǔ)能力的發(fā)展,收集數(shù)據(jù)變得越來越簡(jiǎn)單,儲(chǔ)存數(shù)據(jù)的成本越來越低。在過去,由于技術(shù)限制,人們做統(tǒng)計(jì)時(shí)只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機(jī)樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計(jì)結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。 "小數(shù)據(jù)"時(shí)代,一個(gè)樣本的錯(cuò)誤就可以造成對(duì)總體估計(jì)的失敗,幸運(yùn)的是,"大數(shù)據(jù)"時(shí)代對(duì)精確性不再那么要求苛刻——也無法要求太嚴(yán)格——數(shù)據(jù)的數(shù)量足以彌補(bǔ)這一缺陷。在對(duì)思維變革這一部分的闡述中,最重要也是全書的核心觀點(diǎn)就是大數(shù)據(jù)時(shí)代,我們應(yīng)該從追求"因果關(guān)系"的舊思維方式向追求"相關(guān)關(guān)系"轉(zhuǎn)變。 在我看來,這實(shí)際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢(shì),而很多精確學(xué)科領(lǐng)域依然需要探尋"因果關(guān)系"解決更有針對(duì)性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。"
大數(shù)據(jù)時(shí)代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對(duì)這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價(jià)值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無限使用,時(shí)效、環(huán)境的變化肯定會(huì)對(duì)數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對(duì)數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對(duì)于Facebook, Twitter這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個(gè)公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時(shí)代的價(jià)值鏈由三部分構(gòu)成,我把它們簡(jiǎn)化為"生產(chǎn)—分析—使用"三個(gè)環(huán)節(jié),這對(duì)應(yīng)書中的三種類型公司: 第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價(jià)值,但作者認(rèn)為,最終,大部分的價(jià)值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個(gè)成熟的市場(chǎng),人人都了解了大數(shù)據(jù)的用途。
對(duì)于普通人來說,大數(shù)據(jù)時(shí)代最關(guān)心的還是隱私問題。不知不覺中,個(gè)人的一舉一動(dòng)都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險(xiǎn)。對(duì)此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測(cè)一個(gè)人的犯罪動(dòng)機(jī),這給監(jiān)管者帶來的難題是,預(yù)測(cè)一個(gè)人要犯罪,懲罰還是不懲罰?在這點(diǎn)上,社會(huì)達(dá)成"個(gè)人僅需對(duì)行為而非動(dòng)機(jī)負(fù)責(zé)"的共識(shí)非常重要。
大數(shù)據(jù)時(shí)代的風(fēng)險(xiǎn)控制靠的是"算法師",類似會(huì)計(jì)師一樣的職業(yè),對(duì)大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨(dú)裁。當(dāng)今的法律亦需對(duì)大數(shù)據(jù)監(jiān)管進(jìn)行修訂補(bǔ)充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動(dòng),相信在不久的將來更多的傳統(tǒng)領(lǐng)域會(huì)意識(shí)到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬能藥,對(duì)某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡(jiǎn)單且實(shí)用的選擇;但對(duì)某些領(lǐng)域,盲目使用大數(shù)據(jù)只會(huì)適得其反。
大數(shù)據(jù)時(shí)代讀書心得二:
2014年4月13日下午,在湖南大學(xué)東樓205參加了關(guān)于《大數(shù)據(jù)時(shí)代》的讀書交流活動(dòng)。通過相互交流學(xué)習(xí),使我更深層次的理解了大數(shù)據(jù)時(shí)代的利與弊,機(jī)遇和挑戰(zhàn)。在寫心得體會(huì)前,我想再重新審視一下關(guān)于大數(shù)據(jù)的歷史沿革和現(xiàn)實(shí)意義。
首先,最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù) 據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來!薄按髷(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙砘ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計(jì)算、物聯(lián)網(wǎng)之后又IT行業(yè)又一大顛覆性的技術(shù)革命。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場(chǎng)所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國(guó)家治理、企業(yè)決策乃至個(gè)人生活服務(wù),是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。
其次,進(jìn)入2012年,大數(shù)據(jù)(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時(shí)報(bào)》《華爾街日?qǐng)?bào)》的專欄封面,進(jìn)入美國(guó)白宮官網(wǎng)的新聞,現(xiàn)身在國(guó)內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國(guó)金證券、國(guó)泰君安、銀河證券等寫進(jìn)了投資推薦報(bào)告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識(shí)到數(shù)據(jù)爆炸性增長(zhǎng)帶來問題的隱患,但是隨著時(shí)間的推移,人們將越來越多的意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性。正如《紐約時(shí)報(bào)》2012年2月的一篇專欄中所稱,“大數(shù)據(jù)”時(shí)代已經(jīng)降臨,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺。哈佛大學(xué)社會(huì)學(xué)教授加里·金說:“這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程!
最后,隨著云時(shí)代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注。著云臺(tái)的分析師團(tuán)隊(duì)認(rèn)為,大數(shù)據(jù)(Big data)通常用來形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過多時(shí)間和金錢。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作!按髷(shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運(yùn)營(yíng)中生成、累積的用戶網(wǎng)絡(luò)行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多(相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長(zhǎng)為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
首先,談?wù)劥髷?shù)據(jù)帶給生活的轉(zhuǎn)變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢(shì),可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實(shí)現(xiàn)利益最大化。而我們很多人對(duì)大數(shù)據(jù)還很陌生,只是被動(dòng)的適應(yīng)著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時(shí)代是以云計(jì)算為基礎(chǔ)的,所以,要實(shí)現(xiàn)大數(shù)據(jù),相關(guān)的很多的硬件設(shè)備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關(guān)產(chǎn)業(yè)都要重新調(diào)整產(chǎn)業(yè)結(jié)構(gòu),在那時(shí),可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時(shí)代的到來會(huì)解放更多的勞動(dòng)生產(chǎn)力,勢(shì)必將會(huì)更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會(huì)兩極分化現(xiàn)象會(huì)更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時(shí)代的到來會(huì)使人們的生活節(jié)奏急速加快,信息的時(shí)效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會(huì)越來越忙,到那時(shí),就像現(xiàn)在的日本,可能想找個(gè)人聽你說說話,真的是一件很難的事。
第二,關(guān)于數(shù)據(jù)管理的看法。大數(shù)據(jù)時(shí)代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識(shí),不主動(dòng)泄露信息,要管理好自己身邊的信息設(shè)備;技防,就是要運(yùn)用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫(kù),定時(shí)查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應(yīng)當(dāng)做到備份與原始文件是物理隔離,無關(guān)的信息應(yīng)當(dāng)及時(shí)刪除,減輕硬盤的壓力。
三、怎么保護(hù)自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時(shí)代,更要管理好自己的隱私,以免對(duì)自己和家人造成麻煩和損失。越是隱私的信息,越要遠(yuǎn)離網(wǎng)絡(luò),不要再公開的社交網(wǎng)絡(luò)儲(chǔ)存和展示個(gè)人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質(zhì)的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機(jī)碼來保護(hù)自己真實(shí)IP地址,提高網(wǎng)絡(luò)安全的可靠性,加強(qiáng)對(duì)聯(lián)網(wǎng)信息的管理和保護(hù)。
不論我們情不情愿,大數(shù)據(jù)時(shí)代都會(huì)到來,現(xiàn)實(shí)社會(huì)是我們高喊著走向大數(shù)據(jù)時(shí)代,其實(shí)大數(shù)據(jù)時(shí)代已經(jīng)向我們走來,所以與其被動(dòng)接受,不如主動(dòng)學(xué)習(xí),從中找到自己的出路,成為大數(shù)據(jù)時(shí)代的建設(shè)者和受益者。
[大數(shù)據(jù)時(shí)代讀書心得體會(huì)2016]