數(shù)據(jù),大家會陌生嗎?不會。我們每天的日常生活都會接觸到數(shù)據(jù)。淘寶購物時貨比三家的價格,年終考核之后發(fā)給我們的獎金,發(fā)表在論壇上的文章的評論數(shù)量,這些都是數(shù)據(jù)。
從人們會計數(shù)開始,數(shù)據(jù)就有了,數(shù)據(jù)分析也是。那么大數(shù)據(jù)呢?
說到大數(shù)據(jù),你就繞不開互聯(lián)網(wǎng)。在互聯(lián)網(wǎng)出現(xiàn)之前,雖然政府部門和一些公共事業(yè)單位通過日積月累獲得了較大量的數(shù)據(jù),但并沒有形成足夠的影響力。直到互聯(lián)網(wǎng)產(chǎn)品的出現(xiàn),由于它收集用戶數(shù)據(jù)的便利性,通常在一天之內(nèi)就能夠累計其他行業(yè)可能一年才能獲取的數(shù)據(jù)量。 數(shù)據(jù)量的升級造成算法和硬件都必須要升級,操作起來的技術(shù)難度也就會提高很多。這個時候,就需要專業(yè)的技術(shù)和平臺來完成存儲,處理和分析大數(shù)據(jù)的工作。比如說,大家都聽過的Hadoop平臺,MapReduce算法。都是大數(shù)據(jù)時代的產(chǎn)物。因此,
大數(shù)據(jù)的核心,就在于大。
有一定規(guī)模的互聯(lián)網(wǎng)公司都會成立專門的大數(shù)據(jù)部門來管理自己產(chǎn)品所收集到的大數(shù)據(jù)。數(shù)據(jù)量越大,處理難度就越高,相應(yīng)的,可能挖掘到的內(nèi)涵也會更多。于是,大數(shù)據(jù)就成了一個產(chǎn)業(yè),一個火熱的產(chǎn)業(yè)。
大數(shù)據(jù)入門的科普讀物,應(yīng)該看哪一本呢?很多人推薦了吳軍的《智能時代》。 大數(shù)據(jù)圈子里的人
在大數(shù)據(jù)行業(yè)這個圈子里,公司提供的職位大致分為三類:數(shù)據(jù)分析師,數(shù)據(jù)產(chǎn)品經(jīng)理,數(shù)據(jù)工程師。他們緊密合作,共同驅(qū)動公司的數(shù)據(jù)決策文化。
那么,這三種職位都是做什么的?又該怎么入行呢?
數(shù)據(jù)分析師
數(shù)據(jù)分析師,是使用大數(shù)據(jù)的人。核心是掌握各種數(shù)據(jù)分析工具和數(shù)據(jù)分析技能,目標是為公司管理層和產(chǎn)品團隊提供分析報告,幫助他們做決策。
實際工作中,數(shù)據(jù)會被處理成各種不同的類型提供給數(shù)據(jù)分析師使用,有比較原始的,有比較簡單好用的。因此,數(shù)據(jù)分析師需要掌握R, SQL,Excel, Python基礎(chǔ)編程等多種技能,以及熟練掌握常用的數(shù)據(jù)分析方法。
如果你立志于成為一個數(shù)據(jù)分析師甚至數(shù)據(jù)科學家,那么建議你進行系統(tǒng)的學習。
1. 英文好的可以去系統(tǒng)學習:Data Science - Johns Hopkins University | Coursera
2. 如果你有一定的經(jīng)驗和編程基礎(chǔ),也可以考慮秦路的自學指南:如何七周成為數(shù)據(jù)分析師
常見的推薦書籍有《R語言實戰(zhàn)》,《深入淺出統(tǒng)計學》,《Python for Data Analysis》等。
數(shù)據(jù)產(chǎn)品經(jīng)理
數(shù)據(jù)產(chǎn)品經(jīng)理是設(shè)計數(shù)據(jù)產(chǎn)品的人。核心技能是數(shù)據(jù)需求分析和數(shù)據(jù)產(chǎn)品的設(shè)計,和其他的互聯(lián)網(wǎng)產(chǎn)品經(jīng)理并沒有本質(zhì)的不同。實際工作中,數(shù)據(jù)產(chǎn)品經(jīng)理需要收集不同用戶的數(shù)據(jù)需求并且設(shè)計出好用的數(shù)據(jù)產(chǎn)品提供給大家,幫助他們“用數(shù)據(jù)做決定”。
常見的推薦入門書籍有《人人都是產(chǎn)品經(jīng)理》,《The DatawareHouse Toolkit》,《Lean Analytics》等等。
數(shù)據(jù)工程師
數(shù)據(jù)工程師,簡單分兩種,一類是數(shù)據(jù)挖掘工程師,另外一類是大數(shù)據(jù)平臺工程師。工程師的基本技能當然是寫代碼,寫高質(zhì)量的代碼。
數(shù)據(jù)挖掘工程師主要工作是開發(fā)大數(shù)據(jù)流水線以及和數(shù)據(jù)分析師一起完成數(shù)據(jù)挖掘項目,而數(shù)據(jù)平臺工程師主要工作是維護大數(shù)據(jù)平臺。
因此,理工科背景出身,掌握C, C#, Python等編程/腳本語言,熟悉各種基礎(chǔ)算法即可以勝任。
如何用數(shù)據(jù)做決策 對于那些并不想轉(zhuǎn)行進入大數(shù)據(jù)圈子的人,我們要學的究竟是什么?
在我們的日常工作中,特別是業(yè)績不佳,找不到突破口的時候,都曾想過能否用數(shù)據(jù)來幫助自己。因為我們都曾或多或少聽過一些牛逼的數(shù)據(jù)案例,比如紙尿布與啤酒之類。
舉一個簡單的例子,你經(jīng)營的餐館現(xiàn)在狀況不佳。你可以自己拍腦袋想一堆的新點子來嘗試改善現(xiàn)狀。你也可以,收集整理數(shù)據(jù),通過分析找出根本原因,并提出對應(yīng)解決方案,從而扭轉(zhuǎn)局面。后者聽起來似乎更加靠譜一些。
那么,你該收集什么數(shù)據(jù),做什么分析,這就是你需要學習的:“如何用數(shù)據(jù)做決策”。從這個角度講:人人都應(yīng)該是數(shù)據(jù)分析師
學習系統(tǒng)的數(shù)據(jù)決策和數(shù)據(jù)分析思維,我們可以從這篇文章開始:從0到1搭建數(shù)據(jù)分析知識體系。
關(guān)于數(shù)據(jù)分析的書籍太多了,眾口難調(diào),隨便一搜就有一大堆推薦。而其中所講的知識和理論其實都是類似的。最終要讓他們發(fā)揮作用,還是要和實踐結(jié)合起來。
因此,在自己的生意和工作中多實踐數(shù)據(jù)分析,多思考,遇到問題多在社群中提問和大家探討,是最好的學習辦法。
帶著問題去學習,是最好的方式。
在這個過程中,隨著你對數(shù)據(jù)的深入了解,掌握更多的數(shù)據(jù)分析語言和工具。從Excel到SQL,甚至到R和Python。你所能使用的數(shù)據(jù)量也會越來越大。但你大可不必一開始就扎入這些工具的學習中,那樣會收效甚微。
從人們會計數(shù)開始,數(shù)據(jù)就有了,數(shù)據(jù)分析也是。那么大數(shù)據(jù)呢?
說到大數(shù)據(jù),你就繞不開互聯(lián)網(wǎng)。在互聯(lián)網(wǎng)出現(xiàn)之前,雖然政府部門和一些公共事業(yè)單位通過日積月累獲得了較大量的數(shù)據(jù),但并沒有形成足夠的影響力。直到互聯(lián)網(wǎng)產(chǎn)品的出現(xiàn),由于它收集用戶數(shù)據(jù)的便利性,通常在一天之內(nèi)就能夠累計其他行業(yè)可能一年才能獲取的數(shù)據(jù)量。 數(shù)據(jù)量的升級造成算法和硬件都必須要升級,操作起來的技術(shù)難度也就會提高很多。這個時候,就需要專業(yè)的技術(shù)和平臺來完成存儲,處理和分析大數(shù)據(jù)的工作。比如說,大家都聽過的Hadoop平臺,MapReduce算法。都是大數(shù)據(jù)時代的產(chǎn)物。因此,
大數(shù)據(jù)的核心,就在于大。
有一定規(guī)模的互聯(lián)網(wǎng)公司都會成立專門的大數(shù)據(jù)部門來管理自己產(chǎn)品所收集到的大數(shù)據(jù)。數(shù)據(jù)量越大,處理難度就越高,相應(yīng)的,可能挖掘到的內(nèi)涵也會更多。于是,大數(shù)據(jù)就成了一個產(chǎn)業(yè),一個火熱的產(chǎn)業(yè)。
大數(shù)據(jù)入門的科普讀物,應(yīng)該看哪一本呢?很多人推薦了吳軍的《智能時代》。 大數(shù)據(jù)圈子里的人
在大數(shù)據(jù)行業(yè)這個圈子里,公司提供的職位大致分為三類:數(shù)據(jù)分析師,數(shù)據(jù)產(chǎn)品經(jīng)理,數(shù)據(jù)工程師。他們緊密合作,共同驅(qū)動公司的數(shù)據(jù)決策文化。
那么,這三種職位都是做什么的?又該怎么入行呢?
數(shù)據(jù)分析師
數(shù)據(jù)分析師,是使用大數(shù)據(jù)的人。核心是掌握各種數(shù)據(jù)分析工具和數(shù)據(jù)分析技能,目標是為公司管理層和產(chǎn)品團隊提供分析報告,幫助他們做決策。
實際工作中,數(shù)據(jù)會被處理成各種不同的類型提供給數(shù)據(jù)分析師使用,有比較原始的,有比較簡單好用的。因此,數(shù)據(jù)分析師需要掌握R, SQL,Excel, Python基礎(chǔ)編程等多種技能,以及熟練掌握常用的數(shù)據(jù)分析方法。
如果你立志于成為一個數(shù)據(jù)分析師甚至數(shù)據(jù)科學家,那么建議你進行系統(tǒng)的學習。
1. 英文好的可以去系統(tǒng)學習:Data Science - Johns Hopkins University | Coursera
2. 如果你有一定的經(jīng)驗和編程基礎(chǔ),也可以考慮秦路的自學指南:如何七周成為數(shù)據(jù)分析師
常見的推薦書籍有《R語言實戰(zhàn)》,《深入淺出統(tǒng)計學》,《Python for Data Analysis》等。
數(shù)據(jù)產(chǎn)品經(jīng)理
數(shù)據(jù)產(chǎn)品經(jīng)理是設(shè)計數(shù)據(jù)產(chǎn)品的人。核心技能是數(shù)據(jù)需求分析和數(shù)據(jù)產(chǎn)品的設(shè)計,和其他的互聯(lián)網(wǎng)產(chǎn)品經(jīng)理并沒有本質(zhì)的不同。實際工作中,數(shù)據(jù)產(chǎn)品經(jīng)理需要收集不同用戶的數(shù)據(jù)需求并且設(shè)計出好用的數(shù)據(jù)產(chǎn)品提供給大家,幫助他們“用數(shù)據(jù)做決定”。
常見的推薦入門書籍有《人人都是產(chǎn)品經(jīng)理》,《The DatawareHouse Toolkit》,《Lean Analytics》等等。
數(shù)據(jù)工程師
數(shù)據(jù)工程師,簡單分兩種,一類是數(shù)據(jù)挖掘工程師,另外一類是大數(shù)據(jù)平臺工程師。工程師的基本技能當然是寫代碼,寫高質(zhì)量的代碼。
數(shù)據(jù)挖掘工程師主要工作是開發(fā)大數(shù)據(jù)流水線以及和數(shù)據(jù)分析師一起完成數(shù)據(jù)挖掘項目,而數(shù)據(jù)平臺工程師主要工作是維護大數(shù)據(jù)平臺。
因此,理工科背景出身,掌握C, C#, Python等編程/腳本語言,熟悉各種基礎(chǔ)算法即可以勝任。
如何用數(shù)據(jù)做決策 對于那些并不想轉(zhuǎn)行進入大數(shù)據(jù)圈子的人,我們要學的究竟是什么?
在我們的日常工作中,特別是業(yè)績不佳,找不到突破口的時候,都曾想過能否用數(shù)據(jù)來幫助自己。因為我們都曾或多或少聽過一些牛逼的數(shù)據(jù)案例,比如紙尿布與啤酒之類。
舉一個簡單的例子,你經(jīng)營的餐館現(xiàn)在狀況不佳。你可以自己拍腦袋想一堆的新點子來嘗試改善現(xiàn)狀。你也可以,收集整理數(shù)據(jù),通過分析找出根本原因,并提出對應(yīng)解決方案,從而扭轉(zhuǎn)局面。后者聽起來似乎更加靠譜一些。
那么,你該收集什么數(shù)據(jù),做什么分析,這就是你需要學習的:“如何用數(shù)據(jù)做決策”。從這個角度講:人人都應(yīng)該是數(shù)據(jù)分析師
學習系統(tǒng)的數(shù)據(jù)決策和數(shù)據(jù)分析思維,我們可以從這篇文章開始:從0到1搭建數(shù)據(jù)分析知識體系。
關(guān)于數(shù)據(jù)分析的書籍太多了,眾口難調(diào),隨便一搜就有一大堆推薦。而其中所講的知識和理論其實都是類似的。最終要讓他們發(fā)揮作用,還是要和實踐結(jié)合起來。
因此,在自己的生意和工作中多實踐數(shù)據(jù)分析,多思考,遇到問題多在社群中提問和大家探討,是最好的學習辦法。
帶著問題去學習,是最好的方式。
在這個過程中,隨著你對數(shù)據(jù)的深入了解,掌握更多的數(shù)據(jù)分析語言和工具。從Excel到SQL,甚至到R和Python。你所能使用的數(shù)據(jù)量也會越來越大。但你大可不必一開始就扎入這些工具的學習中,那樣會收效甚微。