首頁>國企·民企>深·觀察深·觀察
數(shù)據(jù)挖掘如何就業(yè)?
5. hadoop,hive之類的需要學(xué)習(xí)嗎?
我覺得應(yīng)當(dāng)學(xué)習(xí),首先Hadoop和Hive很簡單(如果你用AWS的話你可以開一臺EMR,上面直接就有Hadoop和Hive,可以直接從使用學(xué)起)。
我覺得如果不折騰安裝和部署,還有Linux和MySQL的經(jīng)驗(yàn),只要半天到一天就能熟悉Hadoop和Hive的使用(當(dāng)然你得有Linux和MySQL的基礎(chǔ),如果沒有就先老老實(shí)實(shí)的學(xué)Linux和MySQL,這兩個都可以在自己的PC上安裝,自己折騰)。
Spark對很多人來說才是需要學(xué)習(xí)的,如果你有JAVA經(jīng)驗(yàn)大可以從JAVA入門。如果沒有那么還是建議從Scala入門,但是實(shí)際上如果沒有JAVA經(jīng)驗(yàn),Scala入門也會有一定難度,但是可以慢慢補(bǔ)。
所以總的來說Spark才足夠難,以至于需要學(xué)習(xí)。
最后的最后我有一些建議。第一要對自己有一個系統(tǒng)的認(rèn)知,自己的編程水平夠么,SQL會用么,Linux會用么,能流暢的看英文文檔么?
如果上面任何一個問題的答案是No,我都不建議直接轉(zhuǎn)行或者申請高級的數(shù)據(jù)挖掘職位(因?yàn)槟愫茈y找到一個正經(jīng)的數(shù)據(jù)挖掘崗位,頂多是一些打擦邊球的崗位,無論是實(shí)際干的工作還是未來的成長可能對你的幫助都不大)。
無論你現(xiàn)在是學(xué)生還是已經(jīng)再做一些前段后端、運(yùn)維之類的工作你都有足夠的時間補(bǔ)齊這些基礎(chǔ)知識。
補(bǔ)齊了這些知識之后,第一件事就是了解大數(shù)據(jù)生態(tài),Hadoop生態(tài)圈,Spark生態(tài)圈,機(jī)器學(xué)習(xí),深度學(xué)習(xí)(后兩者需要高等數(shù)學(xué)和線性代數(shù)基礎(chǔ),如果你的大學(xué)專業(yè)學(xué)這些不要混)。
選定其中一個方向做一些鉆研和學(xué)習(xí),網(wǎng)上有很多現(xiàn)成的資料(基本上是英文的,所以我說了,不能看英文的趕緊去背單詞),科學(xué)上網(wǎng)用谷歌這個大家都懂。希望我的建議能對你有一些幫助。
編輯:梁霄
關(guān)鍵詞:數(shù)據(jù) 挖掘 學(xué)習(xí) 公司 算法 機(jī)器 生態(tài)圈