首頁>國企·民企>深·觀察深·觀察
數據挖掘如何就業(yè)?
1. 數據挖掘主要是做算法還是做應用?分別都要求什么?
這個問題太籠統(tǒng),基本上算法和應用是兩個人來做的,可能是數據挖掘職位。做算法的比較少,也比較高級。
其實所謂做算法大多數時候都不是設計新的算法(這個可以寫論文了),更多的是技術選型,特征工程抽取,最多是實現一些已經有論文但是還沒有開源模塊的算法等,還是要求扎實的算法和數據結構功底,以及豐富的分布式計算的知識的,以及不錯的英文閱讀和寫作能力。但即使是這樣也是百里挑一的,很難找到。
絕大讀書數據挖掘崗位都是做應用,數據清洗,用現成的庫建模,如果你自己不往算法或者架構方面繼續(xù)提升,和其他的開發(fā)崗位的性質基本沒什么不同,只要會編程都是很容易入門的。
2. 北上廣以外的普通公司用的多嗎?待遇如何?
實際情況不太清楚,由于數據挖掘和大數據這個概念太火了,肯定到處都有人招聘響應的崗位,但是二線城市可能僅僅是停留在概念上,很多實際的工作并沒有接觸到足夠大的數據,都是生搬硬套框架(從我面試的人的工作經驗上看即使是在北上廣深這種情況也比較多見)。
只是在北上廣深,可能接觸到大數據的機會多一些。而且做數據挖掘現在熱點的技術比如Python,Spark,Scala,R這些技術除了在一線城市之外基本上沒有足夠的市場(因為會的人太少了,二線城市的公司找不到掌握這些技術的人,不招也沒人學)。
所以我推測二線城市最多的還是用JAVA+Hadoop,或者用JAVA寫一些Spark程序。北上廣深和二線城市程序員比待遇是欺負人,就不討論了。
編輯:梁霄
關鍵詞:數據 挖掘 學習 公司 算法 機器 生態(tài)圈