應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個人注冊登錄

許多大數(shù)據(jù)科學(xué)家都已經(jīng)離職?原因我來告訴你

2020-01-02 09:39 AI中國

導(dǎo)讀:是的,我是一名數(shù)據(jù)科學(xué)家,是的,你沒有看錯,但有人必須說出來。我們讀了許多關(guān)于數(shù)據(jù)科學(xué)是21世紀(jì)最性感的工作,以及作為數(shù)據(jù)科學(xué)家可以賺到的誘人的金錢之類的故事,這看起來像是絕對的夢想工作。

是的,我是一名數(shù)據(jù)科學(xué)家,是的,你沒有看錯,但有人必須說出來。我們讀了許多關(guān)于數(shù)據(jù)科學(xué)是21世紀(jì)最性感的工作,以及作為數(shù)據(jù)科學(xué)家可以賺到的誘人的金錢之類的故事,這看起來像是絕對的夢想工作。原因在于該領(lǐng)域中有大量的高技能人才,他們渴望解決復(fù)雜的問題(是的,“追求”是一件很積極的事情),對此工作無所不包。

但事實(shí)是,正如《金融時報》在這篇文章中所說,數(shù)據(jù)科學(xué)家通?!懊恐芑ㄙM(fèi)1-2小時尋找新工作”。此外,文章還指出:“機(jī)器學(xué)習(xí)專家在他們表示正在尋找新工作的開發(fā)人員中名列第一,占14.3%。數(shù)據(jù)科學(xué)家緊隨其后,為13.2%?!边@些數(shù)據(jù)是由Stack Overflow在其針對64,000名開發(fā)人員的調(diào)查中收集的。

我也曾擔(dān)任過該職位,最近我自己也換了數(shù)據(jù)科學(xué)工作。

那么,為什么有那么多數(shù)據(jù)科學(xué)家在尋找新工作呢?

在回答這個問題之前,我需要澄清一下我仍然是一名數(shù)據(jù)科學(xué)家??偟膩碚f,我喜歡這份工作,并且我不想阻止其他有志于成為數(shù)據(jù)科學(xué)家的人,因?yàn)樗梢詭順啡?,激勵和獎勵。本文的目的是扮演魔鬼的擁護(hù)者,并揭露這項(xiàng)工作的某些負(fù)面影響。

從我的角度來看,我認(rèn)為許多數(shù)據(jù)科學(xué)家對其工作不滿意的原因有四個。

期望與現(xiàn)實(shí)不符

許多大數(shù)據(jù)科學(xué)家都已經(jīng)離職?原因我來告訴你

理想與現(xiàn)實(shí)

大數(shù)據(jù)就像十幾歲的性行為:每個人都在談?wù)撍瑳]有人真正知道如何做,每個人都認(rèn)為其他人正在做,所以每個人都聲稱自己正在做……– Dan Ariely

這句話很貼切。我認(rèn)識的許多初級數(shù)據(jù)科學(xué)家(包括我自己)都想進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,因?yàn)檫@全都在于使用很酷的新型機(jī)器學(xué)習(xí)算法解決復(fù)雜的問題,這些算法會對企業(yè)產(chǎn)生巨大影響。這是一個讓我們感到自己所做的工作比以往任何時候都重要的機(jī)會。但是,通常并非如此。

在我看來,期望與現(xiàn)實(shí)不符的事實(shí)是許多數(shù)據(jù)科學(xué)家離開的最終原因。造成這種情況的原因很多,我可能無法提供詳盡的清單,但是這篇文章實(shí)質(zhì)上是我遇到的一些原因的清單。

每個公司都不盡相同,所以我不能一一列舉,但許多公司雇用的數(shù)據(jù)科學(xué)家都沒有合適的基礎(chǔ)架構(gòu)來開始從AI中獲得價值。這導(dǎo)致了AI中的冷啟動問題。再加上這些公司在雇用初級人員之前未能雇用資深/有經(jīng)驗(yàn)的數(shù)據(jù)從業(yè)人員,您現(xiàn)在已經(jīng)為雙方的幻滅和不愉快的關(guān)系做好了準(zhǔn)備。數(shù)據(jù)科學(xué)家可能會寫出智能機(jī)器學(xué)習(xí)算法來驅(qū)動洞察力,但由于他們的第一項(xiàng)工作是整理數(shù)據(jù)基礎(chǔ)結(jié)構(gòu)和/或創(chuàng)建分析報告,因此無法做到這一點(diǎn)。相比之下,該公司只想要一張他們每天可以在董事會會議上展示的圖表。然后,該公司感到沮喪,因?yàn)樗麄儧]有看到價值沒有足夠快地推動價值增長,而這一切都導(dǎo)致數(shù)據(jù)科學(xué)家對其角色感到不滿意。

羅伯特·張(Robert Chang)在他的博客文章中提供了非常有見地的報價,為初級數(shù)據(jù)科學(xué)家提供了建議:

重要的是要評估我們的理想與我們所處環(huán)境的關(guān)鍵路徑相符的程度。找到關(guān)鍵路徑與您的關(guān)鍵路徑最相符的項(xiàng)目,團(tuán)隊(duì)和公司。

這凸顯了雇主與數(shù)據(jù)科學(xué)家之間的雙向關(guān)系。如果公司不在正確的位置或目標(biāo)與數(shù)據(jù)科學(xué)家的目標(biāo)保持一致,那么數(shù)據(jù)科學(xué)家找到其他東西只是時間問題。

對于那些感興趣的人,Samson Hu撰寫了一個精彩的系列文章,介紹了Wish的分析團(tuán)隊(duì)的建立方式,我也發(fā)現(xiàn)他很有見地。

數(shù)據(jù)科學(xué)家被幻滅的另一個原因與我對學(xué)術(shù)界被幻滅的原因相似:我相信我將能夠?qū)κ澜绺鞯氐娜藗儺a(chǎn)生巨大的影響,而不僅僅是在公司內(nèi)部。實(shí)際上,如果公司的核心業(yè)務(wù)不是機(jī)器學(xué)習(xí)(我的前任雇主是一家媒體出版公司),那么您從事的數(shù)據(jù)科學(xué)可能只會帶來很小的增量收益。這些可能加起來非常重要,或者您可能很幸運(yùn)偶然發(fā)現(xiàn)了一個金礦項(xiàng)目,但這并不常見。

追求政治正確

許多大數(shù)據(jù)科學(xué)家都已經(jīng)離職?原因我來告訴你

政治問題已經(jīng)有一篇精彩的文章專門介紹它:數(shù)據(jù)科學(xué)中最困難的事情:政治,我敦促您閱讀它。該文章的前幾句話幾乎總結(jié)了我想說的話:

當(dāng)我早上6點(diǎn)起床學(xué)習(xí)支持向量機(jī)時,我想到:“這真的很難!但是,嘿,至少我將對我未來的雇主變得非常有價值!”。如果我能得到DeLorean,我會回到過去,自稱“ Bulls ** t!”。

如果您認(rèn)真地認(rèn)為了解很多機(jī)器學(xué)習(xí)算法將使您成為最有價值的數(shù)據(jù)科學(xué)家,那么請回到上面我的第一點(diǎn):期望與現(xiàn)實(shí)不符。

事實(shí)是,業(yè)務(wù)最有影響力的人需要對您有很好的了解。這可能意味著您必須不斷進(jìn)行特別工作,例如從數(shù)據(jù)庫中獲取數(shù)字以在合適的時間提供給合適的人,進(jìn)行簡單的項(xiàng)目,以便合適的人對您有正確的認(rèn)識。我不得不在以前的位置上做很多事情。令人感到沮喪的是,這是工作的必要部分。

您可以親自處理任何數(shù)據(jù)

許多大數(shù)據(jù)科學(xué)家都已經(jīng)離職?原因我來告訴你

從盡一切努力取悅合適的人之后,那些擁有全部影響力的人卻常常不理解“數(shù)據(jù)科學(xué)家”的含義。這意味著您將既是分析專家又是報告專家,并且不要忘記您也將成為數(shù)據(jù)庫專家。

不僅僅是非技術(shù)主管會對您的技能做出太多假設(shè)。其他技術(shù)同事假設(shè)您知道所有與數(shù)據(jù)相關(guān)的信息。您知道如何繞過Spark,Hadoop,Hive,Pig,SQL,Neo4J,MySQL,Python,R,Scala,Tensorflow,A / B測試,NLP,任何機(jī)器學(xué)習(xí)(以及您能想到的任何其他相關(guān)數(shù)據(jù))— BTW如果您看到上面寫有所有這些的工作說明,請保持清楚。這是一家不知道其數(shù)據(jù)策略是什么的公司的工作說明,他們會雇用任何人,因?yàn)樗麄冋J(rèn)為雇用任何數(shù)據(jù)人將解決他們所有的數(shù)據(jù)問題)。

但這并不止于此。因?yàn)槟私馑羞@些信息,并且顯然可以訪問所有數(shù)據(jù),所以您有望在……之前得到所有問題的答案。好吧,它應(yīng)該在5分鐘前落入相關(guān)人員的收件箱中。

試圖告訴所有人您真正了解并控制的內(nèi)容可能很困難。并不是因?yàn)槿魏稳藢?shí)際上對您的想法都不多,而是因?yàn)樽鳛橐粋€缺乏行業(yè)經(jīng)驗(yàn)的初級數(shù)據(jù)科學(xué)家,您會擔(dān)心人們對您的想法會更少。這可能是非常困難的情況。

在孤立的團(tuán)隊(duì)中工作

許多大數(shù)據(jù)科學(xué)家都已經(jīng)離職?原因我來告訴你

當(dāng)我們看到成功的數(shù)據(jù)產(chǎn)品時,我們經(jīng)常會看到經(jīng)過專業(yè)設(shè)計的具有智能功能的用戶界面,最重要的是,有用的輸出至少可以被用戶感知以解決相關(guān)問題?,F(xiàn)在,如果數(shù)據(jù)科學(xué)家僅將時間花在學(xué)習(xí)如何編寫和執(zhí)行機(jī)器學(xué)習(xí)算法上,那么他們只能是團(tuán)隊(duì)的一小部分(盡管有必要),從而導(dǎo)致產(chǎn)生有價值產(chǎn)品的項(xiàng)目取得成功。這意味著孤立工作的數(shù)據(jù)科學(xué)團(tuán)隊(duì)將難以提供價值!

盡管如此,許多公司仍然擁有數(shù)據(jù)科學(xué)團(tuán)隊(duì),他們會提出自己的項(xiàng)目并編寫代碼來嘗試解決問題。在某些情況下,這足夠了。例如,如果僅需要一個季度生成一次的靜態(tài)電子表格,那么它可以提供一定的價值。另一方面,如果目標(biāo)是在定制的網(wǎng)站構(gòu)建產(chǎn)品中優(yōu)化提供智能建議,那么這將涉及許多不同的技能,這對絕大多數(shù)數(shù)據(jù)科學(xué)家來說都是不應(yīng)該的(只有真正的數(shù)據(jù)科學(xué)獨(dú)角獸才能解決此問題)一)。因此,如果該項(xiàng)目由孤立的數(shù)據(jù)科學(xué)團(tuán)隊(duì)執(zhí)行,則很可能失敗(或花費(fèi)很長時間,因?yàn)榻M織孤立的團(tuán)隊(duì)在大型企業(yè)中從事協(xié)作項(xiàng)目并不容易)。

因此,要想成為一名有效的行業(yè)數(shù)據(jù)科學(xué)家,僅在Kaggle競賽中取得出色成績并完成一些在線課程是不夠的。不幸的是(取決于您對它的看法)取決于了解層次結(jié)構(gòu)和政治如何在企業(yè)中發(fā)揮作用。尋找可滿足您需求的數(shù)據(jù)科學(xué)工作時,尋找與您的關(guān)鍵路徑保持一致的公司應(yīng)該是一個主要目標(biāo)。但是,您可能仍需要重新調(diào)整對數(shù)據(jù)科學(xué)角色的期望。

如果有人有任何其他意見,問題或反對意見,請隨時發(fā)表評論,因?yàn)橛薪ㄔO(shè)性的討論對于幫助有抱負(fù)的數(shù)據(jù)科學(xué)家做出有關(guān)其職業(yè)道路的明智決定是必要的。

希望我沒有讓你失業(yè)。