盤點(diǎn)2017年有價值的機(jī)器學(xué)習(xí)知識或技能
在2017年人工智能的爆發(fā)年,對于機(jī)器學(xué)習(xí)領(lǐng)域的有價值,含金量搞得知識和技能有哪些呢?一起來看看吧!
一、來自Vladimir Novakovski的回答:對機(jī)器學(xué)習(xí)做出最大貢獻(xiàn)的通常都是通才。特別是在2017年,有很多關(guān)于機(jī)器學(xué)習(xí)的大肆炒作。很多求職者在網(wǎng)上學(xué)習(xí)一些深度學(xué)習(xí)的課程,這讓我想起20世紀(jì)90年代時,有很多人不去讀計(jì)算機(jī)科學(xué)教材,而是去讀一些號稱“20天學(xué)會VBScript”的速成書籍。(其實(shí)今天依然有這樣的人)
依舊重要的技能包括:(a)了解統(tǒng)計(jì)學(xué)、優(yōu)化、建立量化模型的基本原理;(b)了解模型和數(shù)據(jù)分析是如何實(shí)際應(yīng)用到產(chǎn)品和業(yè)務(wù)中的。
除了上述兩點(diǎn)以外,以下幾點(diǎn)技能在2017年也至關(guān)重要:
知道如何編寫高質(zhì)量的軟件。 一個團(tuán)隊(duì)編寫質(zhì)量垃圾的軟件,另一個團(tuán)隊(duì)負(fù)責(zé)完善的時代已經(jīng)過去了。使用Python和R這樣的編程語言和它們的軟件包,可以輕松處理數(shù)據(jù)和模型,因此數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師應(yīng)該能夠具備較高水平的編程能力,并了解系統(tǒng)設(shè)計(jì)的基礎(chǔ)知識。
使用大型數(shù)據(jù)集。雖然“大數(shù)據(jù)”這個術(shù)語使用的太過頻繁,但數(shù)據(jù)存儲的成本確實(shí)呈現(xiàn)急劇下降趨勢。這意味著愈來愈多的來自不同領(lǐng)域的數(shù)據(jù)集在處理和應(yīng)用模型。
是的,一旦你對一些知識有基本的理解和相應(yīng)的技術(shù)水平后,了解至少一個熱門領(lǐng)域,例如計(jì)算機(jī)視覺和感知的深度學(xué)習(xí)、推薦引擎、NLP(自然語言處理)等,都會對你大有裨益。
二、來自Shivam Kohli 的回答: 技能#1:編程
這也許是數(shù)據(jù)科學(xué)家必備的最基本的技能——數(shù)據(jù)科學(xué)家的工作要比傳統(tǒng)統(tǒng)計(jì)學(xué)家的工作實(shí)際的多。編程在許多方面都很重要,包括以下三點(diǎn):
編程能增強(qiáng)你做數(shù)據(jù)統(tǒng)計(jì)的能力。如果你有一大堆統(tǒng)計(jì)數(shù)據(jù),但卻沒有辦法去處理,那么你的統(tǒng)計(jì)知識將無用武之地。
編程能使你有分析大型數(shù)據(jù)集的能力。你在業(yè)界工作的數(shù)據(jù)集并不像樣本iris數(shù)據(jù)集(Iris數(shù)據(jù)集是常用的分類實(shí)驗(yàn)數(shù)據(jù)集,由Fisher, 1936收集整理。)那么小可愛,你能輕松獲得數(shù)以百萬計(jì)甚至更多的數(shù)據(jù)。
通過編程,你可以創(chuàng)建更好的數(shù)據(jù)處理工具。這包括建立數(shù)據(jù)的可視化系統(tǒng),創(chuàng)建自動分析實(shí)驗(yàn)的框架,以及管理公司的數(shù)據(jù)流,以便所需的數(shù)據(jù)可以手到擒來。
技能#2:定量分析定量分析是數(shù)據(jù)科學(xué)家必備的核心技能。數(shù)據(jù)科學(xué)的大部分內(nèi)容是通過分析自然科學(xué)和實(shí)驗(yàn)所產(chǎn)生的數(shù)據(jù)來理解一個特別復(fù)雜的科學(xué)系統(tǒng)的行為。定量分析技能在許多方面都很重要,包括以下三點(diǎn):
試驗(yàn)設(shè)計(jì)和分析:特別是對從事消費(fèi)互聯(lián)網(wǎng)應(yīng)用的數(shù)據(jù)科學(xué)家—數(shù)據(jù)記錄的方式和實(shí)驗(yàn)的運(yùn)行方式,為大量的實(shí)驗(yàn)測試各種假設(shè)提供了途徑。實(shí)驗(yàn)分析是很可能出錯的(這一點(diǎn)可以詢問任何統(tǒng)計(jì)學(xué)家),因此,在這方面,數(shù)據(jù)科學(xué)家可以提供很多幫助。
復(fù)雜型經(jīng)濟(jì)/增長系統(tǒng)建模:一些經(jīng)典建模是較為常見的,如客戶流失模型或客戶終身價值模型。更復(fù)雜的建模,如供應(yīng)和需求建模,匹配供應(yīng)商和供應(yīng)商之間經(jīng)濟(jì)最優(yōu)方法,以及建模公司的增長渠道,來更好的量化分析哪些增長途徑最有價值。最著名的例子是Uber的價格飆升建模。
機(jī)器學(xué)習(xí):即使沒有實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型,對于數(shù)據(jù)科學(xué)家來說,他們也可以提供幫助創(chuàng)建原型來測試假設(shè),選擇和創(chuàng)造的功能,以及判定現(xiàn)有機(jī)器學(xué)習(xí)系統(tǒng)中的優(yōu)勢和在該領(lǐng)域的機(jī)會。
哪些數(shù)據(jù)科學(xué)領(lǐng)域的人員對這項(xiàng)技能最有需求呢?1。物理學(xué)家2。統(tǒng)計(jì)學(xué)家3。經(jīng)濟(jì)學(xué)家4。運(yùn)籌學(xué)家5。更多,他們非常習(xí)慣通過自上而下的方法(模型)或自下而上的方法來理解復(fù)雜的系統(tǒng)(數(shù)據(jù)推斷)。
技能#3:產(chǎn)品直覺產(chǎn)品直覺是一種技能,它與數(shù)據(jù)科學(xué)家對系統(tǒng)進(jìn)行定量分析的能力有關(guān)。產(chǎn)品知識意味著要理解生成數(shù)據(jù)科學(xué)家分析的所有數(shù)據(jù)的復(fù)雜系統(tǒng)。這個技能的重要性體現(xiàn)在:
產(chǎn)生假設(shè):一個非常了解產(chǎn)品的數(shù)據(jù)科學(xué)家可以用一種特定的方式改變系統(tǒng)的行為方式。假設(shè)是基于“預(yù)感”關(guān)于系統(tǒng)的某些方面如何表現(xiàn),你需要知道系統(tǒng)對它是如何工作的有預(yù)感。
定義度量標(biāo)準(zhǔn):傳統(tǒng)的分析技能集包括確定公司可以用來跟蹤特定目標(biāo)成功的主要和次要指標(biāo)。數(shù)據(jù)科學(xué)家需要了解產(chǎn)品,以便創(chuàng)建兩個產(chǎn)品指標(biāo):1。衡量意圖2。衡量具有推動價值的東西。
調(diào)試分析:“難以置信”的結(jié)果常常是由于系統(tǒng)的“令人難以置信”的特性而引起的。良好的產(chǎn)品知識有助于提升產(chǎn)品檢查速度,幫助更快地識別出可能出錯的東西。
產(chǎn)品知識通常包括使用公司創(chuàng)造的產(chǎn)品。如果那是不可能的,那么至少試著去了解那些實(shí)際使用產(chǎn)品的人。
技能#4:溝通能力這項(xiàng)技能很重要,有助于顯著提高上述所有技能的影響力。這一點(diǎn)特別重要,是區(qū)別好的數(shù)據(jù)科學(xué)家和偉大的數(shù)據(jù)科學(xué)家的重要標(biāo)準(zhǔn)。良好的溝通可以以多種方式體現(xiàn),包括:
溝通見解:一些數(shù)據(jù)科學(xué)家將其稱之為“講故事”。這里最重要的是以清晰、簡明和有效的方式交流見解,以便公司中的其他人能夠有效地理解這些見解。
數(shù)據(jù)可視化呈現(xiàn):一幅清楚明晰的圖表勝過千言萬語。
總體溝通:作為一名數(shù)據(jù)科學(xué)家,幾乎總是意味著作為一個團(tuán)隊(duì)在工作,包括與工程師、設(shè)計(jì)師、產(chǎn)品經(jīng)理、運(yùn)營人員以及更多的角色合作。良好的總體溝通有助于促進(jìn)信任和理解,對于被委托管理數(shù)據(jù)的人來說,這是極其重要的。
技能#5:團(tuán)隊(duì)合作最后這項(xiàng)技能將以上4個技能連接起來。特別是數(shù)據(jù)科學(xué)家不能孤立地存在,要依靠團(tuán)隊(duì)工作。從我所看到的,數(shù)據(jù)科學(xué)家深入到公司的方方面面(或者至少存在于產(chǎn)品開發(fā)組織中)時,結(jié)果做得最好。
團(tuán)隊(duì)合作之所以重要,有很多原因,包括:
無私:這包括為他人提供幫助和指導(dǎo),并將公司的使命放在自己的個人職業(yè)生涯野心之上。
不斷迭代:數(shù)據(jù)科學(xué)家重視反饋,他們的大部分工作都需要與其他人進(jìn)行反復(fù)迭代和反饋,以達(dá)成有影響力的解決方案。
與他人分享知識:由于數(shù)據(jù)科學(xué)職業(yè)是一個新近出現(xiàn)的工作,基本上沒有人具備完整的技能,尤其是當(dāng)你需要收集所有可能有用的統(tǒng)計(jì)技術(shù)、框架、庫、語言和工具時。由于知識可能分散在不同數(shù)據(jù)科學(xué)家及其組織中,因此對于數(shù)據(jù)科學(xué)家來說,不斷地分享他們的知識、方法和成果尤其有用。