現(xiàn)在位置:主頁 > 熱文 > 來自和鯨社區(qū)研究:頭部數(shù)據(jù)科學(xué)人才24小時(shí)圖鑒

來自和鯨社區(qū)研究:頭部數(shù)據(jù)科學(xué)人才24小時(shí)圖鑒

作者:編輯 ? 時(shí)間:2019-01-11 ? 瀏覽:人次

數(shù)據(jù)時(shí)代的到來,讓數(shù)據(jù)科學(xué)紅了一把。

雖然是近幾年才火起來的概念,但大家都擠破頭想進(jìn)入這個(gè)行業(yè)?!豆鹕虡I(yè)評(píng)論》更是宣稱“數(shù)據(jù)科學(xué)家”是二十一世紀(jì)最性感的職業(yè)。

數(shù)據(jù)科學(xué)這么紅不是沒有原因的,拿著令人艷羨的年薪,用手中的數(shù)據(jù)主導(dǎo)新產(chǎn)品甚至驅(qū)動(dòng)公司的決策,而這個(gè)行業(yè)其實(shí)也在不斷發(fā)展,相比幾年前,數(shù)據(jù)人的工作方式和生活方式都得到了巨大的變革。

那些頭部數(shù)據(jù)人才,他們典型的24小時(shí)是怎樣的?我們從剛剛升級(jí)的和鯨科技找到了答案。

和鯨科技,前身為數(shù)據(jù)科學(xué)平臺(tái)“科賽網(wǎng)(https://www.heywhale.com)”,于2019年元旦正式更名,旗下有聚集了超過50,000+數(shù)據(jù)智能人才的專業(yè)第三方數(shù)據(jù)科學(xué)社區(qū)kesci(科賽網(wǎng)),具備國際領(lǐng)先水平的數(shù)據(jù)分析及AI開發(fā)協(xié)作工具kescilab(簡(jiǎn)稱“K-Lab”)。

上班8小時(shí):效率升級(jí),“云端+協(xié)作”提升工作效果

數(shù)據(jù)科學(xué)家主要的工作內(nèi)容就是根據(jù)公司需求,從數(shù)據(jù)中攫取商業(yè)價(jià)值。而頭部數(shù)據(jù)人才和普通數(shù)據(jù)科學(xué)家最大的區(qū)別就是:效率。公司支付的高薪酬也是在購買他們的高效率。

云端工作

不同于“數(shù)據(jù)科學(xué)家”這個(gè)職業(yè)剛剛出現(xiàn)的時(shí)代,從業(yè)者需要不斷“遷就”手中的程序、甚至花很長(zhǎng)時(shí)間學(xué)習(xí)功能。在數(shù)據(jù)科學(xué)高速發(fā)展的2019,他們需要更高的效率,提高效率的工具應(yīng)運(yùn)而生,這些工具需要不斷預(yù)判和滿足他們的需求。在線編程就是一個(gè)很重要的痛點(diǎn),通過在線編程,不僅能免去繁瑣的環(huán)境配置,還為提升工作效率加了一條助跑道:不用考慮電腦在不在身邊、不用在乎文件有沒有拷貝,所有資料都在云端同步,只需專注于手中的代碼、數(shù)據(jù)、圖表。

但這并不好做,除了要直接在云端提供算力,在線編程工具還得保證環(huán)境統(tǒng)一,所以直到近幾年才有相關(guān)產(chǎn)品誕生。

K-Lab是一款在線協(xié)作工具,引入Jupyter Notebook范式——這是專門為數(shù)據(jù)分析設(shè)計(jì)的工作環(huán)境,能夠隨時(shí)隨地在云端開展數(shù)據(jù)處理、模型搭建、代碼調(diào)試、撰寫報(bào)告、團(tuán)隊(duì)協(xié)作等系列數(shù)據(jù)分析工作,數(shù)據(jù)科學(xué)家的工作將不再局限于本地環(huán)境,周末登山也能掏出手機(jī)訓(xùn)練模型、調(diào)整參數(shù)。

團(tuán)隊(duì)協(xié)作

與純粹的程序員不同,數(shù)據(jù)科學(xué)家作為一個(gè)更偏商業(yè)應(yīng)用的崗位,它需要和數(shù)據(jù)分析師團(tuán)隊(duì),甚至是其他部門共同協(xié)作、指導(dǎo)公司的發(fā)展,也就更需要數(shù)據(jù)可視化和講故事的能力。原因很簡(jiǎn)單,如果團(tuán)隊(duì)、客戶甚至都聽不懂你想做什么,即使你的代碼、分析過程再優(yōu)雅再準(zhǔn)確,都只是白費(fèi)力氣。

試想,當(dāng)你向團(tuán)隊(duì)解釋你的分析成果,他們更愿意看這一大段“不知所云”的代碼,還是右邊這張圖呢?

圖源自和鯨科技 - K-Lab

K-Lab的協(xié)作功能同時(shí)考慮了兩種場(chǎng)景

數(shù)據(jù)分析師團(tuán)隊(duì)交流時(shí),常常需要互相修改源碼,如果大家使用的計(jì)算環(huán)境、甚至編程語言都不同,效率未免也太低了??紤]到這種情況,K-Lab統(tǒng)一了計(jì)算環(huán)境,增加Fork、版本管理等功能,打開網(wǎng)頁就能完成整個(gè)數(shù)據(jù)分析工作;

如果你需要與非技術(shù)人員溝通,他們可不想看到密密麻麻的代碼。在K-Lab中,不需要你重做一份PPT,只要一鍵隱藏代碼,負(fù)責(zé)人便只看得到最后的圖表、在線評(píng)論,同時(shí)“點(diǎn)贊+1”。這樣,所有人能快速理解你的分析結(jié)果并且參與協(xié)作、提高生產(chǎn)效率。而且,界面清爽易讀,把實(shí)時(shí)運(yùn)行的代碼、文本和可視化的圖整合在一起,提升數(shù)據(jù)科學(xué)家講故事、做決策的能力。

目前清華大學(xué)、北京大學(xué)、中國人民大學(xué)、上海交通大學(xué)、浙江大學(xué)等知名院校已采用K-Lab進(jìn)行數(shù)據(jù)科學(xué)與人工智能的教學(xué)與實(shí)訓(xùn)平臺(tái),也幫助了中國聯(lián)通、中國平安、招商銀行、騰訊、百度、攜程、IBM、華為、南京市政府在內(nèi)的一批頂尖客戶解決行業(yè)問題。

下班4小時(shí):社交升級(jí),社區(qū)生態(tài)加速學(xué)習(xí)

據(jù)《2018數(shù)據(jù)人才白皮書》調(diào)查,數(shù)據(jù)科學(xué)人才平均每天學(xué)習(xí)時(shí)間大于4小時(shí),而頭部數(shù)據(jù)人才學(xué)習(xí)的時(shí)間則普遍更長(zhǎng),也許這是他們優(yōu)秀的原因之一。

但僅僅保證學(xué)習(xí)時(shí)間就夠嗎?技術(shù)飛速發(fā)展, 人的升級(jí)跟得上摩爾定律嗎?顯然,學(xué)習(xí)方法和學(xué)習(xí)效率缺一不可。

和鯨科技承辦了多場(chǎng)數(shù)據(jù)競(jìng)賽,大賽結(jié)束后,都會(huì)對(duì)獲獎(jiǎng)?wù)哌M(jìn)行采訪。從這些采訪中,我們了解到,他們?cè)谡n余時(shí)間/工作之余提升自己的辦法十分類似——“在實(shí)踐中學(xué)習(xí)”,幾乎都是混論壇、看論文、打比賽。競(jìng)賽就是一種重要的實(shí)踐方式,在競(jìng)賽中,他們能夠直接接觸到一線企業(yè)的場(chǎng)景和真實(shí)的行業(yè)數(shù)據(jù)。悶頭做技術(shù)已經(jīng)很難適應(yīng)新時(shí)代,我們更需要通過與人交流共同升級(jí)。

一般來說,初學(xué)者可以通過書本或課程學(xué)習(xí)新技術(shù),三五年后就主要從做項(xiàng)目、看論文來提升自己了。而實(shí)踐能夠貫穿學(xué)習(xí)的全過程,數(shù)據(jù)競(jìng)賽平臺(tái)就是源源不斷的實(shí)踐機(jī)會(huì),從初學(xué)者到大神都能找到機(jī)會(huì)。數(shù)據(jù)科學(xué)家可以從中尋找合適的項(xiàng)目,如果獲獎(jiǎng)了一般還有幾萬元獎(jiǎng)金。

內(nèi)容源自和鯨科技 - 科賽網(wǎng)(Kesci) - 比賽

要是心血來潮想研究某個(gè)問題呢?找到感興趣的數(shù)據(jù)集,再開始自己的分析就好。

內(nèi)容源自和鯨科技 - 科賽(Kesci) - 社區(qū)

和鯨科技的社區(qū)就是一個(gè)給數(shù)據(jù)人成長(zhǎng)、交流的生態(tài)系統(tǒng),能夠貫穿數(shù)據(jù)科學(xué)家成長(zhǎng)的全過程:

通過科小神訓(xùn)練營入門后,科賽社區(qū)的“項(xiàng)目”欄中提供了由淺到深的學(xué)習(xí)資料,用戶可以直接下載數(shù)據(jù)集或者fork項(xiàng)目,等學(xué)到一定程度后,就可以在“比賽”中開始數(shù)據(jù)競(jìng)賽之路。每個(gè)環(huán)節(jié)都配備了相應(yīng)社群,把與你等級(jí)類似的人鏈接在一起,你可以在社區(qū)、社群和大家一起打怪升級(jí)。

從2015年搭建時(shí),和鯨科技就開始聚集各大高校的數(shù)據(jù)科學(xué)人才,隨后,從高校不斷輻射到各大互聯(lián)網(wǎng)企業(yè)、500強(qiáng)技術(shù)人才,現(xiàn)在已經(jīng)有超過50,000+的數(shù)據(jù)智能人才在其中分享技術(shù),沉淀了100+行業(yè)頂尖企業(yè)數(shù)據(jù)實(shí)操案例、6000+數(shù)據(jù)算法應(yīng)用案例和5000G+優(yōu)質(zhì)數(shù)據(jù)集資源,數(shù)據(jù)集能夠直接在K-Lab工作專區(qū)掛載,節(jié)省不必要的實(shí)踐,專注于探索性數(shù)據(jù)分析,與社區(qū)的伙伴共同進(jìn)步。

數(shù)據(jù)人未來的工作方式

上班8小時(shí)和下班4小時(shí),工具和社區(qū)的升級(jí),最終帶來的是生活方式的變革。數(shù)據(jù)科學(xué)家并不是代碼機(jī)器,他們不像人們的刻板印象那樣:格子襯衫、黑框眼鏡反著光,對(duì)著電腦敲代碼。

在數(shù)據(jù)人典型的一天中,提升工作效率、保證學(xué)習(xí)時(shí)間是很重要的一個(gè)因素,保持自我升級(jí),是立于市場(chǎng)的不變法則。

在和鯨科技的工具+社區(qū)+眾包的生態(tài)中,數(shù)據(jù)科學(xué)家也得以擯除落后的工作方式,能夠在社區(qū)內(nèi)用在線編程、協(xié)同的方式,提升工作效率;能夠面對(duì)市場(chǎng)團(tuán)隊(duì)、甚至甲方講述自己的技術(shù)思考,甚至在閑暇時(shí)間內(nèi),在社區(qū)尋找項(xiàng)目給自己升升級(jí);在線編程也讓平板、手機(jī)編程成為可能,不用再為了一個(gè)Bug在周末跑回公司。

你如何過一天,就如何過一生。和鯨生態(tài)帶給數(shù)據(jù)科學(xué)家的,不僅是工作效率,更是數(shù)據(jù)人未來的工作方式。

剩下的十二個(gè)小時(shí)你們會(huì)如何安排呢?快來和鯨社區(qū)跟我們分享吧。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://www.parkingblocks4less.com/a/rewen/20190111/25226.html上一篇:上一篇:[圖]新研究發(fā)現(xiàn)65歲以上美國老人分享的假新聞數(shù)量最多
下一篇:下一篇:沒有了