Kuidas saada oma esimene töö andmeteaduses?

Kuidas saab oma esimese algtaseme töökoha andmeteadlase või andmeanalüütiku ametikohal? Kui sirvite andmeteaduste foorumeid, leiate selle teema ümber palju küsimusi. Minu andmeteaduste ajaveebi (data36.com) lugejad küsivad minult aeg-ajalt sama. Ja ma võin teile öelda, et see on täiesti kehtiv probleem!

Olen otsustanud kõigi peamiste küsimuste vastused kokku võtta!

UUS! Olen loonud ulatusliku (tasuta) veebivideokursuse, mis aitab teil Data Science'iga alustada. Lisateabe saamiseks klõpsake siin: Kuidas saada andmeteadlaseks?

REGISTREERU SIIN (TASUTA): https://data36.com/how-to-become-a-data-scientist/

# 1: Millised on kõige olulisemad andmeteadlaste oskused ja tööriistad? Ja kuidas neid saada?

Hea uudis - halb uudis.

Alustan halvast. 90% juhtudest pole nende oskused, mida nad teile ülikoolides õpetavad, reaalainete andmeõppe projektides eriti kasulikud. Nagu ma olen juba mitu korda kirjutanud, on reaalsetes projektides vaja neid 4 andmete kodeerimise oskust:

  • bash / käsurida
  • Python
  • SQL
  • R
  • (ja mõnikord Java)
allikas: KDnuggets

Millised 2 või 3 on teile kõige kasulikumad, sõltub tõesti ettevõttest ... Aga kui olete ühe juba õppinud, on teise õppimine palju lihtsam.

Esimene suur küsimus on: kuidas neid tööriistu saada? Siit tulevad head uudised! Kõik need tööriistad on tasuta! See tähendab, et saate need alla laadida, installida ja kasutada ilma nende eest sentigi maksmata. Saate harjutada, ehitada andmeharrastuse projekti või midagi muud!

Kirjutasin hiljuti samm-sammult artikli selle kohta, kuidas neid tööriistu arvutisse installida. Vaata siit.

# 2: kuidas õppida?

Andmeteaduse hõlpsaks ja kuluefektiivseks õppimiseks on kaks peamist viisi.

1.: Raamatud.

Kinda vana kooli, kuid siiski hea õppimisviis. Raamatutest saate väga keskendunud, väga üksikasjalikke teadmisi veebiandmete analüüsi, statistika, andmete kodeerimise jms kohta. Ma tõin esile 7 raamatut, mida soovitan oma eelmises artiklis, siin.

7 parimat andmeraamatut, mida soovitan

2. osa: Veebiseminarid ja videokursused.

Andmeteaduse veebikursused tulevad õiglase hinnaga (10–500 dollarit) ja need hõlmavad mitmesuguseid teemasid, alates andmete kodeerimisest ja lõpetades äriandmetega. Kui te ei soovi alguses selle jaoks raha kulutada, olen selles postituses loetlenud tasuta kursused ja õppematerjalid.

(3. osa: nooremandmeteadlase esimese kuu kursus. Olen loonud 6-nädalase veebiteabeteaduse kursuse, mille eesmärk on andmeteadlaste jaoks tegelikkusele vastavate andmete praktikas praktiseerimine ja lahendamine: reaalainete andmebaasis: nooremandmeteadlase esimene kuu .)

# 3: kuidas harjutada ja kuidas saada reaalset elukogemust

See on keeruline, eks? Iga ettevõte soovib, et inimestel oleks vähemalt natuke reaalset elukogemust ... Aga kuidas saada reaalset elukogemust, kui oma esimese töökoha saamiseks on vaja reaalset elukogemust? Klassikaline saak-22. Ja vastus on: lemmikloomaprojektid.

„Lemmikloomaprojekt” tähendab, et saate välja andmeprojekti idee, mis teid erutab. Siis hakkate seda lihtsalt üles ehitama. Võite mõelda sellele kui väikesele käivitamisele, kuid veenduge, et keskenduksite jätkuvalt projekti andmeteaduslikule osale ja äritegevuse osa võite lihtsalt ignoreerida. Mõne idee saamiseks on siin mõned minu lemmikloomaprojektid viimastel aastatel:

  • Ehitasin skripti, mis jälgis kinnisvara veebisaiti ja saatis mulle e-postiga parimad pakkumised reaalajas - et saaksin need tehingud enne kõiki teisi kätte.
  • Ehitasin skripti, mis tõmbas kokku kõik ABC, BBC ja CNN artiklid ning ühendasin kasutatud sõnade põhjal artiklid, mis olid täpselt sama teema kohta 3 erinevas uudisteportaalis.
  • Ehitasin Pythonis iseõppiva vestlusbooti. (See pole siiski liiga nutikas - kuna ma pole seda veel treeninud.)

Ole loominguline! Leidke enda jaoks andmeteadustega seotud lemmikloomaprojekt ja alustage kodeerimist! Kui lüüakse kodeerimisprobleemiga seinale - see võib juhtuda lihtsalt siis, kui hakkate uut andmekeelt õppima - kasutage lihtsalt google'i ja / või ülekattevoolu. Üks lühike näide minu kohta - kui tõhus on virnastamine:

vasak pool: minu küsimus - parem pool: vastus (7 minutiga)

Pange tähele ajatemperatuuri! Olen saatnud omamoodi keeruka küsimuse ja sain vastuse tagasi 7 minutiga. Ainuke asi, mida ma vajasin, oli koodi kopeerimine ja kleepimine oma tootmiskoodi ja buumi, see lihtsalt töötas!

(Märkus. Cross Validated on veel üks suurepärane foorum andmeteadusega seotud küsimuste jaoks.)

+1 soovitus:

Isegi kui see on natuke keeruline, proovige mentorit saada. Kui teil veab, leiate kellegi, kes töötab mõnusas ettevõttes andmeteadlase rollis ja kes saaks teiega veeta 1 tund nädalas või kaks korda nädalas ning asju arutada või õpetada.

# 4: kuhu ja kuidas saadate oma esimese töökoha avalduse?

Kui teil pole mentorit leida õnnestunud, võite oma esimese ettevõtte ikkagi leida. See on teie esimene andmetöötlusega seotud töö, seega soovitan mitte keskenduda suurele rahale või ülimaitsvale käivitusõhkkonnale. Keskenduge keskkonna leidmisele, kus saaksite end õppida ja end paremaks muuta.

Esimese andmetöötluse töökoha võtmine rahvusvahelises ettevõttes ei pruugi selle mõttega sobituda, kuna sealsed inimesed on tavaliselt oma asjadega liiga hõivatud, nii et neil pole aega ega / ja motivatsiooni teid paremaks muuta (muidugi on alati olemas erandid).

Pisikese alustamisega alustamine meeskonna esimese andmeisikuna pole ka teie puhul hea mõte, kuna neil ettevõtetel pole vanemate andmetest poisse, kellelt õppida.

Soovitan teil keskenduda 50–500 suurusele ettevõttele. See on kuldne keskmine. Pardal on vanemaid andmeteadlasi, kuid nad pole liiga hõivatud, et teid aidata ja õpetada.

Okei, olete leidnud häid ettevõtteid ... Kuidas kandideerida? Mõned põhimõtted oma CV jaoks: tooge esile oma oskused ja projektid, mitte kogemus (kuna teil pole veel liiga palju aastaid paberile panemiseks). Loetlege kasutatavad asjakohased kodeerimiskeeled (SQL ja Python) ja linkige mõni seotud githubi repos, nii et saate näidata, et olete seda keelt tõesti kasutanud.

Samuti küsivad ettevõtted enamasti kaaskirja. Muidugi on see hea võimalus oma entusiasmi väljendada, kuid võite lisada ka praktilisi üksikasju, näiteks mida teeksite oma esimese paari nädala jooksul, kui teid palgataks. (Nt “Vaadates teie registreerimisvoogu, oleks ____ veebilehel oluline roll. Oma esimese nädala jooksul viiksin ___, ___ ja ___ (konkreetsed analüüsid) läbi selle hüpoteesi tõestamiseks ja selle sügavamaks mõistmiseks. See võib aidata ettevõttel _____ täiustada ja lõpuks _____ KPI-d edasi viia. ”)

Loodetavasti viiks see teile tööintervjuule, kus saate natuke vestelda oma lemmikloomaprojektidest, kaaskirjakirjadest, kuid see puudutab enamasti isiksuse sobivuse kontrolli ja tõenäoliselt mõnda põhioskuste testi. Kui oleksite piisavalt harjutanud, siis läbiksite selle ... aga kui olete närviline tüüp ja soovite rohkem harjutada, saate seda teha saidil hackerrank.com.

Järeldus

Noh, see selleks. Ma tean, et see kõlab lihtsamalt, kui see on kirjutatud, kuid kui olete kindlalt otsustanud olla andmeteadlane, pole selle tegemiseks mingit probleemi! Edu sellega!

Kui soovite proovida, mis tunne on olla noorem andmeteadlane reaalse elu alustamisel, siis vaadake minu 6-nädalast veebipõhist andmeteaduste kursust: Juunioriteadlase esimene kuu!

Ja kui soovite lisateavet andmeteaduse kohta, siis vaadake minu ajaveebi (data36.com) ja / või tellige minu infoleht! Ja ärge jätke ilma minu uuest kodeerimisõpetuse seeriast: SQL andmete analüüsiks!

Täname, et lugesite!

Nautisite artiklit? Palun andke mulle lihtsalt teada, klõpsates allpool asuvat . See aitab ka teistel inimestel seda lugu näha!

Data36.com Twitteri autor Tomi Mester Twitter: @ data36_com