Calitățile esențiale ale unui Data Scientist

Publicat: 2017-01-12
Cuprins arată
Gândirea statistică
Abilități de programare
O minte curios
Natura orientata spre rezultate
Creativitate
Înțelegerea bazelor de date
Abilități mari de comunicare
Foamea de date

Big data a crescut încă de la începutul tehnologiei informației. Acum, datele pe care le creăm o dată la două zile sunt echivalente cu toate datele pe care le-am acumulat până în 2003. Această cantitate gigantică de date are informații de neprețuit nu doar pentru afaceri, ci pentru întreaga rasă umană în sine. Analiza datelor mari a ajutat industria sănătății cu cercetarea de ceva timp. Mai mult, big data ar putea chiar să rezolve puzzle-ul cancerului în scurt timp.

Dacă ți-aș spune că Big data este de fapt doar o grămadă de date care nu are sens dacă nu știi cum să le folosești? Aici intră în imagine oamenii de știință de date. Pentru a înțelege datele mari, avem nevoie de oameni de știință de date și, mai exact, de cei buni. Și nu lăsați titlul „scientist de date” să vă păcălească, există destul de multe calități pe care un cercetător de date ar trebui să le posede pentru a fi numit una. Dacă doriți să angajați un cercetător de date sau plănuiți să fiți unul, iată care sunt calitățile pe care ar trebui să le căutați sau să le dețineți.

cercetător de date

Gândirea statistică

Transformarea datelor în informații este sarcina principală a unui cercetător de date. Know-how-ul în statistică este, prin urmare, o calitate de la sine înțeles. Privind lucrurile cu o mentalitate cantitativă, este important să rămâneți neutru și să țineți departe părtinirile în timp ce vă ocupați de date. Un bun om de știință de date înțelege că profunzimea și fiabilitatea informațiilor cresc proporțional cu cantitatea de date și se abține de la a ajunge la concluzii cu date inadecvate. Cu o cantitate imensă de date, tendințele și perspectivele apar ca cifre. Prin urmare, dragostea pentru numere este necesară pentru a fi un adevărat om de știință a datelor. Un om de știință de date ar trebui să fie capabil să interogheze cantități mari de date pentru a obține informații care să poată fi acționate și apoi să aplice tehnici de modelare predictivă pentru a anticipa tendințele viitoare. O bună menținere a statisticilor este necesară pentru pregătirea rapoartelor și trasarea cursurilor de acțiune recomandate pe baza informațiilor.

Abilități de programare

Un cercetător de date ar lucra cu diferite echipe pentru a construi conducte, instrumente, module, pachete, site-uri web, tablouri de bord și multe altele. Acest lucru nu înseamnă că un cercetător de date ar trebui să fie un codator expert, dar înțelegerea algoritmilor și a modului în care funcționează codurile poate contribui mult în munca unui cercetător de date. Când sistemul nu vă poate oferi tendințele sau perspectivele potrivite, este timpul să vă suflecați mânecile și să scrieți un cod. Acest lucru ar fi imposibil fără anumite abilități de programare și flexibilitate tehnică.

Python este acceptat ca cel mai versatil și compatibil limbaj de programare și este ideal pentru gestionarea bazelor de date și a interogărilor de tip MapReduce. Fiind ușor de învățat limba și open-source, învățarea python nu ar trebui să fie un obstacol între tine și visul tău de știință a datelor.

Multe organizații au în vedere faptul că dețin „abilități de pseudo-cod” excelente în timpul angajării unui cercetător de date. „Abilități de pseudocod” este capacitatea de a scrie cum ar trebui să funcționeze o interogare sau un algoritm în limba engleză simplă. Această abilitate de rezolvare a problemelor este esențială pentru a crește ca om de știință a datelor. Știința datelor este o industrie în care standardele de aur se schimbă într-un ritm alarmant, ceea ce subliniază importanța de a avea mai multe abilități decât ceea ce cere scenariul actual.

O minte curios

Deși știința datelor este un domeniu destul de vechi, descoperirile se fac din când în când. Motivul pentru a găsi noi modalități de a rezolva o problemă veche este motivul din spatele acestui lucru. Un om de știință de date ar trebui să aibă întotdeauna o minte curios pentru a fi atent la o modalitate nouă și mai bună de a achiziționa, îmbina și procesa date și de a găsi instrumente pentru a obține informații mai bune. Un specialist în date ideal nu ar trebui să înceteze niciodată să fie curios, deoarece datele dețin secrete pe care le-ar mărturisi doar celor curioși. Un adevărat om de știință de date nu încearcă să vadă cum datele își dovedesc părtinirile corecte, ci caută adevărurile ascunse în adâncul lor.

Cu date, lucrurile pot deveni uneori destul de dificile și doar curiozitatea te poate conduce către rezultate. Acesta este motivul pentru care curiozitatea este una dintre cele mai esențiale calități ale unui cercetător de date.

Natura orientata spre rezultate

Analiza datelor se referă mai mult la rezultate decât la procesul în sine. Nu contează cum aduci rezultatele cu date atâta timp cât există rezultatele așteptate. Oamenii de știință de date ar putea fi nevoiți uneori să ia mai mult de o cale pentru a rezolva anumite probleme. A fi blocat de mici obstacole nu este o calitate bună pentru un cercetător de date. A fi orientat către rezultate ajută în cazuri în care determinarea puternică de a converti datele în rezultate devine forța motrice pentru ei înșiși. Oamenii de știință de date, în general, sunt oameni care trec de la o problemă la alta în timp ce jonglează cu diferite sarcini în același timp. Nimic, în afară de rezultat, îi poate opri din efort.

Creativitate

Creativitatea ar putea arăta ca cea ciudată din această listă. Adevărul este că este una dintre cele mai importante calități pentru un cercetător de date. Oamenilor creativi nu le este frică să greșească, experimentează lucruri noi și îndrăznesc să exploreze noi teritorii. Ei găsesc oportunități în eșecurile lor și pot schimba cu ușurință direcția. Toate acestea sunt esențiale pentru știința datelor.

Clasificăm adesea oamenii în creier stâng și creier drept. Științele concrete precum big data sunt rareori asociate cu creativitatea și aceasta este o mare greșeală. Oamenii de știință de date se încadrează undeva între cele două categorii și au nevoie de un strop de creativitate pentru a găsi abordări și modalități mai noi de a gestiona datele. Statisticile și bazele de date nu reprezintă știința datelor, ci povestea este cea care face ca rezultatul final al analizei să fie util pentru factorii de decizie.

Numai creativitatea nu poate face un om de știință a datelor, desigur. Cineva care poate pregăti rapoarte ușor de consumat, atractive și atrăgătoare ar putea să nu fie întotdeauna cea mai potrivită pentru rolul unui cercetător de date. Oamenii de știință de date pot fi numiți solutori creativi de probleme.

Înțelegerea bazelor de date

Indiferent dacă lucrați cu date structurate, nestructurate sau ambele împreună, un bun cercetător de date trebuie să aibă o idee fundamentală despre funcționarea bazelor de date. În plus, o înțelegere de bază a bazelor de date columnare și relaționale poate face un drum lung în a ușura munca unui cercetător de date. Multe dintre depozitele corporative încă folosesc baze de date relaționale tradiționale. Oamenii de știință de date vor trebui, de asemenea, să fie implicați în configurarea acestor baze de date, deși va exista personal tehnic care să execute sarcina. Know-how-ul dezvoltării unei infrastructuri de baze de date care poate gestiona date nestructurate este ca o cireșă.

Abilități mari de comunicare

Un om de știință a datelor va lucra în mare parte cu oamenii din tehnologie, analiză și oameni de afaceri în același timp. El(el) acționează adesea ca traducător pentru toate părțile implicate. Să se ocupe de jargonul tehnologiei și al afacerilor în același timp și să știe ce să folosească cu cine are nevoie de abilități puternice de comunicare. Rezultatul analizei nu este de obicei drăguț, cel puțin pentru cineva care nu este un cercetător de date. Perspectivele și tendințele sunt blocate în numere și ar trebui interpretate și comunicate echipei de afaceri și părților interesate într-un mod pe care ei le înțeleg. Un mare om de știință de date ar trebui să fie capabil să traducă rezultatul complex din analiză într-o formă mai simplă înțeleasă de oameni din medii diferite, folosind povestiri, metafore și mijloace vizuale de comunicare.

Foamea de date

Un mare cercetător de date este întotdeauna dornic de mai multe date. Căutarea de date este una fără obiective stabilite, deoarece mai multe date reprezintă întotdeauna date mai bune. Un cercetător de date ar trebui să caute în continuare mai multe surse de date, modalități mai bune de a le achiziționa și metode inovatoare de procesare. Unitatea de a obține mai multe date este ceva pe care un cercetător de date trebuie să-l posede, deoarece datele sunt combustibilul pentru analiză.