close
Vissza a blogra
Dreamjo.bs
3 perc
december 08.
Álommelók

Data Scientist: Matematikus? Statisztikus? Programozó? - Jó, ha tudod, mielőtt jelentkezel

Lőrincz Orsolya EV (Data Scientist)

Mivel foglalkozik ma egy Data Scientist és kinek ajánlható egy ilyen állás? Ezekre a kérdésekre talán nem is olyan egyszerű válaszolni, nekünk azonban szerencsénk volt. Lőrincz Orsolya szabadúszó fejvadász segített megérteni, milyen embert is keres pontosan nemzetközi szinten dolgozó adatanalitikai szolgáltató vállalat partnere.

Kezdjük azzal, hogyan is kell elképzelnünk azt a munkahelyet, ahol a leendő kolléga dolgozni fog?

Esetünkben egy nagyon komoly, new york-i székhelyű adatanalitikai szolgáltató cégről van szó, amely elsősorban retail/e-commerce területen működik, de már kiépítés alatt van az eHealth üzletág is. Ez nem meglepő, hiszen a Data Scientist munkájára általában ilyen és hasonló helyeken van igény. Cégük aktuálisan két szektorban működik: FMCG/retail (kiskereskedelem) és health (egészségügy). FMCG területen a fő feladat tipikus üzleti problémák, például a marketing channel optimalizálás és a kereslet előrejelzése (demand forecasting).

Milyen kihívásra számíthat az, aki ma beadná hozzájuk a jelentkezését?

Érdekes aktuális kérdés, amire sokan keresik most a választ, de ennél a cégnél kutatják is, hogy milyen lesz az új "normális" a COVID-19 járvány után. Egy konkrét példa aktuális projektre: állatgyógyszerek esetén annak meghatározása a feladat, hogy a lemorzsolódás elkerülhető vagy elkerülhetetlen-e. Állatgyógyászatban már azt is érdekes definiálni, hogy mit nevezünk elkerülhetetlen lemorzsolódásnak. Igen, sajnos, ez az, amikor az állat az élete végéhez ér. Gyakorlatilag a kollégáknak azt kell megbecsülniük, hogy bekövetkezett-e ez a szomorú esemény. Egészségügyi területen is nagyon izgalmas use case-ekkel foglalkoznak. Az egyik ilyen kutatási feladat annak az előrejelzése korábbi laboreredmények alapján, hogy valakinek van-e valamilyen ritka betegsége. Ennek a korai szűrés és az életminőség javítás miatt van jelentősége. Olyan ritka betegségek is vannak, sajnos, amelyekre ritkán tesztelnek, nem gondolnak rá az orvosok, így látens betegségként vannak jelen. Egy K+F projektben is részt vesznek: trend analízissel foglalkoznak a kínai közösségi médiában, ami egy speciális ország ebből a szempontból.

Hogyan dolgozik egy Data Scientis ebben a környezetben?

A Data Scientistek csapatot alkotnak és minden projekten legalább 2 Data Scientist dolgozik. Nincs olyan, hogy teljesen egyedül dolgozzon valaki. Abban hisznek, hogy az ötletek diverzifikálásával jobb eredményt lehet elérni. Három lokációban vannak Data Scientistek: New York, India és Budapest. Arra is figyelnek, hogy rotálják a csapattagokat, ne mindig ugyanaz a két ember legyen párban. A Data Scientistek maguk választják meg, hogy milyen módszerrel dolgoznak, milyen statisztikai illetve gépi tanulási eljárásokat alkalmaznak, milyen modell struktúrát választanak egy-egy üzleti kérdés megválaszolására. A legegyszerűbb regressziótól a komplex, többrétegű neurális hálókig bármi alkalmazható és alkalmazzák is.

Akkor most tisztázzuk: tulajdonképpen mi is az a Data Scientist?

A Data Scientist az a statisztikus, aki jobban tud programozni, mint a többi statisztikus. Vagy az a fejlesztő, aki jobban ért a statisztikához, mint a többi fejlesztő. Nincs egzakt definíció, de talán az különbözteti meg más területektől, hogy nagy mennyiségű adattal dolgoznak, szofisztikáltabb statisztikai és gépi tanulási eljárásokat alkalmaznak és programozni is tudni kell. Olyan dolgokat kell számolni, amiket papíron már nem lehet.

A Data Science ennél a cégnél alkalmazott területet jelent: létező megoldásokkal operálnak. Nem feltétlenül szükséges mérnöki vagy matematikai háttér, más területről, üzleti oldalról is lehet jönni, de nagyon erős, "magas" statisztikai és programozási ismeretek kellenek. Pythont és R-t használnak. Ez más terület, mint az adatelemzés. A Data Analystok jellemzően sokkal kisebb mennyiségű, könnyen kezelhető adatokkal dolgoznak, alap statisztikákat használnak és ehhez nem kell programozni tudni.

A Data Scientist és a Researcher a magyar piacon szintén keverednek. A Researcher egy matematika, fizika, computer science vagy hasonló végzettségű kutató, aki egy elméleti szakember. Ő az, aki új módszereket fog kutatni, amit aztán a Data Scientistek a konkrét üzleti problémákon tudnak alkalmazni. Fontos eltérés, hogy a múltbéli adatok alapján mire vonatkozóan teszünk megállapításokat. A jelen állapotot a legtöbb cégnél a Data Analystok, BI szakemberek elemzik. A jövőbe mutató predikciókat főleg a Data Scientistek végzik. Ez a cég is prediktív, jövő-orientált kutatásokkal foglalkozik.

Honnan érkeznek az ötletek?

Ötletek bárhonnan érkezhetnek. Abban hisznek, hogy jó ötlet bárkitől jöhet. Ezért is helyeznek hangsúlyt a csapatok diverzifikálására.

Miért jó Data Scientisként a cégnél dolgozni?

Változatosak a feladatok, a use case-ek, amiket kutatni lehet. Párhuzamosan van product development és consultancy. Hosszú távú víziója van a cégnek, amit szeretne megvalósítani és ehhez biztosított az anyagi stabilitás is. Elit, nemzetközi csapathoz lehet tartozni. Okosak az emberek, akik el is végzik azt, amit elvállaltak, amelyhez világszínvonalú technológiákat használnak.

És végül: hogyan érinti a vírus-krízis a munkát? Mi az, amit érdemes továbbvinni?

COVID-tól függetlenül az a szemlélet, hogy a produktivitás fontosabb, mint a ledolgozott órák száma. Heti 1-2 office nap lesz, a többi napon lehet otthonról dolgozni. Ez így volt a járvány előtt is. Teljesen remote munkavégzés nem várható. A személyes kapcsolatokat fontosnak tartják. Nyáron, a két COVID hullám között Office Monday-t tartottak, amikor be lehetett menni az irodába. Nem volt kötelező, de aki akart, hétfőnként tudta megtenni. Négy embernél több nem lehet egyszerre az irodában.

További cikkek a témában

Kapcsolódó állások
Kapcsolódó cégek