Mida ja kuidas peaksin õppima, et saada andmeanalüütikuks / andmeteadlaseks? Kas mõlemal on erinevus?


Vastus 1:

See kehtib eriti selliste tehnoloogiate kohta nagu Data Science, Machine Learning ja AI, mida on turunduseesmärkide saavutamiseks kasutatud, üle kasutatud ja mõnikord hüpoteesitud. Oluline on mõista, et kuigi need väljad kattuvad, ei saa neid vaheldumisi kasutada.

Lihtsamalt öeldes loob infoteadus teadmisi, masinõpe aga ennustusi. AI seevastu genereerib toiminguid.

Andmeteaduse abil mõistmine

Andmeteadus on üks paremaid distsipliine erinevat tüüpi arusaamade saamiseks - kirjeldav, uuriv, järeldatav, juhuslik, ennustav ja mehhaaniline arusaam. Andmeteadus hõlmab statistilisi järeldusi, katsete kavandamist, tarkvaratehnikat, andmete visualiseerimist, spetsiifilisi valdkonnaalaseid teadmisi ja tõhusat suhtlust.

Mis eristab andmeteadust sellistest seotud valdkondadest nagu masinõpe ja AI, on vajadus inimeste kaasamise järele ahelasse. Alati on vaja, et keegi mõistaks mõistmist, mõistks graafikuid ja arvandmeid ning teeks saadud arusaamade põhjal otsustavaid otsuseid.

Usaldusväärsed ennustused masinõppe kaudu

Masinõpe tagab, et suure hulga kogutud andmete põhjal tehtud ennustused on võimalikult täpsed. Andmeteadus ja masinõpe kattuvad palju. Näiteks rakendatakse logistilist regressiooni nii andmeteaduses kui ka masinõppes. Kuid andmeteaduses kasutatakse seda teadmiste saamiseks erinevate tegurite seoste kohta, samas kui masinõppes annab see ennustusi.

Tööstuses tegutsevad töötajad vahetuvad sageli kahe eriala vahel ja andmeteadlased kasutavad tavaliselt masinõpet. Näiteks e-õppe rakenduses võiks liiklusandmeid modelleerida, et teha kindlaks, millised kliendid tõenäoliselt konkreetset toodet otsivad. See on masinõppe rakendus. Kui andmeliikluse põhjal koostatakse kokkuvõtted ja visualiseeringud, on see andmeteaduse rakendus.

Toimingute automatiseerimine tehisintellektiga

AI hõlmab inimesele sarnase kognitiivse intelligentsuse edastamist arvutitele. Väidetavalt rakendavad AI kõik masinad, mis teostavad intelligentselt ülesannet või toimingut koos algoritmide kasutamisega. Oluline vahetegemine AI ja kahe teise distsipliini vahel on osa üritusest. AI-d kasutatakse laialdaselt robootikas, juhtimisteoorias, mängualgoritmides, robotites ja tugevdusõppes.

Kaaluge konkreetse toote kliendiandmete analüüsi. Oletame, et avastatakse, et mõned kliendid ostavad tõenäoliselt rohkem kui teised (ülevaade). Saadakse numbriline ja graafiline väljund, mis võimaldab juhtivtöötajatel teha ennustusi ja / või teha järeldusi; kuid see ei pruugi viia konkreetsete toiminguteni. See oleks infoteaduse rakendus koos masinõppe seguga, kuid mitte AI-ga.

Andmetöötluse, masinõppe ja AI ühendamine

Oletame, et ehitatakse isereguleeruvate võimalustega termostaati. Seejärel saaks kolme tehnoloogiat kasutada järgmiselt:

  1. Masinõpe: suur keskkonnateemaliste väärtuste andmekogum, et töötada välja algoritm, mis ennustaks soovitavaid temperatuurivahemikke ja saavutaks fikseeritud väärtuse. Tehisintellekt: Kui konkreetne keskkonnatingimus on täidetud, teeb termostaat automatiseeritud toimingu, kohandades kindlale temperatuur vastavast vahemikust

Andmeteadus: Termostaadiga tehtud katsetes leitakse mõnikord, et temperatuurid ei sobi kodudes viibivatele inimestele, eriti päevatundidel. Pärast katseandmete uurimist saadakse arusaam, et kehatemperatuuri muutumist ei võetud arvesse. Seega on vaja konstrueerida parem andmekogum, mis sisaldaks andmeid kehatemperatuuri kohta. Seejärel korratakse kogu protsessi.

Huvilistel on võimalik mulle kirjutada e-posti aadressil [email protected]