Programmēšana

Mūsdienu datu zinātnes lomas nepastāvēs pēc 10 gadiem

Nākamajā desmitgadē datu zinātnieka loma, kāda mums ir zināma, izskatīsies pavisam savādāka nekā šodien. Neuztraucieties, neviens taču neprognozē zaudēto darbu mainīts darbavietas.

Datu zinātniekiem būs labi - saskaņā ar Darba statistikas biroja datiem tiek prognozēts, ka līdz 2029. gadam loma pieaugs augstākā vidējā līmeņa klipā. Bet tehnoloģiju attīstība būs impulss milzīgai izmaiņai datu zinātnieka pienākumos un pienākumos. veids, kā uzņēmumi pieeja analītikai kopumā. Un šo revolūciju vadīs AutoML rīki, kas palīdz automatizēt mašīnmācīšanās cauruļvadu no sākotnējiem datiem līdz izmantojamam modelim.

Pēc 10 gadiem datu zinātniekiem būs pilnīgi atšķirīgas prasmju un rīku kopas, taču to funkcija paliks nemainīga: kalpot kā pārliecinātām un kompetentām tehnoloģiju rokasgrāmatām, kas var radīt jēgu no sarežģītiem datiem biznesa problēmu risināšanai.

AutoML demokratizē datu zinātni

Vēl nesen mašīnmācīšanās algoritmi un procesi bija gandrīz tikai tradicionālo datu zinātnes lomu sfēra - tie, kuriem ir oficiāla izglītība un augstāks grāds, vai kuri strādā lielās tehnoloģiju korporācijās. Datu zinātniekiem ir bijusi neatsverama loma katrā mašīnmācīšanās attīstības spektra daļā. Bet ar laiku viņu loma kļūs sadarbības un stratēģiskāka. Izmantojot tādus rīkus kā AutoML, lai automatizētu dažas viņu akadēmiskās prasmes, datu zinātnieki var koncentrēties uz organizāciju virzību uz biznesa problēmu risināšanu, izmantojot datus.

Daudzos veidos tas notiek tāpēc, ka AutoML demokratizē centienus mašīnmācīšanos ieviest praksē. Pārdevēji no iesācējiem līdz mākoņu hiperskaleriem ir izlaiduši risinājumus, kurus izstrādātāji var pietiekami viegli izmantot un eksperimentēt bez liela izglītības vai pieredzes šķēršļa iekļūšanai. Tāpat dažas AutoML lietojumprogrammas ir pietiekami intuitīvas un vienkāršas, lai netehniskie darbinieki varētu izmēģināt savus spēkus, lai izveidotu problēmu risinājumus savos departamentos - izveidojot sava veida “pilsoņu datu zinātnieku” organizācijās.

Lai izpētītu iespējas, ko šāda veida rīki paver gan izstrādātājiem, gan datu zinātniekiem, mums vispirms ir jāsaprot datu zinātnes pašreizējais stāvoklis saistībā ar mašīnmācīšanās attīstību. Visvieglāk to saprast, ja to ievieto brieduma skalā.

Mazākas organizācijas un uzņēmumi ar tradicionālākām lomām, kas atbild par digitālo pārveidi (t.i., klasiski apmācīti datu zinātnieki) parasti ietilpst šajā skalas galā. Pašlaik viņi ir lielākie klienti mašīnmācīšanās lietojumprogrammām, kas ir vairāk pielāgotas auditorijai, kura nav pazīstama ar mašīnmācīšanās sarežģījumiem.

  • Plusi: Šīs lietojumprogrammas pēc atslēgas ir viegli īstenojamas, salīdzinoši lētas un viegli izvietojamas. Mazākiem uzņēmumiem, kuriem ir ļoti specifisks automatizācijas vai uzlabošanas process, tirgū, iespējams, ir vairākas dzīvotspējīgas iespējas. Zems ienākšanas šķērslis padara šīs lietojumprogrammas perfektas datu zinātniekiem, kuri pirmo reizi ķeras pie mašīnmācīšanās. Tā kā dažas lietojumprogrammas ir tik intuitīvas, tās ļauj netehniskiem darbiniekiem eksperimentēt ar automatizāciju un uzlabotām datu iespējām - potenciāli organizācijā ieviešot vērtīgu smilškasti.
  • Mīnusi: Šī mašīnmācīšanās lietojumprogrammu klase ir pazīstama ar neelastību. Lai gan tos var viegli ieviest, tos nav viegli pielāgot. Tādējādi noteiktiem precizitātes līmeņiem dažām lietojumprogrammām var būt neiespējami. Turklāt šīs lietojumprogrammas var ievērojami ierobežot, paļaujoties uz iepriekš sagatavotiem modeļiem un datiem. 

Šo lietojumu piemēri ir Amazon Comprehend, Amazon Lex un Amazon Forecast no Amazon Web Services un Azure Speech Services un Azure Language Understanding (LUIS) no Microsoft Azure. Šie rīki bieži ir pietiekami, lai augošie datu zinātnieki spertu pirmos soļus mašīnmācībā un virzītu savas organizācijas tālāk brieduma spektrā.

Pielāgojami risinājumi ar AutoML

Organizācijām ar lielām, tomēr samērā izplatītām datu kopām - domājot par klientu darījumu datiem vai mārketinga e-pasta metrikām - ir nepieciešama lielāka elastība, izmantojot mašīnmācīšanos problēmu risināšanai. Ievadiet AutoML. AutoML veic manuālas mašīnmācīšanās darbplūsmas darbības (datu atklāšana, izpētes datu analīze, hiperparametru iestatīšana utt.) Un kondensē tos konfigurējamā kaudzē.

  • Plusi: AutoML lietojumprogrammas ļauj veikt vairāk eksperimentu ar datiem lielākā telpā. Bet īstā AutoML lielvara ir piekļuve - var izveidot pielāgotas konfigurācijas un salīdzinoši viegli uzlabot ieejas. Turklāt AutoML netiek veidots tikai ar datu zinātniekiem kā auditoriju. Izstrādātāji var arī viegli plātīties smilšu kastē, lai savos produktos vai projektos ieviestu mašīnmācīšanās elementus.
  • Mīnusi: Lai gan tas ir tuvu, AutoML ierobežojumi nozīmē, ka izejas precizitāti būs grūti pilnveidot. Tāpēc zinātnieki, kuriem ir grādi, kartes nesošie dati, bieži vien skatās uz lietojumprogrammām, kas izveidotas, izmantojot AutoML, pat ja rezultāts ir pietiekami precīzs, lai atrisinātu problēmu.

Šo lietojumu piemēri ir Amazon SageMaker AutoPilot vai Google Cloud AutoML. Datu zinātniekiem pēc desmit gadiem neapšaubāmi būs jāpārzina šādi rīki. Tāpat kā izstrādātājam, kurš pārzina vairākas programmēšanas valodas, arī datu zinātniekiem būs jāzina vairākas AutoML vides zināšanas, lai viņus varētu uzskatīt par izcilākajiem talantiem.

Rokasgrāmatu un pašmāju mašīnmācīšanās risinājumi 

Lielākie uzņēmuma mēroga uzņēmumi un Fortune 500 uzņēmumi ir tie, kuros pašlaik tiek izstrādāta lielākā daļa moderno un patentēto mašīnmācīšanās lietojumprogrammu. Datu zinātnieki šajās organizācijās ir daļa no lielām komandām, kas pilnveido mašīnmācīšanās algoritmus, izmantojot daudzus vēsturiskus uzņēmuma datus, un veido šīs lietojumprogrammas no paša sākuma. Šādas pielāgotas lietojumprogrammas ir iespējamas tikai ar ievērojamiem resursiem un talantu, tāpēc izmaksa un riski ir tik lieli.

  • Plusi: Tāpat kā jebkura no nulles veidota lietojumprogramma, arī mašīnmācīšanās ir vismodernākā un balstīta uz padziļinātu izpratni par problēmu. Tas ir arī precīzāks - ja tikai ar nelielu starpību - nekā AutoML un automātiskie mašīnmācīšanās risinājumi.
  • Mīnusi: Pielāgotas mašīnmācīšanās lietojumprogrammas iegūšana, lai sasniegtu noteiktus precizitātes sliekšņus, var būt ārkārtīgi sarežģīta, un datu zinātnieku komandas bieži vien to prasa smagi. Turklāt pielāgotās mašīnmācīšanās iespējas ir laikietilpīgākās un visdārgākās.

Rokas ritināšanas mašīnmācīšanās risinājuma piemērs ir sākt ar tukšu Jupyter piezīmju grāmatiņu, manuāli importēt datus un pēc tam veikt katru darbību no izpētes datu analīzes līdz modeļa pielāgošanai ar rokām. To bieži panāk, rakstot pielāgotu kodu, izmantojot atvērtā pirmkoda mašīnmācīšanās ietvarus, piemēram, Scikit-learn, TensorFlow, PyTorch un daudzus citus. Šai pieejai ir nepieciešama gan pieredzes, gan intuīcijas pakāpe, taču tā var radīt rezultātus, kas bieži pārspēj gan mašīnmācīšanās pakalpojumus līdz gatavam, gan AutoML.

Tādi rīki kā AutoML nākamajos 10 gados mainīs datu zinātnes lomas un pienākumus. AutoML noņem mašīnmācīšanās attīstības slogu no datu zinātniekiem no nulles un tā vietā mašīnmācīšanās tehnoloģijas iespējas nodod tieši citu problēmu risinātāju rokās. Atbrīvojies laiks, lai koncentrētos uz to, ko viņi zina - datiem un pašiem ieguldījumiem - datu zinātnieki pēc desmit gadiem būs vēl vērtīgāki ceļveži viņu organizācijām.

Ēriks Millers ir vecākais tehniskās stratēģijas direktors Rackspace, kur viņš nodrošina stratēģisko konsultāciju vadību ar pārbaudītu pieredzi Amazon Partner Network (APN) ekosistēmas veidošanā.Pateicīgs tehnoloģiju līderis ar 20 gadu pārbaudītiem panākumiem uzņēmuma IT jomā, Ēriks ir vadījis vairākas AWS un risinājumu arhitektūras iniciatīvas, tostarp AWS labi arhitektūras ietvara (WAF) novērtēšanas partneru programmu, Amazon EC2 Windows Server AWS pakalpojumu piegādes programmu un plašu klāstu. no AWS pārraksta vairāku miljardu dolāru organizācijām.

Jauno tehnoloģiju forums nodrošina vietu, kur bezprecedenta dziļumā un plašumā izpētīt un pārrunāt topošās uzņēmuma tehnoloģijas. Izvēle ir subjektīva, balstoties uz mūsu izvēlētajām tehnoloģijām, kuras, mūsuprāt, ir svarīgas un interesē lasītājus. nepieņem mārketinga nodrošinājumu publicēšanai un patur tiesības rediģēt visu ieguldīto saturu. Nosūtiet visus jautājumus uz [email protected].

$config[zx-auto] not found$config[zx-overlay] not found