Programmēšana

3 Kaggle alternatīvas sadarbības datu zinātnei

Kāds ir labākais veids, kā iegūt labu atbildi uz grūto jautājumu? Jautājiet virknei cilvēku un izveidojiet no tā konkursu. Tā jau sen ir bijusi Kaglga pieeja datu zinātnei: pārvērtiet smagas misijas, piemēram, precīzāku plaušu vēža noteikšanu, par prēmiju maksājošām sacensībām, kurās uzvar labākās komandas un labākie algoritmi.

Tagad Kaggle tiek ieviests Google tīklā, un, lai arī visas pazīmes norāda, ka tas tiek turēts līdz šim, būs satricinājumi par vietnes ilgtermiņa perspektīvām ar tik uzticīgu kopienu un savdabīgu pieeju.

Šeit ir trīs citas vietnes, kurām ir līdzīga misija, ja vien tās nav tieši ieturētas Kaggle pēdās. (Ņemiet vērā, ka dažas vietnes, piemēram, CrowdAnalytix, konkursos pieņemtos risinājumus var uzskatīt par nomas darbiem un tādējādi arī viņu īpašumu.)

CrowdAI

CrowdAI ir École Polytechnique Fédérale de Lausanne (Šveice) produkts. Tā ir atvērta pirmkoda platforma atklātu datu izaicinājumu izvietošanai un ieskatam par to, kā tika risinātas attiecīgās problēmas. Platforma ir diezgan jauna, un līdz šim ir piedāvāti tikai seši izaicinājumi, taču no šīm izaicinājumiem iegūtās apmācības ir detalizētas un vērtīgas, sniedzot soli pa solim metodikas, lai reproducētu šo darbu vai radītu kaut ko līdzīgu. Esošie vingrinājumi aptver tādas kopīgas sistēmas kā Torch vai TensorFlow, tāpēc tā ir laba vieta, kur iegūt praktisku informāciju par to izmantošanu.

DrivenData

DrivenData, ko izveidoja konsultācijas, kas nodarbojas ar profesionālām datu problēmām, rīko tiešsaistes izaicinājumus, kas ilgst dažus mēnešus. Katrs no tiem ir īpaši koncentrēts uz aktuālām problēmām, ar kurām saskaras visa pasaule, piemēram, slimību izplatības prognozēšana vai Yelp datu ieguve, lai uzlabotu restorānu pārbaudes procesus. Tāpat kā Kaggle, arī DrivenData ir datu zinātnes darba vietu dēlis - funkcija, kuru cilvēki uztrauc, varētu pazust no Kaggle pēc iegādes.

PūļaAnalytix

CrowdAnalytix, kuru atbalsta investori no Accel Partners un SAIF Partners, koncentrējas uz uz datiem balstītu problēmu risināšanas sacensību rīkošanu, nevis uz to iegūto informāciju. Tiek piedāvāti konkursi par problēmu risinājumu meklēšanu tādās kategorijās kā modelēšana, vizualizācija un pētījumi, un katram no tiem ir deviņi tūkstoši dolāru. Daži iepriekšējie izaicinājumi ietver faktisko darbinieku kompensācijas prasību vai aviosabiedrību kavējumu izmaksu prognozēšanu. Citi konkursi tomēr netiek rīkoti par naudu, bet gan par konkurētspējīgu iespēju apgūt saistītu disciplīnu, piemēram, R valodu.

$config[zx-auto] not found$config[zx-overlay] not found