Programmēšana

5 Python izplatījumi mašīnmācīšanās apgūšanai

Ja jūs strādājat statistikas, datu zinātnes vai mašīnmācības jomā, izmantojat Python, ir liela varbūtība. Un arī laba iemesla dēļ: bagātīgā bibliotēku un rīku ekosistēma un pašas valodas ērtības padara Python par lielisku izvēli.

Bet kas Python? Valoda ir sadalīta vairākos veidos, un katrs no tiem ir izveidots atšķirīgi un dažādām auditorijām. Šeit mēs esam sīki aprakstījuši piecus Python iemiesojumus, sākot no visparastākajiem un beidzot ar visprecīzākajiem, kā arī informāciju par to, kā viņi sakrājas, lai apstrādātu mašīnmācīšanās darbus.

Saistītais video: kā Python atvieglo programmēšanu

Ideāli piemērots IT, Python vienkāršo daudzu veidu darbu, sākot no sistēmas automatizācijas līdz darbam tādās modernās jomās kā mašīnmācīšanās.

Anakonda Python

Anaconda ir guvusi ievērību kā galvenā Python izplatīšana ne tikai datu zinātnei un mašīnmācībai, bet arī vispārējas nozīmes Python izstrādei. Anaconda nodrošina tāda paša nosaukuma komercpakalpojumu sniedzējs (agrāk Continuum Analytics), kas piedāvā atbalsta plānus uzņēmumiem.

Anaconda distro nodrošina, pirmkārt, Python izplatīšanu, kas aprīkota ar vieglu piekļuvi datu zinātnē bieži izmantotajām paketēm: NumPy, Pandas, Matplotlib un tā tālāk. Tie nav vienkārši komplektā ar Anaconda, bet ir pieejami, izmantojot pielāgotu pakotņu pārvaldības sistēmu ar nosaukumu Conda. Conda instalētās paketes var ietvert viltīgas ārējās binārās atkarības, kuras nevarēja pārvaldīt, izmantojot pašu Python Pip. (Ņemiet vērā, ka joprojām varat izmantot Pip, ja vēlaties, taču jūs nesaņemsiet priekšrocības, ko Conda nodrošina šiem paketēm.) Anaconda katru paketi atjaunina, un daudzas no tām ir apkopotas ar Intel MKL. ātruma pagarinājumi.

Otra galvenā priekšrocība, ko Anaconda sniedz, ir grafiskā vide - Anaconda Navigator. Navigator nav IDE, bet gan ērts GUI priekšgals Anaconda funkcijām, tostarp Conda pakotņu pārvaldniekam un lietotāja konfigurētai virtuālajai videi. Varat arī lietotni Navigator pārvaldīt trešo pušu lietojumprogrammas, piemēram, Jupyter piezīmjdatorus un Visual Studio Code IDE.

Minimāla Anaconda instalēšana, saukta par Miniconda, instalē tikai tik daudz Anaconda bāzes, lai sāktu darbu, taču to var papildināt ar citām Conda- vai Pip instalētām pakotnēm, kā jums tās nepieciešams. Tas ir noderīgi, ja vēlaties izmantot Anaconda bagātīgo bibliotēku klāstu, taču jums ir jāsaglabā viss.

ActivePython

Datu zinātne ir tikai viens no ActivePython izmantošanas gadījumiem, kas tika izstrādāts, lai kalpotu kā profesionāli atbalstīts valodas izdevums ar konsekventu ieviešanu dažādās arhitektūrās un platformās. Tas palīdz, ja izmantojat Python datu zinātnei tādās platformās kā AIX, HP-UX un Solaris, kā arī Windows, Linux un MacOS.

ActivePython cenšas pēc iespējas ciešāk pieturēties pie Python sākotnējās atsauces iemiesojuma. Īpaša sarežģītu math-and-stats pakotņu instalētāja (Anaconda pieeja) vietā ActivePython daudzus no šiem pakotnēm iepriekš apkopo, vajadzības gadījumā izmantojot Intel MKL paplašinājumus, un nodrošina tos kā pakotnes ar noklusējuma ActivePython instalāciju. Tie nav oficiāli jāuzstāda; tie ir pieejami uzreiz no kastes.

Tomēr, ja vēlaties jaunināt uz šo iepriekš kompilēto pakotņu jaunāku versiju, jums būs jāgaida, līdz nākamā ActivePython versija tiks izlaista. Tas padara ActivePython konsekventāku kopumā - vērtīgu lietu, kas nepieciešama rezultātu reproducējamības gadījumā, bet arī mazāk elastīgu.

CPython

Ja vēlaties sākt mašīnmācīšanās darbu no jauna, izmantojot tikai oficiālo Python vienkāršās vaniļas versiju, izvēlieties CPython. Tā nosaukts tāpēc, ka tas ir Python izpildlaika atsauces izdevums, kas rakstīts C, CPython ir pieejams Python Software Foundation vietnē un nodrošina tikai rīkus, kas nepieciešami Python skriptu darbināšanai un pakotņu pārvaldībai.

CPython ir jēga, ja vēlaties pielāgoti izveidot Python vidi mašīnmācīšanās vai datu zinātnes projektam, jūs uzticaties, ka tas tiek darīts pareizi, un nevēlaties, lai tiktu traucētas trešās puses izmaiņas. CPython avots ir viegli pieejams, tāpēc jūs pat varat pielāgot jebkuras izmaiņas, kuras varētu vēlēties veikt ātruma vai projekta vajadzību labad.

No otras puses, izmantojot CPython, jums būs jātiek galā ar pakotņu, piemēram, NumPy, instalēšanas un konfigurēšanas nepilnībām un visām to atkarībām - dažas no tām ir jāmeklē un jāpievieno manuāli.

Daži no šiem darbiem dažu pēdējo gadu laikā ir kļuvuši mazāk apgrūtinoši, īpaši tagad, kad Python’s Pip pakotņu pārvaldnieks eleganti instalē iepriekš sastādītus bināros failus, kādus izmanto daudzās datu zinātnes paketēs. Bet joprojām ir daudz gadījumu, īpaši Microsoft Windows, kur jums būs jāapvieno visi gabali ar roku, piemēram, manuāli instalējot C / C ++ kompilatoru.

Vēl viens CPython izmantošanas trūkums ir tas, ka tas neizmanto nevienu no mašīnu apguvē un datu zinātnē noderīgajām veiktspēju paātrinošajām iespējām, piemēram, Intel Math Kernel Library (MKL) paplašinājumus. Lai patstāvīgi izmantotu Intel MKL, jums jāveido NumPy un SciPy bibliotēkas.

Domāts nojume

Domājams, ka Python izplatījums Canopy daudzos veidos atgādina Anaconda. Tas ir veidots ar datu zinātni un mašīnmācīšanos kā galveno lietojuma gadījumu, tam ir savs kurētais paketes indekss, un tas nodrošina gan grafiskus priekšējos galus, gan komandrindas rīkus visas iestatīšanas pārvaldībai. Uzņēmuma lietotāji var iegādāties arī Enthought Deployment Server, kas ir ugunsmūra pakotņu pārvaldības sistēma. Mašīnmācību paketēs, kas izveidotas Canopy, tiek izmantoti Intel MKL paplašinājumi.

Galvenā atšķirība starp Anaconda un Canopy ir darbības joma. Nojume ir pieticīgāka, Anaconda visaptverošāka. Piemēram, ja Canopy ietver komandrindas rīkus Python virtuālās vides izveidei un pārvaldībai (noderīgi, strādājot ar dažādiem pakotņu komplektiem dažādām mašīnmācīšanās darbplūsmām), Anaconda šim darbam nodrošina GUI. No otras puses, Canopy ietver arī ērtu iebūvētu IDE - kombinētu failu pārlūku, Jupyter piezīmju grāmatiņu un kodu redaktoru -, kas ir noderīgs, lai uzreiz ielēktu un sāktu strādāt bez satraukuma.

WinPython

Sākotnējā WinPython misija bija nodrošināt Python izdevumu, kas izveidots tieši Microsoft Windows. Kad CPython būvējumi operētājsistēmai Windows nebija īpaši spēcīgi, WinPython aizpildīja noderīgu nišu. Šodien CPython Windows izdevums ir diezgan labs, un WinPython ir pievērsies plaisu aizpildīšanai, kuras joprojām nav bruģētas ar CPython, it īpaši datu zinātnes un mašīnmācīšanās lietojumprogrammām.

Pēc noklusējuma WinPython ir pārnēsājams. Viss WinPython izplatījums ietilpst vienā direktorijā, kuru var ievietot jebkur un palaist jebkur. WinPython instalāciju var piegādāt kā arhīvu vai USB disku, iepriekš instalējot visus vides mainīgos, pakotnes un skriptus, kas nepieciešami attiecīgajam darbam. Tas ir noderīgs veids, kā apkopot visu nepieciešamo, lai apmācītu konkrētu modeli vai reproducētu konkrētu datu eksperimentu. Vai arī jūs varat reģistrēt WinPython instalāciju sistēmā Windows un palaist to tā, it kā tā būtu sākotnēji instalēta (un vēlāk, ja vēlaties, to reģistrēt vēlāk).

Tiek aplūkoti arī daudzi uz mašīnmācīšanos vērsta Python izplatīšanas sarežģītākie elementi. Lielākā daļa galveno bibliotēku - NumPy, Pandas, Jupyter un saskarnes ar R un Julia valodām - pēc noklusējuma ir iekļautas un, ja nepieciešams, tiek veidotas pret Intel MKL paplašinājumiem. Mingw64 C / C ++ kompilators tiek komplektēts arī ar NumPy WinPython, lai bināros Python paplašinājumus varētu izveidot no avota (piemēram, izmantojot Cython), neinstalējot kompilatoru.

WinPython ir savs pakotņu instalētājs WPPM, kas apstrādā paketes, kas nāk ar iepriekš uzbūvētiem bināriem, kā arī tīras Python paketes. Un tiem, kas vēlas tikai WinPython tukšu versiju bez noklusējuma iekļautām pakotnēm, WinPython piedāvā “nulles versiju”, tāpat kā Anaconda Miniconda.

Saistītais video: mašīnmācība un AI atšifrēts

Pārvarot ažiotāžu ap mašīnmācīšanos un mākslīgo intelektu, mūsu panelis pārrunā tehnoloģijas definīcijas un sekas.

$config[zx-auto] not found$config[zx-overlay] not found