Programmēšana

Pārskats: Google Cloud AutoML ir patiesi automatizēta mašīnmācīšanās

Kad jūs mēģināt automātiski apmācīt vislabāko mašīnmācīšanās modeli saviem datiem, pastāv AutoML vai automatizēta mašīnmācīšanās, un pēc tam ir Google Cloud AutoML. Google Cloud AutoML ir izgriezums iepriekš.

Iepriekš esmu pārskatījis H2O AI bez vadītāja, Amazon SageMaker un Azure Machine Learning AutoML. AI bez vadītāja automātiski veic funkciju inženieriju un hiperparametru regulēšanu un apgalvo, ka darbojas tāpat kā Kaggle meistari. Amazon SageMaker atbalsta hiperparametru optimizāciju. Azure Machine Learning AutoML automātiski pārraida funkcijas, algoritmus un hiperparametrus mašīnmācīšanās pamatalgoritmiem; atsevišķa Azure Machine Learning hiperparametru regulēšanas iespēja ļauj slaucīt konkrētus esošā eksperimenta hiperparametrus.

Tie ir labi, taču Google Cloud AutoML nonāk pilnīgi citā līmenī un jūsu atzīmētajiem datiem pielāgo Google kaujas pārbaudītos, augstas precizitātes dziļos neironu tīklus. Apmācot modeļus no jūsu datiem, Google Cloud AutoML tā vietā, lai sāktu no nulles, tiek veikta automātiska dziļās pārsūtīšanas mācīšanās (tas nozīmē, ka tā sākas no esoša dziļa neironu tīkla, kas apmācīts citiem datiem) un neironu arhitektūras meklēšana (tas nozīmē, ka tā atrod pareizo papildu tīkla slāņi) valodu pāru tulkošanai, dabisko valodu klasifikācijai un attēlu klasifikācijai.

Katrā apgabalā Google jau ir viens vai vairāki iepriekš apmācīti pakalpojumi, kuru pamatā ir dziļi neironu tīkli un milzīgi apzīmētu datu komplekti. Tie var noderēt nemodificētiem jūsu datiem, un jums tas jāpārbauda, ​​lai ietaupītu sev laiku un naudu. Ja šie pakalpojumi nedara to, kas jums nepieciešams, Google Cloud AutoML palīdz jums izveidot modeli, kas to dara, neprasot, lai jūs zināt, kā veikt pārsūtīšanas mācības vai pat to, kā izveidot neironu tīklus.

Mācīšanās ar nodošanu piedāvā divas lielas priekšrocības salīdzinājumā ar neironu tīkla apmācību no jauna. Pirmkārt, apmācībai tas prasa daudz mazāk datu, jo lielākā daļa tīkla slāņu jau ir labi apmācīti. Otrkārt, tas darbojas daudz ātrāk, jo tas tikai optimizē pēdējos slāņus.

Google mākoņa automātiskā tulkošana

Tā, piemēram, stundas vai divu laikā varat apmācīt pret 1000 divu valodu teikumu pāriem, izmantojot Google Cloud AutoML Translation pārsūtīšanas mācības. Pielāgotais pamata neironu tīkls NMT prasīja simtiem līdz tūkstošiem stundu, lai trenētos no nulles katram valodu pārim, izmantojot lielu skaitu procesoru un GPU. Ņemiet vērā, ka stundas maksa par pielāgota tulkošanas modeļa apmācību pašlaik ir 76 USD.

AutoML tulkošanas rokasgrāmata iesācējiem izskaidro pamatus, ko Google Cloud AutoML tulkošana var darīt, un kāpēc jūs to izmantosit. Būtībā tā precizē esošu vispārēju tulkošanas modeli nišas vajadzībām. Jums nav jāveic nekāda apmācība vispārīgi aptuveni simts valodu tulkošana, kuras Google jau atbalsta, taču, ja vēlaties izveidot tulkošanas tīklu vietnei specializējies vārdu krājums vai lietojums. Viens no piemēriem, ko Google min, ir laika ziņā nozīmīgu finanšu dokumentu tulkošana reāllaikā. Vispārējas nozīmes tulkošanā finansēm ne vienmēr tiks izmantoti pareizi mākslas noteikumi.

Apmācības iestatīšana Google Cloud AutoML tulkošanai ir piecu darbību process, kā parādīts zemāk esošajos ekrānuzņēmumos, kad esat sagatavojis failu ar teikumu pāriem. Es izmantoju 8720 angļu-spāņu pārus lietotņu uzvednēm, kuras Google sniedza automātiskajā tulkošanas sākumlapā, kas formatēta kā tabulās atdalītu vērtību fails. Google Cloud AutoML tulkošana atbalsta arī XML bāzētu tulkošanas atmiņas eXchange (TMX) formātu teikumu pāriem.

Jūs ņemsiet vērā, ka nav iespējas kontrolēt aparatūru (CPU, GPU, TPU un atmiņu), ko izmanto apmācības veikšanai. Tas ir apzināti: apmācībā tiks izmantots nepieciešamais. Nav arī iespēju kontrolēt modelim pievienotos neironu tīkla slāņus, palaisto laikmetu skaitu vai apstāšanās kritērijus.

Kad modeļa apmācība ir pabeigta, jūs varat apskatīt uzlabojumu (ja viss norit labi) BLEU rādītājā salīdzinājumā ar bāzes modeli un mēģināt veikt prognozes ar modeli. Šī apmācība ilga 0,9 stundas (mazāk nekā prognozēts) un maksāja 68,34 USD.

Google Cloud AutoML dabiskā valoda

Google dabiskās valodas API ņem tekstu un paredz entītijas, noskaņojumu, sintaksi un kategorijas (no iepriekš definēta saraksta). Ja teksta klasifikācijas problēma neatbilst nevienai no tām, varat piegādāt apzīmētu paziņojumu kopu un izmantot Google Cloud AutoML dabisko valodu, lai izveidotu pielāgotu klasifikatoru.

Lai apmācībai iestatītu AutoML dabisko valodu, jums jāiegūst dati, jāiezīmē tie, jāsagatavo kā CSV fails un jāveic apmācība. Varat arī izmantot AutoML dabiskās valodas lietotāja saskarni, lai augšupielādētu un iezīmētu datus, ja vēlaties.

Kad modeļa apmācība ir pabeigta, jūs varat apskatīt modeļa precizitāti, atsaukšanu un sajaukšanas matricu. Jūs varat arī pielāgot punktu slieksni vēlamajai precizitātes / atsaukšanas kompromisam. Lai samazinātu viltus negatīvus parametrus, optimizējiet tos atsaukšanai. Lai samazinātu viltus pozitīvo rezultātu, optimizējiet precizitāti.

Šī apmācība ilga 3,63 stundas (apmēram kā tika paredzēts) un izmaksāja 10,88 USD.

Google Cloud AutoML Vision

Google Cloud Vision API klasificē attēlus tūkstošos iepriekš noteiktu kategoriju, attēlos nosaka atsevišķus objektus un sejas, kā arī atrod un lasa attēlos ietvertos drukātos vārdus. Google Cloud AutoML Vision ļauj definēt un apmācīt savu kategoriju sarakstu. Dažas reālās dzīves programmas ietver vēja turbīnu bojājumu noteikšanu no bezpilota lidaparātu fotoattēliem un atkritumu apsaimniekošanai paredzēto otrreizējo izejvielu klasificēšanu.

Lai iestatītu Google Cloud AutoML Vision datu kopu, katrai kategorijai jāiegūst vismaz 100 attēli un jāiezīmē tie CSV failā. Visiem attēliem un CSV failam jāatrodas Google mākoņa krātuves spainī.

Es iestatīju šo apmācību, lai tā darbotos maksimāli stundu, kas ir bezmaksas līdz 10 modeļiem mēnesī. Es biju patīkami pārsteigts, redzot labus bezmaksas apmācības rezultātus, un neuztraucos turpināt apmācību, lai uzlabotu precizitāti un atsaukšanu.

Google Cloud AutoML nodrošina ērtas iespējas veikt mērķtiecīgus tulkojumus, pielāgotu teksta klasifikāciju un pielāgotu attēlu klasifikāciju. Katra no šīm API darbojas labi, ja jūs tai piešķirat pietiekami precīzi iezīmētus datus, un tas prasa daudz mazāk laika un prasmju nekā sava neironu tīkla modeļa vai pat sava pārsūtīšanas mācību modeļa veidošana. Izmantojot Google Cloud AutoML, jūs faktiski veidojat TensorFlow modeļus, nezinot neko par TensorFlow, Python, neironu tīkla arhitektūru vai apmācības aparatūru.

Ir daudz veidu, kā nepareizi sagatavot datus, taču par laimi visas trīs API pārbauda visbiežāk sastopamās kļūdas, piemēram, ir pārāk maz vai pārāk daudz piemēru jebkurai kategorijai. Pēc apmācības parādītā diagnostika sniedz labu priekšstatu par jūsu modeļa darbību, un jūs varat viegli pielāgot modeļus, pievienojot vairāk marķētu apmācības datu un atkārtoti izpildot apmācību.

Izmaksas: Google Cloud AutoML tulkošana: apmācība maksā 76,00 USD stundā, tulkošana 80 USD par miljonu rakstzīmju pēc pirmajiem 500 000. Google Cloud AutoML dabiskā valoda: apmācība maksā 3,00 USD stundā, klasifikācija 5 USD par tūkstoti teksta ierakstu pēc pirmajiem 30 000. Google Cloud AutoML Vision: apmācība pēc pirmās stundas maksā 20 USD stundā, klasifikācija 3 USD par tūkstoš attēliem pēc pirmā tūkstoš.

Platforma: Google Cloud Platform

$config[zx-auto] not found$config[zx-overlay] not found