Programmēšana

Pārskats: Google Cloud AI izgaismo mašīnmācīšanos

Google ir viens no lielākajiem mašīnmācīšanās skursteņiem nozarē, kas pašlaik koncentrējas uz savu Google Cloud AI un Machine Learning Platform. Google pirms vairākiem gadiem izvērsa TensorFlow kā atvērto pirmkoda versiju, taču TensorFlow joprojām ir visbriedīgākā un visplašāk minētā dziļās mācīšanās sistēma. Līdzīgi kā Google pirms gadiem izgrieza Kubernetes kā atvērto avotu, taču tā joprojām ir dominējošā konteineru pārvaldības sistēma.

Google ir viens no galvenajiem rīku un infrastruktūras avotiem izstrādātājiem, datu zinātniekiem un mašīnmācīšanās ekspertiem, taču vēsturiski Google AI nav bijis tik pievilcīgs biznesa analītiķiem, kuriem trūkst nopietnas datu zinātnes vai programmēšanas fona. Tas sāk mainīties.

Google Cloud AI un mašīnmācīšanās platforma ietver AI veidošanas blokus, AI platformu un akseleratorus, kā arī AI risinājumus. AI risinājumi ir diezgan jauni un paredzēti biznesa vadītājiem, nevis datu zinātniekiem. Tie var ietvert konsultācijas no Google vai tā partneriem.

AI celtniecības blokus, kas ir iepriekš apmācīti, bet pielāgojami, var izmantot bez intīmām zināšanām par programmēšanu vai datu zinātni. Neskatoties uz to, kvalificēti datu zinātnieki tos bieži izmanto pragmatisku iemeslu dēļ, galvenokārt, lai paveiktu darbu bez plašas modeļu apmācības.

AI platforma un akseleratori parasti ir domāti nopietniem datu zinātniekiem, un tiem nepieciešama kodēšanas prasme, zināšanas par datu sagatavošanas paņēmieniem un daudz apmācības laika. Es iesaku tur doties tikai pēc tam, kad esat izmēģinājis attiecīgos celtniecības elementus.

Google Cloud AI piedāvājumos joprojām ir dažas trūkstošās saites, īpaši datu sagatavošanā. Tuvākais, kas Google Cloud ir datu importēšanas un kondicionēšanas pakalpojumam, ir Trifacta trešās puses Cloud Dataprep; Es to izmēģināju pirms gada un biju nepietiekams. Mākoņa AutoML tabulās iebūvētā funkciju inženierija tomēr ir daudzsološa, un būtu lietderīgi, ja šāda veida pakalpojums būtu pieejams citiem scenārijiem.

AI plūstošā apakšpuse ir saistīta ar ētiku un atbildību (vai tās trūkumu), kā arī noturīgām modeļa aizspriedumiem (bieži vien apmācībā izmantoto neobjektīvo datu dēļ). Google 2018. gadā publicēja savus AI principus. Tas ir darbs, kas tiek turpināts, taču tas ir pamats vadlīnijām, kas apspriests nesenajā emuāra ziņā par atbildīgu AI.

AI tirgū ir liela konkurence (vairāk nekā ducis pārdevēju) un liela konkurence publiskajā mākoņu tirgū (vairāk nekā pusducis uzticamu pārdevēju). Lai salīdzinājumi būtu taisnīgi, man būtu jāraksta raksts vismaz piecas reizes ilgāk nekā šis, tāpēc, lai arī kā es ienīstu tos atstāt, man būs jāizlaiž lielākā daļa produktu salīdzinājumu. Vislabāk redzamajam salīdzinājumam es varu apkopot: AWS dara lielāko daļu no tā, ko dara Google, un tas ir arī ļoti labs, taču parasti prasa augstākas cenas.

Google Cloud AI celtniecības bloki

Google Cloud AI celtniecības bloki ir ērti lietojami komponenti, kurus varat iekļaut savās lietojumprogrammās, lai pievienotu redzes, valodas, sarunu un strukturētus datus. Daudzi no AI veidojošajiem blokiem ir iepriekš apmācīti neironu tīkli, taču tos var pielāgot ar pārsūtīšanas mācībām un neironu tīkla meklēšanu, ja tie no jūsu izvēles neapkalpo jūsu vajadzības. AutoML tabulas ir nedaudz atšķirīgas, jo tās automatizē procesu, kuru datu zinātnieks izmantotu, lai tabulu datu kopai atrastu labāko mašīnmācīšanās modeli.

AutoML

Google Cloud AutoML pakalpojumi nodrošina pielāgotus dziļo neironu tīklus valodu pāru tulkošanai, teksta klasifikācijai, objektu noteikšanai, attēlu klasifikācijai un video objektu klasifikācijai un izsekošanai. Apmācībai viņiem ir nepieciešami marķēti dati, taču tiem nav nepieciešamas nozīmīgas zināšanas par dziļu mācīšanos, mācīšanās nodošanu vai programmēšanu.

Google Cloud AutoML jūsu marķētajiem datiem pielāgo Google pārbaudītos, augstas precizitātes dziļo neironu tīklus. Apmācot modeļus no jūsu datiem, AutoML nevis sāk no jauna, bet gan automātiski apgūst dziļu pārsūtīšanu (tas nozīmē, ka tas sākas no esoša dziļa neironu tīkla, kas apmācīts pēc citiem datiem) un neironu arhitektūras meklēšanas (tas nozīmē, ka tas atrod pareizo papildu tīkla slāņu kombināciju). ) valodu pāru tulkošanai un citiem iepriekš uzskaitītajiem pakalpojumiem.

Katrā apgabalā Google jau ir viens vai vairāki iepriekš apmācīti pakalpojumi, kuru pamatā ir dziļi neironu tīkli un milzīgi apzīmētu datu komplekti. Tie var noderēt nemodificētiem jūsu datiem, un jums tas jāpārbauda, ​​lai ietaupītu sev laiku un naudu. Ja viņi nedara to, kas jums nepieciešams, Google Cloud AutoML palīdz jums izveidot modeli, kas to dara, neprasot, lai jūs zinātu, kā veikt pārsūtīšanas mācības vai kā veidot neironu tīklus.

Mācīšanās ar nodošanu piedāvā divas lielas priekšrocības salīdzinājumā ar neironu tīkla apmācību no jauna. Pirmkārt, apmācībai tas prasa daudz mazāk datu, jo lielākā daļa tīkla slāņu jau ir labi apmācīti. Otrkārt, tas trenējas daudz ātrāk, jo tas tikai optimizē pēdējos slāņus.

Kaut arī Google Cloud AutoML pakalpojumi agrāk tika parādīti kopā kā pakete, tie tagad ir uzskaitīti ar pamata iepriekš apmācītiem pakalpojumiem. To, ko vairums citu uzņēmumu sauc par AutoML, veic Google Cloud AutoML Tables.

Izlasiet pilnu Google Cloud AutoML pārskatu

AutoML tabulas

Parastais datu zinātnes process daudzu regresijas un klasifikācijas problēmu gadījumā ir izveidot datu tabulu apmācībai, tīrīt un sagatavot datus, veikt funkciju inženieriju un mēģināt apmācīt visus atbilstošos modeļus pārveidotajā tabulā, ieskaitot soli, lai optimizētu labāko modeļu hiperparametri. Google Cloud AutoML tabulas var visu šo procesu veikt automātiski, tiklīdz jūs manuāli identificējat mērķa lauku.

Automātiskās tabulas Google modeļu zooloģiskajā dārzā automātiski meklē strukturētus datus, lai atrastu vislabāko modeli jūsu vajadzībām, sākot no lineāras / loģistiskas regresijas modeļiem vienkāršākām datu kopām līdz pat uzlabotām dziļās, ansambļa un arhitektūras meklēšanas metodēm lielākām, sarežģītākām. Tas automatizē funkciju inženieriju plašā tabulas datu primitīvu klāstā, piemēram, skaitļos, klasēs, virknēs, laika zīmogos un sarakstos, un palīdz atklāt un rūpēties par trūkstošajām vērtībām, izņēmumiem un citām izplatītām datu problēmām.

Tā bezkoda saskarne palīdz jums veikt pilnu mašīnmācīšanās dzīves ciklu, tādējādi ikvienam no jūsu komandas ir viegli veidot modeļus un droši tos iekļaut plašākās lietojumprogrammās. AutoML Tables nodrošina plašu ievades datu un modeļa uzvedības izskaidrojamības funkcijas, kā arī aizsargjoslas, lai novērstu izplatītākās kļūdas. AutoML tabulas ir pieejamas arī API un piezīmjdatoru vidēs.

AutoML tabulas konkurē ar AI bez vadītāja un vairākām citām AutoML ieviešanām un ietvariem.

Vision API

Google Cloud Vision API ir iepriekš apmācīts mašīnmācīšanās pakalpojums attēlu kategorizēšanai un dažādu funkciju iegūšanai. Tas var klasificēt attēlus tūkstošiem iepriekš apmācītu kategoriju, sākot no vispārīgiem objektiem un attēlā atrodamiem dzīvniekiem (piemēram, kaķa), līdz vispārējiem apstākļiem (piemēram, krēslas stundām), līdz noteiktiem orientieriem (Eifeļa tornis, Lielais kanjons), un identificē attēla vispārīgās īpašības, piemēram, tā dominējošās krāsas. Tas var izolēt apgabalus, kas ir sejas, pēc tam piemērot sejām ģeometrisko (sejas orientācija un orientieri) un emocionālo analīzi, lai gan tas neatzīst sejas kā piederīgas konkrētiem cilvēkiem, izņemot slavenības (kam nepieciešama īpaša lietošanas licence). Vision API izmanto OCR, lai attēlos atrastu tekstu vairāk nekā 50 valodās un dažādos failu tipos. Tas var arī identificēt produktu logotipus un atklāt pieaugušajiem paredzētu, vardarbīgu un medicīnisku saturu.

Izlasiet pilnu pārskatu par Google Cloud Machine Learning API

Video Intelligence API

Google Cloud Video Intelligence API automātiski atpazīst vairāk nekā 20 000 objektus, vietas un darbības saglabātajā un straumētajā video. Tas arī izšķir ainas izmaiņas un iegūst bagātīgus metadatus video, kadra vai kadra līmenī. Tas papildus veic teksta noteikšanu un ekstrakciju, izmantojot OCR, nosaka nepārprotamu saturu, automatizē slēgto parakstu un subtitrus, atpazīst logotipus un nosaka sejas, personas un pozas.

Google iesaka Video Intelligence API metadatu ieguvei, lai indeksētu, kārtotu un meklētu jūsu video saturu. Tas var transkribēt videoklipus un ģenerēt slēgtus parakstus, kā arī atzīmēt un filtrēt nepiemērotu saturu - tas viss ir izdevīgāk nekā cilvēku transkripcijas. Izmantošanas gadījumi ietver satura moderēšanu, satura ieteikumus, multivides arhīvus un kontekstuālās reklāmas.

Dabiskās valodas API

Dabiskās valodas apstrāde (NLP) ir liela daļa no “slepenās mērces”, kas labi palīdz ievadīt Google meklēšanu un Google asistentu. Google Cloud Natural Language API piedāvā to pašu tehnoloģiju jūsu programmām. Tas var veikt sintakses analīzi (skatīt attēlu zemāk), entītijas iegūšanu, noskaņojuma analīzi un satura klasifikāciju 10 valodās. Jūs varat norādīt valodu, ja to zināt; pretējā gadījumā API mēģinās automātiski noteikt valodu. Atsevišķa API, kas pašlaik ir pieejama agrīnai piekļuvei pēc pieprasījuma, specializējas ar veselības aprūpi saistītā saturā.

Izlasiet pilnu pārskatu par Google Cloud Machine Learning API

Tulkojums

Google mākoņa tulkošanas API var tulkot vairāk nekā simts valodu pārus, var automātiski noteikt avota valodu, ja to nenorādat, un tai ir trīs garšas: pamata, papildu un multivides tulkošana. Papildu tulkošanas API atbalsta glosāriju, sērijveida tulkošanu un pielāgotu modeļu izmantošanu. Pamata tulkošanas API būtībā ir tas, ko izmanto patērētāja Google Translate saskarne. AutoML tulkošana ļauj apmācīt pielāgotus modeļus, izmantojot pārsūtīšanas mācīšanos.

Media Translation API tulko saturu tieši no audio (runas), vai nu audio failiem, vai straumēm, 12 valodās un automātiski ģenerē pieturzīmes. Video un tālruņa zvanu audio ir atsevišķi modeļi.

Izlasiet pilnu pārskatu par Google Cloud Machine Learning API

$config[zx-auto] not found$config[zx-overlay] not found