Programmēšana

Watson wannabes: 4 atvērtā pirmkoda projekti mašīnu izlūkošanai

Pēdējā gada laikā kā daļa no jaunajiem uzņēmuma pakalpojumiem, kurus IBM ir centies ieviest, Watson ir kļuvis mazāk par "Jeopardy" uzvarošo triku un vairāk par rīku. Tas arī paliek IBM patentētais radījums.

Kādas tad ir izredzes izveidot dabiskas valodas mašīnmācīšanās sistēmu pēc Vatsona pasūtījuma, kaut arī ar atvērtā koda komponentiem? Zināmā mērā tas jau ir noticis - daļēji tāpēc, ka pats Vatsons tika uzbūvēts esošā atvērtā pirmkoda darba augšgalā, un citi paralēli Vatsonam ir izstrādājuši līdzīgas sistēmas. Piedāvājam ieskatu četros šādos projektos.

DARPA DeepDive

Grupas lielākais nosaukuma zīmols, DARPA DeepDive projekts nav paredzēts, lai atdarinātu Watson vienkāršās valodas vaicājumu sistēmu, bet gan Watson spēja laika gaitā uzlabot savu lēmumu pieņemšanu ar cilvēka vadību.

Projektu galvenokārt izstrādā Viskonsinas universitātes profesors Kristofers Re, un tas ir atvērtā koda (Apache 2.0). Kā raksta EE Times, DeepDive galvenais mērķis ir izveidot automatizētu sistēmu nestrukturētu datu klasificēšanai - vienā piemērā kategoriju kategorizēšana tehniskajos žurnālos. Tiem, kas plāno izmantot DeepDive, būtu jāpārzina SQL un Python, taču sistēma jau spēj iegūt datus no visdažādākajiem parastajiem avotiem, piemēram, Web lapām vai PDF dokumentiem.

Apache UIMA

Nestrukturēta informācijas pārvaldība (UIMA) ir standarts teksta satura analīzes veikšanai. Vatsons izmantoja UIMA ieviešanu, taču, lai izmantotu UIMA, jums nav jāiet cauri Vatsonam. Patiesībā IBM UIMA arhitektūra bija atvērta, un to uztur Apache Foundation. Tajā ir atbalsts vairākām programmēšanas valodām, un atjauninājumi tiek periodiski pievienoti (pēdējoreiz 2014. gada oktobrī).

Apache UIMA pašreizējā stāvoklī ir tāls ceļš no pilnīga mašīnmācīšanās risinājuma; tā ir tikai viena - kaut arī svarīga - daļa no visa IBM radītā kopuma. Ja jūs nevēlaties izmantot kailos kaulus, varat uzņemt vienu no tā atvasinātajiem projektiem, piemēram, YodaQA, kas izmanto UIMA apstrādei un kā primāro datu avotu izmanto Wikipedia.

OpenCog

OpenCog "mērķis ir nodrošināt pētniekiem un programmatūras izstrādātājiem kopēju platformu mākslīgā intelekta programmu izveidošanai un koplietošanai". Atklāts ar GNU Affero licenci, projekta mērķis ir veicināt ne mazāk kā to, ko tā veidotāji dēvē par "vispārēji inteliģentām" sistēmām, mākslīgo intelektu, kuram ir plaša, cilvēciska izpratne par pasauli, nevis uz domēnu orientētas specialitātes (piemēram, tas, ka tas ir ļoti labi šahs, bet nekas cits).

OpenCog veidotāji apgalvo, ka viņu sistēma jau tiek izmantota "dabiskās valodas lietojumprogrammās gan pētniecībai, gan komerckorporācijām". Tas padara to nedaudz tālāk no AI-pie-debesīs koncepcijas un tuvāk praktiskajam Q & A domēnam, kurā dzīvo Watson.

OAQA (Atbildes uz jautājumu atbildēšanas sistēmām)

Kā varētu liecināt nosaukums, OAQA misija ir "atklāta virzība uz jautājumu atbildēšanas sistēmu projektēšanu - valodas programmatūras sistēmas, kas sniedz tiešas atbildes uz dabiskajā valodā uzdotajiem jautājumiem". Izklausās pēc viena no Vatsona mērķiem? Jā, jo īpaši tāpēc, ka OAQA kopīgi ierosināja IBM un Karnegija Melona universitāte. Tāpat kā Apache UIMA, arī OAQA ievieš UIMA sistēmu, taču nedomājiet par to kā lietošanai gatavu risinājumu; tas ir rīku komplekts.

Viens no galvenajiem trūkumiem katrā projektā, kā jūs varat uzminēt, ir tas, ka tie netiek piedāvāti gandrīz tikpat rafinētā vai pulētā iepakojumā kā Watson. Kaut arī Watson ir paredzēts lietošanai tūlītēji uzņēmējdarbības kontekstā, tie ir neapstrādāti rīku komplekti, kuriem nepieciešama smaga pacelšana.

Turklāt Vatsona pakalpojumi jau ir iepriekš apmācīti, izmantojot reālpasaules datu kuratoru. Izmantojot šīs sistēmas, jums būs jāpiegādā datu avoti, kas var izrādīties daudz lielāks projekts nekā pati programmēšana.

$config[zx-auto] not found$config[zx-overlay] not found