Programmēšana

Oracle atvērtā pirmkoda Java mašīnmācīšanās bibliotēka

Lai apmierinātu uzņēmuma vajadzības mašīnmācīšanās telpā, Oracle savu Tribuo Java mašīnmācīšanās bibliotēku padara pieejamu bez maksas ar atvērtā pirmkoda licenci.

Izmantojot Tribuo, Oracle mērķis ir atvieglot mašīnmācīšanās modeļu izveidošanu un izvietošanu Java, līdzīgi tam, kas jau ir noticis ar Python. Tribuo, kas izlaists ar Apache 2.0 licenci un ko izstrādājis Oracle Labs, ir pieejams no GitHub un Maven Central.

Tribuo nodrošina mašīnmācīšanās standarta funkcionalitāti, ieskaitot klasifikācijas, kopu veidošanas, anomāliju noteikšanas un regresijas algoritmus. Tribuo ietver arī cauruļvadus datu ielādēšanai un pārveidošanai, kā arī nodrošina atbalstītu prognozēšanas uzdevumu novērtējumu kopu. Tā kā Tribuo apkopo statistiku par izejvielām, Tribuo var aprakstīt, piemēram, katras ievades diapazonu. Tas arī nosauc funkcijas, iezīmju ID un izvades ID pārvaldīšanu zem pārsega, lai izvairītos no ID konfliktiem un neskaidrībām, ķēdes ķēdēs, ielādējot datus un attēlojot ievades.

Tribuo modelis zina, kad pirmo reizi redz kādu funkciju, kas ir īpaši noderīga, strādājot ar dabiskās valodas apstrādi. Modeļi zina, kas ir rezultāti, ar izejām tiek stingri ierakstīts. Izstrādātājiem nav jābrīnās, vai pludiņš ir varbūtība, regresēta vērtība vai klastera ID. Izmantojot Tribuo, katrs no tiem ir atsevišķs veids; modelis var aprakstīt veidus un diapazonus, par kuriem tas zina. Stingri ievadītu izeju un rezultātu izmantošana nozīmē, ka Tribuo var izsekot modeļa konstruēšanas procesam, sākot no punkta datiem, kas tiek ielādēti, izmantojot vilciena / testa sadalījumus vai datu kopas pārveidojumus, līdz modeļa apmācībai un novērtēšanai. Šie izsekošanas dati tiek iekļauti visos modeļos un novērtējumos.

Tribuo sākotnējā sistēma var ģenerēt konfigurāciju, kas atjauno mācību cauruļvadu, lai reproducētu modeli vai novērtējumu. Pārveidoto modeli var veidot arī uz jauniem datiem vai hiperparametriem. Tādējādi lietotāji vienmēr zina, kas ir Tribuo modelis, no kurienes tas radies un kā to izveidot.

Oracle uzskata, ka Tribuo aizpilda plaisu tirgū mašīnmācībai uzņēmuma lietojumprogrammām. Piemēram, lai gan Google izveidotā TensorFlow bibliotēka nodrošina pamatalgoritmus padziļinātai apmācībai, Tribuo nodrošina vairākus mašīnmācīšanās algoritmus, no kuriem daži ir TensorFlow un daži no tiem nav, vienlaikus nodrošinot arī saskarni TensorFlow, sacīja Oracle Adam Pocock, galvenais Oracle Labs tehniskā personāla loceklis. Tā kā Apache Spark analītiskais dzinējs ir paredzēts lielām, izplatītām sistēmām, Tribuo ir paredzēts mazākiem aprēķiniem, kas var ievietot vienā mašīnā, sacīja Pocock.

Papildus TensorFlow Tribuo nodrošina saskarnes XGBoost un ONNX runtime, ļaujot modeļus, kas saglabāti ONNX formātā vai apmācīti TensorFlow un XGBoost, izvietot līdzās vietējiem Tribuo modeļiem. Atbalsts ONNX modeļa formātam ļauj Java izvietot modeļus, kas apmācīti, izmantojot populāras Python bibliotēkas, piemēram, PyTorch.

Tribuo darbojas ar Java 8 vai jaunāku versiju. Oracle pieņem koda ieguldījumus Tribuo saskaņā ar Oracle Contributor līgumu. Tribuo jau ir izmantots iekšēji Oracle Fusion Cloud ERP produktā, piemēram, viedai dokumentu atpazīšanai.

$config[zx-auto] not found$config[zx-overlay] not found