Nadzirano učenje u Apache Mahoutu

Nadzirano učenje je tehnika strojnog učenja u kojoj se funkcija zaključuje iz označenih primjera podataka o obuci.



Nadzirano učenje je metoda u kojoj podaci o obuci uključuju ulazne podatke i željene rezultate. Obuka sustava s primjerima naziva se nadgledano učenje. Inače, treniranje algoritma s učiteljem također se može tretirati kao učenje pod nadzorom. Nakon treninga algoritma sa svim uzorcima podataka ili označenih podataka, koji imaju i prediktore na ciljnoj varijabli, može se trenirati algoritam i koristiti nevidljivi primjer za daljnju klasifikaciju.



Evo nekoliko važnih značajki nadziranog učenja u Mahoutu:

  • Izgradnja pravilnog seta za obuku, validaciju i testiranje (Bok) je presudna.
  • Te su metode obično brze i točne.
  • Metode nadziranog učenja moraju biti u stanju generalizirati.
  • Daju točne rezultate kada se novi podaci daju u unosu bez znanja aprioricilj.
  • U nekim su slučajevima poznati točni rezultati (ciljevi) koji se daju kao ulaz u model tijekom procesa učenja.

Primjer nadziranog učenja

U slučaju da želite uvježbati misiju i daju vam se dvije različite skupine slika zajedno s označenim podacima, npr. na gornjoj slici jedna skupina ima slike slona, ​​a druga slike lava. Označeni podaci podrazumijevaju da svaki skup podataka ima ciljanu vrijednost. U gornjem primjeru, skup podataka su slike slona, ​​dok je oznaka koja mu je dana, tj. 'Slon' ciljna vrijednost skupa podataka. Takav označeni skup podataka koristi se za proces treninga, tako da se algoritam treninga može oslanjati na taj skup podataka i izgraditi neki model, koji se dalje može koristiti za klasifikaciju neviđenih primjera bez označenih podataka ili ciljne varijable.



Idemo identificirati značajke koje pomažu u identificiranju predmeta kao slona ili lava:

što je preopterećenje funkcije u c ++-u

Značajke može biti - veličina, boja, visina, veličina uha, trup, kljova

To se može nazvati skupom značajki, koje će se koristiti u svrhu treninga. Ovaj skup značajki utjecat će na konačnu ciljanu varijablu. Te su varijable poznate kao prediktorske varijable , jer nam pomažu u određivanju konačna ciljna varijabla . Konačna varijabla također se može nazvati oznakom. Konačna varijabla ovdje je Slon / Lav.



table-word

U ovom primjeru, svaki od zapisa u kategorijama, veličina, boja, visina, veličina uha, trup i kljova prediktivna je varijabla, dok su Slon i Lav ciljne varijable. Te se varijable mogu tretirati kao primjeri treninga, odnosno kao skupovi podataka o treningu.

Dakle, nadzirano učenje je način na koji trenirate zajedno s oznakama, pri čemu tražite da algoritam iz njega izvuče određene značajke, a na temelju toga, kad god vidite nevidljivi primjer, algoritam će ga moći klasificirati u pravu klasu.

Imate pitanje za nas? Spomenite ih u odjeljku za komentare i javit ćemo vam se.

postavljanje Java classpath u linux

Vezane objave: