Klasifikavimo algoritmas

Straipsnis iš Enciklopedijos Lietuvai ir Pasauliui (ELIP).

~ Klasifikavimo (arba mašininio mokymosi) algoritmas – algoritmas, automatiškai suskirstantis pradinę objektų aibę į dvi ar daugiau grupių, kuomet atrankos kriterijai nėra trivialūs.

Klasifikuodamas algoritmas remiasi galimomis nustatyti objektų savybėmis (angl. attributes). Kiekviena savybė turi vardą ir tipą. Savybės gali būti tolydžios (pvz., ilgis) arba diskrečios (pvz., metai). Diskrečios savybės gali būti rūšiuojamos (pvz., sėklų skaičius ankštyje) arba neturinčios akivaizdžios rūšiavimo sekos (pvz., žmogaus profesija).

Klasifikavimo algoritmui pateikiamas savybių sąrašas, jau (paprastai žmogaus) suklasifikuota „apmokymo aibe“ (angl. training set) bei vienas ar keli objektai, kurių grupė iš anksto nežinoma ir ją reikia nustatyti šiuo algoritmu. Algoritmo kokybė tikrinama jo darbe nenaudojama žinomai suklasifikuota tikrinimo aibe (angl. testing set).

Klasifikavimo algoritmai plačiai naudojami bioinformatikoje (baltymų ir DNR sekoms klasifikuoti), elektroninio pašto sistemose (žinutėms rūšiuoti ir šlamštui filtruoti) ir kitose srityse. Paprastai iš anksto neaišku, kuris iš daugybės žinomų algoritmų geriausiai dirbs konkrečiu atveju, todėl jie bandomi naudojant kurią nors klasifikavimo algoritmų biblioteką.

Nuorodos


Sudarytojai, rašytojai ir redaktoriai

Kitur naudojant ar cituojant šį straipsnį, būtina nurodyti jo sumanytojus, sudarytojus, rašytojus ir redaktorius.
  • Vitas Povilaitis – autorius – 100% (+1755-0=1755 wiki spaudos ženklai).