FormacijaSrednje obrazovanje i škole

Metode najbližeg susjeda: primjer rada

najbližeg metoda susjeda je najlakši metričkih klasifikator koji se temelji na procjeni sličnosti različitih objekata.

Analizirani objekt pripada klasi kojoj pripadaju subjekti uzorka treninga. Dozvolite nam da saznamo koja je najbliža susjeda. Pokušajte da shvate komplikovane stvari, primjere različitih tehnika.

metoda hipoteza

metode najbližeg susjeda može se smatrati kao najčešći algoritam koji se koristi za klasifikaciju. Objekt prolazi klasifikaciji pripada klasi y_i, na koju se najbližeg objekta učenja x_i uzorka.

Specifičnost metode najbližeg susjeda

k metode najbližeg susjeda može poboljšati točnost klasifikacije. Analizirani objekt pripada istoj klasi kao i većinu svojih susjeda, to jest, k blizu toga objekata analiziranih uzoraka x_i. U rješavanju problema sa dvije klase broj susjeda će biti čudno bi se izbjegla situacija dvosmislenosti, ako je isti broj susjeda će pripadaju različitim klasama.

Tehniku suspendovanih susjeda

metoda PostgreSQL-analizirani tsvector najbližih susjeda se koristi kada je broj časova najmanje tri, a ne možete koristiti neparan broj. Ali dvosmislenost nastaje čak iu ovim slučajevima. Zatim, i-ti susjeda dobiva w_i težine, što smanjuje sa susjedom čin i. To se odnosi na klasu objekta, koji će imati maksimalnu ukupnu težinu između bliskih susjeda.

Hipoteza kompaktnost

U središtu svega navedenog metoda je hipoteza kompaktnosti. To ukazuje na vezu između mjera sličnosti objekata i njihovih pripadaju istoj klasi. U ovoj situaciji, granica između različitih tipova je jednostavan oblik, i stvoriti klase objekata u prostoru kompaktnom mobilnom području. Pod takvim područjima u matematičke analize odveden znači zatvoren ograničene set. Ova hipoteza se ne odnosi na svakodnevne percepcije te riječi.

Osnovna formula

Razmotrimo još najbližeg susjeda. Ako je predloženo obuku za tip uzorka "objekat-odgovor» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; ako je pluralitet objekata za definiranje udaljenosti funkciju \ rho (x, x '), koji je predstavljen u obliku adekvatan model sličnost objekata povećanjem vrijednost funkcije smanjuje sličnost između objekata x, x'.

Za svaki predmet, u će izgraditi uzorak trening objekte x_i sa sve većim udaljenostima to u:

\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}),

gdje x_ {i; u} karakterizira uzorak učenja objekta, što je i-ti susjed izvornog objekta u. Takav zapis i korištenje odgovoriti na i-ti susjed: y_ {i; u}. Kao rezultat toga, vidimo da je bilo koji predmet u provocira pregrupisavanje vlastitu uzorka.

Određivanje broja k susjeda

metode najbližeg susjeda kada je k = 1 je u stanju da daju pogrešne klasifikacije, ne samo na objektima-emisija, već i za druge klase koje se nalaze u blizini.

Ako uzmemo k = m, algoritam će biti stabilna i da će prerastanje u konstantnu vrijednost. To je razlog zašto pouzdanost je važno izbjeći ekstremno indeksa k.

U praksi, kao optimalna k Indeks koristi kriterij klizna kontrola.

projekcije emisija

Predmet studije su uglavnom nejednake, ali među njima ima i onih koji imaju osobine klase i se nazivaju standardima. Na blizinu predmet idealan model svog velika vjerovatnoća da pripadaju ovoj klasi.

Kako rezultativen metod najbližeg susjeda? Kao primjer se može vidjeti na temelju periferne i ne-informativne kategorije objekata. Pretpostavlja se gusta okoliš objekta drugih predstavnika ove klase. Kada ih izvadite iz klasifikacije uzorkovanja kvaliteta neće trpjeti.

Dobiti u određeni broj uzoraka može rafala buke koje su "na terenu" klase. Uklanjanje značajno pozitivan utjecaj na kvalitetu klasifikacije.

Ako je uzorak uzet iz neinformative i eliminirati objekte buke, možete računati na nekoliko pozitivnih rezultata u isto vrijeme.

Prva metoda interpolacije od najbližeg susjeda klasifikacija omogućava da se poboljša kvalitet, smanjite količinu pohranjenih podataka, smanjiti vrijeme klasifikacije, koji se troši na izbor sljedeće standarde.

Korištenje ultra-velikim uzorcima

metode najbližeg susjeda se temelji na stvarnom skladištenje objekata učenja. Da se stvori vrlo uzorci velikih razmjera koristeći tehnički problem. Cilj nije samo da spasi značajnu količinu informacija, ali i u minimalnom iznosu od vremena do vremena da pronaći bilo koji objekat u k među najbliži susjedi.

Da se nosi sa ovog zadatka, dvije metode se koriste:

  • razrijeđenog uzorka preko pražnjenja bez podataka predmeta;
  • efikasno korištenje posebne strukture podataka i kodova za trenutno pretraživanje najbližeg susjeda.

Pravila metoda izbora

Gornja klasifikacija je uzeti u obzir. Metode najbližeg suseda se koristi u rješavanju praktičnih problema, koji je poznat unaprijed daljini funkcija \ rho (x, x '). U opisivanju objektima numerički vektora koristiti Euklidovom metričke. Ovaj izbor nema posebnu opravdanje, ali uključuje mjerenje svih znakova "u istom nivou." Ako se taj faktor ne uzima u obzir, onda metrički će dominiraju karakteristika koje imaju najveći numeričke vrijednosti.

Ako postoji velika količina funkcija, izračunavanje udaljenosti kao suma odstupanja na specifične simptome pojaviti ozbiljan problem dimenziju.

U srednjoj dimenzionalni prostor udaljeni jedni od drugih sa svim objektima. Na kraju krajeva, svaki uzorak će biti pored objekta koji se proučava k susjedima. odabran mali broj informativnih funkcija eliminirati ovaj problem. Algoritmi za izračunavanje procjena graditi na osnovu različitih skupova znakova, a za svaku pojedinačnu izgradnju njihove blizine funkciju.

zaključak

Matematički proračuni često uključuju korištenje različitih tehnika koje imaju svoje prepoznatljive karakteristike, prednosti i mane. Gledano metode najbližeg susjeda može riješiti vrlo ozbiljan problem, zbog karakteristika matematičkih objekata. Eksperimentalni koncept, na osnovu analiziranih metoda se aktivno koristi u umjetne inteligencije.

U ekspertnih sistema potrebno je ne samo za klasifikaciju objekata, ali i pokazati korisnik objašnjenje klasifikacije u pitanju. U ovoj metodi, objašnjenje ove pojave su izražene u odnosu na predmet određene klase, kao i njegova lokacija u odnosu na uzorak se koristi. specijalista pravne industrije, geolozi, ljekari, uzmi ovo "presedan" logika aktivno ga koriste u svojim istraživanjima.

Kako bi se analizirati metodom bio najpouzdaniji, efikasno, dajući željene rezultate, morate uzeti minimum figura k, a istovremeno izbjeći emisija među analiziranim objektima. Zato je upotreba standarda i metoda izbora, kao i optimizaciju metrike.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 bs.atomiyme.com. Theme powered by WordPress.