分類(lèi)(有監(jiān)督學(xué)習(xí))和聚類(lèi)(無(wú)監(jiān)督學(xué)習(xí))有什么區(qū)別呢?
首先分類(lèi)算法是一種有監(jiān)督的學(xué)習(xí)算法,比如:bp神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)svm、決策樹(shù)等等,這樣的算法有很多,那么什么是有監(jiān)督學(xué)習(xí)算法呢?
上圖中的第一組數(shù)據(jù)是一個(gè)訓(xùn)練樣本集,可以看到該樣本集有3個(gè)特征(輸出),一個(gè)輸出(類(lèi)別),每一個(gè)樣本都對(duì)應(yīng)一個(gè)類(lèi)別標(biāo)簽。1、2、3三個(gè)標(biāo)簽對(duì)應(yīng)3種不同的類(lèi)別,這個(gè)對(duì)應(yīng)關(guān)系是在算法學(xué)習(xí)之前就對(duì)應(yīng)好了的,也就是說(shuō)這個(gè)標(biāo)簽是已經(jīng)告知我們了。這種在學(xué)習(xí)前已經(jīng)告知樣本標(biāo)簽的數(shù)據(jù)學(xué)習(xí)就是有監(jiān)督學(xué)習(xí),這里的監(jiān)督就是指告知結(jié)果、告知類(lèi)別的含義。第二組數(shù)據(jù)則是根據(jù)第一組數(shù)據(jù)學(xué)習(xí)訓(xùn)練后,利用機(jī)器學(xué)習(xí)算法帶入特征分類(lèi)得到的結(jié)果。
再來(lái)看看聚類(lèi),它是一種無(wú)監(jiān)督的學(xué)習(xí)算法,最經(jīng)典的就是Kmeans聚類(lèi)算法。和上面的有監(jiān)督對(duì)應(yīng)的,無(wú)監(jiān)督就是算法在學(xué)習(xí)前用到的數(shù)據(jù)是沒(méi)有標(biāo)簽、沒(méi)有告知類(lèi)別的。
上圖第一組數(shù)據(jù)即為學(xué)習(xí)數(shù)據(jù),這里只有特征,沒(méi)有標(biāo)簽沒(méi)有類(lèi)別。下面的第二組數(shù)據(jù)則為聚類(lèi)算法聚類(lèi)得到的結(jié)果。
注意:
聚類(lèi)結(jié)果里的1、2、3與分類(lèi)結(jié)果里的1、2、3含義是大不相同的。
聚類(lèi)結(jié)果里的數(shù)字只表示一種類(lèi)別,但是這個(gè)類(lèi)別表示什么含義,光從聚類(lèi)結(jié)果來(lái)看是不清楚的,需要通過(guò)其他專(zhuān)業(yè)知識(shí)根據(jù)數(shù)據(jù)去判別,聚類(lèi)里的數(shù)字主要是用來(lái)區(qū)分是否是同一類(lèi),不同的數(shù)字表示不同的類(lèi)別,同樣的數(shù)字表示的是同樣的類(lèi)別。
分類(lèi)結(jié)果里的數(shù)字的含義與分類(lèi)用的訓(xùn)練數(shù)據(jù)里的標(biāo)簽含義一致,比如在訓(xùn)練數(shù)據(jù)里1表示高、2表示中、3表示矮,那么在分類(lèi)結(jié)果里分為1也表示高,3也表示矮,這里數(shù)字的含義是一一對(duì)應(yīng)的。
這是分類(lèi)算法和聚類(lèi)算法的最大的區(qū)別.................
請(qǐng)前往:http://lygongshang.com/TeacherV2.html?id=269