分類(有監(jiān)督學(xué)習(xí))和聚類(無監(jiān)督學(xué)習(xí))有什么區(qū)別呢?
首先分類算法是一種有監(jiān)督的學(xué)習(xí)算法,比如:bp神經(jīng)網(wǎng)絡(luò)、支持向量機svm、決策樹等等,這樣的算法有很多,那么什么是有監(jiān)督學(xué)習(xí)算法呢?
上圖中的第一組數(shù)據(jù)是一個訓(xùn)練樣本集,可以看到該樣本集有3個特征(輸出),一個輸出(類別),每一個樣本都對應(yīng)一個類別標簽。1、2、3三個標簽對應(yīng)3種不同的類別,這個對應(yīng)關(guān)系是在算法學(xué)習(xí)之前就對應(yīng)好了的,也就是說這個標簽是已經(jīng)告知我們了。這種在學(xué)習(xí)前已經(jīng)告知樣本標簽的數(shù)據(jù)學(xué)習(xí)就是有監(jiān)督學(xué)習(xí),這里的監(jiān)督就是指告知結(jié)果、告知類別的含義。第二組數(shù)據(jù)則是根據(jù)第一組數(shù)據(jù)學(xué)習(xí)訓(xùn)練后,利用機器學(xué)習(xí)算法帶入特征分類得到的結(jié)果。
再來看看聚類,它是一種無監(jiān)督的學(xué)習(xí)算法,最經(jīng)典的就是Kmeans聚類算法。和上面的有監(jiān)督對應(yīng)的,無監(jiān)督就是算法在學(xué)習(xí)前用到的數(shù)據(jù)是沒有標簽、沒有告知類別的。
上圖第一組數(shù)據(jù)即為學(xué)習(xí)數(shù)據(jù),這里只有特征,沒有標簽沒有類別。下面的第二組數(shù)據(jù)則為聚類算法聚類得到的結(jié)果。
注意:
聚類結(jié)果里的1、2、3與分類結(jié)果里的1、2、3含義是大不相同的。
聚類結(jié)果里的數(shù)字只表示一種類別,但是這個類別表示什么含義,光從聚類結(jié)果來看是不清楚的,需要通過其他專業(yè)知識根據(jù)數(shù)據(jù)去判別,聚類里的數(shù)字主要是用來區(qū)分是否是同一類,不同的數(shù)字表示不同的類別,同樣的數(shù)字表示的是同樣的類別。
分類結(jié)果里的數(shù)字的含義與分類用的訓(xùn)練數(shù)據(jù)里的標簽含義一致,比如在訓(xùn)練數(shù)據(jù)里1表示高、2表示中、3表示矮,那么在分類結(jié)果里分為1也表示高,3也表示矮,這里數(shù)字的含義是一一對應(yīng)的。
這是分類算法和聚類算法的最大的區(qū)別.................
請前往:http://lygongshang.com/TeacherV2.html?id=269