譜聚類算法及其應用研究.pdf_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、聚類分析是一種研究樣本分類的統(tǒng)計方法,也是一種數據挖掘的方法,可以有效地實現數據結構的探測,在國際上已成近年機器學習領域的研究熱點。譜聚類算法作為聚類算法的一個分支是一個重要的研究方向,以圖論作為理論基礎,基本思想是將聚類問題轉化為圖論中的對無向加權圖的最優(yōu)分割問題。與現有的其他典型的聚類分析算法相比較而言,譜聚類算法在聚類的過程中降低了對樣本空間形狀的要求,同時譜聚類算法還可以有效的克服一些經典聚類算法易收斂于局部最優(yōu)解的缺點,可以得

2、到收斂于全局的最優(yōu)解。
  本文在對前人研究譜聚類算法所取得的現有成果進行了系統(tǒng)的學習,對已有的相關算法進行了部分改進。具體的工作內容概括如下:
  1)首先介紹了關于聚類算法特別是譜聚類算法的基本概念以及理論基礎,分析了譜聚類算法中的一些相關技術的已有的研究成果以及應用的現狀,然后對譜聚類研究領域中所涉及的幾個關鍵性問題進行了總結,歸納了譜聚類算法未來的幾個關鍵的研究方向。
  2)針對傳統(tǒng)的譜聚類算法中的兩個基本的

3、難點:相似矩陣的構造以及自動確定類的數目問題,本文通過定義的一種新的距離度量—密度敏感的距離和引入的特征間隙兩個概念,提出了一種基于密度敏感的自適應譜聚類算法。新提出算法的有效性在模擬數據集以及UCI數據集上的實驗中都得到了較好的驗證,同時本文還計算了該算法與傳統(tǒng)的SC算法的分類正確率,比較結果顯示新算法的聚類性明顯優(yōu)于SC算法。
  3)針對IPCM算法對稀疏程度不同的樣本集的聚類效果不理想,而且需要人工手動輸入聚類數目的缺點,

4、本文通過引入密度敏感的距離與特征間隙兩個概念,提出一種基于譜聚類的自適應IPCM算法,該算法用密度敏感的距離代替?zhèn)鹘y(tǒng)的歐氏距離,并通過特征間隙的性質準確地計算出聚類數目。通過數據實驗,證明了改進后的算法的有效性以及正確率都有所提高,同時該算法能夠有效的彌補IPCM算法及譜聚類算法在各自單獨聚類時所存在的缺點。
  4)將本文所提的密度敏感相似性度量引入到判別割算法中,代替原有的歐氏距離,以此對判別割算法進行改進,在此基礎上提出了一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論