社會標注系統(tǒng)中標簽推薦方法研究.pdf_第1頁
已閱讀1頁,還剩147頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、Web2.0開放的信息發(fā)布方式一方面極大地簡化了信息的發(fā)布過程,令更多的信息可以更自由的在互聯(lián)網(wǎng)上傳播,另一方面也為如何有效的組織這些信息帶來了問題。社會標注系統(tǒng)使用基于純文本標簽的方法分類信息,其簡單性與便捷性獲得了用戶的認可,并成為了Web2.0時代最為重要的信息組織方式。然而受到其不受控制的本質(zhì)的影響,社會標注系統(tǒng)的標注結果普遍存在著分類視角不一致、分類詞匯不一致、分類結果不一致、分類結果冗余,分類結果不完備、分類使用不規(guī)范等多方

2、面的問題。為了提升社會標注的質(zhì)量,標簽推薦作為一種社會標注輔助方法成為了相關領域研究的熱點。
  標簽推薦問題已經(jīng)獲得了廣泛而深入的研究??蒲腥藛T提出了大量的標簽推薦方法,并在很多實際的數(shù)據(jù)集上取得了良好的效果。然而,當前的標簽推薦方法在一些關鍵的問題上仍舊缺乏深入的研究。首先,這些方法要么不關注標簽的語義信息,要么采用基于外部語義源的語義描述方法。受到領域覆蓋,概念定義角度,更新頻率等方面的限制,外部語義源無法很好的適應大范圍的

3、社會標注應用。其次,這些推薦方法比較少關注對社會標注系統(tǒng)數(shù)據(jù)的有效預處理,無法為推薦算法提供一個有效的數(shù)據(jù)基礎。最后,這些推薦算法在對推薦線索的利用以及用戶個性化建模等方面還存在著不足。這些方面的問題限制了標簽推薦的質(zhì)量。
  針對上述問題,為了實現(xiàn)社會標注系統(tǒng)中高質(zhì)量的標簽推薦,本文進行了社會標注系統(tǒng)標簽推薦方法研究。通過利用少見標簽的明確語義及標簽間的語義互標注,本文構建了標簽的語義模型,為標簽推薦提供了堅實的語義基礎;通過識

4、別并區(qū)分分類與主題標簽、共識與非共識標簽及研究基于關系的標簽擴展,本文實現(xiàn)了社會標注數(shù)據(jù)的預處理,為標簽推薦提供了數(shù)據(jù)基礎。在這些工作的基礎之上,本文研究融合多種異構對象分析的標簽推薦方法,幫助解決社會標注系統(tǒng)數(shù)據(jù)稀疏、標簽推薦線索不足的問題,并進一步研究了用戶自主意識的建模方法,實現(xiàn)更加個性化的標簽推薦。具體包括:
  (1)基于語義互標注的社會標注系統(tǒng)標簽語義模型。以社會標注系統(tǒng)中具備明確同時具體語義的少見標簽所具有的非共識語

5、義信息為基礎,利用標簽之間的互標注現(xiàn)象作為語義的傳播途徑,建模了標簽的語義信息,給出了問題的數(shù)學模型描述及模型的計算方法,并通過實驗對算法的具體性能及參數(shù)的選取對算法的影響進行了分析,實現(xiàn)了對標簽語義信息的有效建模。
  (2)社會標注系統(tǒng)標簽數(shù)據(jù)預處理方法。針對標簽主題覆蓋能力不同的現(xiàn)象,研究了基于標簽語義層次劃分的分類標簽與主題標簽識別方法;針對用戶對標簽使用所形成的共識情況,研究了共識標簽與非共識標簽識別方法;針對資源標簽分

6、布不均勻,大量資源標簽數(shù)量不足的問題,研究了基于對象關系的資源標簽擴展方法。實驗對各個方法的應用性能進行了基于經(jīng)驗的評估,驗證了方法的可行性,為標簽推薦提供了可靠的訓練數(shù)據(jù)基礎。
  (3)融合異構對象分析的社會標注系統(tǒng)標簽推薦方法。針對社會標注系統(tǒng)中對象間關系普遍稀疏,無法為標簽推薦算法提供充足線索的現(xiàn)實,研究了融合多種對象分析的社會標注系統(tǒng)標簽推薦方法,通過引入其他類型的,具備稠密關系的對象補充了標簽推薦的線索,給出了具體的概

7、率系統(tǒng)模型描述、參數(shù)估計方法、模型推理方法以及模型的增量更新方法。實驗對模型的性能進行了分析,并證明了相比其他方法,該方法可以有效的利用更多推薦線索,實現(xiàn)更高質(zhì)量的標簽推薦。
  (4)面向用戶自主意識的社會標注系統(tǒng)標簽推薦方法。針對當前標簽推薦方法對用戶對資源及標簽的使用偏好建模不足的現(xiàn)狀,研究基于用戶自主意識的標簽個性化推薦方法,通過明確的建模用戶對資源的興趣及用戶對不同標簽的使用習慣,實現(xiàn)了高質(zhì)量的個性化標簽推薦。實驗表明該

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論