

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、微型博客是一種日益興起的新型社交網(wǎng)絡(luò),在微博中,用戶(hù)之間不僅可以建立好友關(guān)系,還可以進(jìn)行學(xué)術(shù)交流、通過(guò)簽到分享自己在不同地點(diǎn)所參與的事件以及對(duì)熱點(diǎn)問(wèn)題進(jìn)行關(guān)注和討論。它具有發(fā)布信息快,信息傳播速度快的特點(diǎn)。但是因?yàn)橛脩?hù)眾多,數(shù)據(jù)量過(guò)大,且數(shù)據(jù)為動(dòng)態(tài)傳輸,使用傳統(tǒng)的靜態(tài)數(shù)據(jù)分析方法對(duì)其進(jìn)行分析就不再適合,而需要用到流聚類(lèi)的方法。本文中,我們把流聚類(lèi)分為兩個(gè)層次,其中在線的微聚類(lèi)層用于暫時(shí)性地處理和存儲(chǔ)摘要統(tǒng)計(jì)信息,由于該組件僅針對(duì)摘要統(tǒng)計(jì)
2、信息進(jìn)行處理,從而能夠處理流速和流量較大的數(shù)據(jù)流;另一層是離線的宏聚類(lèi)組件,針對(duì)這一層,我們可以根據(jù)需要調(diào)整輸入的參數(shù)(如類(lèi)或時(shí)間段的個(gè)數(shù))來(lái)對(duì)在線微聚類(lèi)層所存儲(chǔ)的摘要統(tǒng)計(jì)信息進(jìn)行聚類(lèi),以便能夠以不同角度和方式對(duì)數(shù)據(jù)流的聚類(lèi)結(jié)果進(jìn)行分析,從而提高了聚類(lèi)結(jié)果的精確性和可理解性。之后,本文針對(duì)微博數(shù)據(jù)的特點(diǎn)引入一個(gè)用戶(hù)影響力因子,將之作為微博的權(quán)值,從而得到針對(duì)微博流聚類(lèi)更加精確的結(jié)果。本文還使用了基于PCA的文本降維技術(shù)對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行了
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 一種聚類(lèi)算法的并行化改進(jìn)及其在微博用戶(hù)聚類(lèi)中的應(yīng)用.pdf
- Single-Pass聚類(lèi)算法的改進(jìn)及其在微博話題檢測(cè)中的應(yīng)用研究.pdf
- 偏差抽樣技術(shù)在聚類(lèi)挖掘中的應(yīng)用.pdf
- 基于LDA的微博話題聚類(lèi)研究.pdf
- 微博在微課程中的應(yīng)用探討
- 基于lda的微博話題聚類(lèi)研究
- 核聚類(lèi)算法研究及其在文本聚類(lèi)中的應(yīng)用.pdf
- 組合聚類(lèi)方法在文本聚類(lèi)中的應(yīng)用研究.pdf
- “微博”技術(shù)在圖書(shū)館信息服務(wù)中的應(yīng)用
- 聚類(lèi)技術(shù)在客戶(hù)細(xì)分中的研究與應(yīng)用.pdf
- 聚類(lèi)算法及其在頁(yè)面聚類(lèi)中的應(yīng)用研究
- 互動(dòng)營(yíng)銷(xiāo)在微博廣告中的應(yīng)用.pdf
- 譜聚類(lèi)算法研究及其在文本聚類(lèi)中的應(yīng)用.pdf
- 聚類(lèi)算法及其在頁(yè)面聚類(lèi)中的應(yīng)用研究.pdf
- 微博營(yíng)銷(xiāo)在企業(yè)營(yíng)銷(xiāo)中的應(yīng)用
- 基于文本聚類(lèi)的微博輿情熱點(diǎn)檢測(cè)技術(shù)研究.pdf
- 融合多特征聚類(lèi)的垃圾微博檢測(cè)研究.pdf
- 基于文本聚類(lèi)的微博信息分析的研究.pdf
- 基于用戶(hù)聚類(lèi)的微博話題推薦方法研究.pdf
- 微博在企業(yè)營(yíng)銷(xiāo)傳播中的應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論