基于聚類算法的學生消費行為分析研究和應用_第1頁
已閱讀1頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、|TechniquesofAutomation2.新疆農(nóng)業(yè)大學網(wǎng)絡中心新疆烏魯木齊830052)摘要:本文以新疆農(nóng)業(yè)大學學生一卡通消費數(shù)據(jù)為基礎通過使用不同的聚類算法分別研究和分析本校民、漢學生的消費行為習慣。首先對數(shù)據(jù)源進行預處理其次通過對三種距離度量方式的優(yōu)化Kmeans聚類算法進行對比選出較好的一組進行分析最后分析聚類結果并獲取知識。本研究實現(xiàn)了對校園一卡通系統(tǒng)數(shù)據(jù)進行數(shù)據(jù)挖掘的初步探索和相關研究的開展不僅為學校相關部門的決策提供

2、了有用的參考信息也為將來構建完整的數(shù)字化數(shù)字校園決策支持系統(tǒng)提供了實踐經(jīng)驗和實現(xiàn)方法。關鍵詞:kmeans算法距離度量方式一卡通平臺數(shù)字校園中圖分類號:TP317.1文獻標識碼:A文章編號:10037241(2017)12003205AnalysisResearchApplicationofstudents’ConsumeBehaviBasedonClusteringAlgithmYOUXiangru1WANGYe2YANGShu1WA

3、NGbin2(1.CollegeofComputer2.ThewkCenterXinjiangAgriculturalUniversityUrumqi830052China)Abstract:Byusingdifferentclusteringalgithmthestudentshabitsofconsumebehaviisstudiedanalysed.Firstdataarepreprocessed.Secondlythrought

4、heoptimizationofthreekindsofdistancemeasureKmeansclusteringalgithmtocompareabettersetischoosed.Finallytheclusteringresultsisanalysedknowledgeisobtained.Thisstudyrealizesthecampusonecardsystemdatapreliminaryexplationdatam

5、iningresearchnotonlyprovidesanusefulreferenceinfmationfdecisionmakingftherelatedleadershipalsofthefuturetobuildacompletedigitalintelligentdecisionsupptsystemfcampus.Itprovidesthepracticalexperiencerealizedmethod.Keywds:K

6、meansalgithmdistancemeasureallinonecardplatfmdigitalcampus基金項目:基于本體的林產(chǎn)品WEB信息資源抽取與表征研究大數(shù)據(jù)下高校管理決策與商業(yè)智能協(xié)同機制研究自治區(qū)自然科學基金(編號2014211B023)校前期資助課題(編號XJAU201426)收稿日期:20169121引言近年來隨著校園數(shù)字化和信息化的不斷發(fā)展校園一卡通系統(tǒng)受到了廣泛應用國內多所高校已經(jīng)建成了自己的校園一卡通系統(tǒng)

7、。該系統(tǒng)的使用極大地推動了學校有關部門對學生的日常行為活動的管理工作的高效運行。一般校園一卡通系統(tǒng)具有用戶數(shù)量龐大、每日交易量大、單筆交易金額小等特點[1]。這些數(shù)據(jù)中蘊含著豐富的知識如果對其進行有效地統(tǒng)計、分析、挖掘就可以發(fā)現(xiàn)相關人員消費的一些特點與規(guī)律。2相關研究2.1研究現(xiàn)狀2010年李珊娜[2]在北京交通大學校園一卡通平臺的基礎上在分析學生行為和就餐消費習慣中介紹了對校園一卡通系統(tǒng)的數(shù)據(jù)挖掘的初步探索結果。2013年張佳[3]的

8、數(shù)據(jù)挖掘技術在校園一卡通系統(tǒng)中的應用研究中已經(jīng)實現(xiàn)利用數(shù)據(jù)挖掘方法為助學金發(fā)放提出了科萬方數(shù)據(jù)|TechniquesofAutomationP值最小的是MinkowskiDistance用時最小的是CityBlockDistance。因為實驗數(shù)據(jù)規(guī)模不是很大所以三者時間上的差距不是很明顯故可以重點考慮迭代次數(shù)和P值的情況。對于聚類結果來說P值越小類內對象相似度越高類間對象相似度就會越低。所以對于漢族學生的數(shù)據(jù)來說后續(xù)實驗將選擇基于Min

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論