免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
基于統(tǒng)計視角的數(shù)據(jù)挖掘研究
基于統(tǒng)計視角的數(shù)據(jù)挖掘研究
論文標題:基于統(tǒng)計視角的數(shù)據(jù)挖掘研究
The Study of Data Mining Based on the Statistics View
論文作者
論文導師 李金昌,論文學位 博士,論文專業(yè) 統(tǒng)計學
論文單位 浙江工商大學,點擊次數(shù) 48,論文頁數(shù) 175頁File Size9271K
2007-06-01論文網(wǎng) http://www.lw23.com/lunwen_653701162/
Statistics; Data Mining; Theory System; Quality; LavaMiner
數(shù)據(jù)挖掘是一個年輕、活躍的研究領(lǐng)域,不同專業(yè)背景的研究者側(cè)重于不同方面對數(shù)據(jù)挖掘展開了研究。從目前國內(nèi)外的研究現(xiàn)狀看,從事數(shù)據(jù)挖掘研究的主要是計算機領(lǐng)域的學者和專家,統(tǒng)計界的學者和專家對數(shù)據(jù)挖掘的研究相對較少。而隨著數(shù)據(jù)存儲技術(shù)的不斷發(fā)展,可用于數(shù)據(jù)分析的數(shù)據(jù)量越來越大,對傳統(tǒng)的統(tǒng)計分析技術(shù)提出了極大的挑戰(zhàn)。筆者認為數(shù)據(jù)挖掘的出現(xiàn),正是統(tǒng)計學適應(yīng)這一變化的新的發(fā)展方向,數(shù)據(jù)挖掘并不是為了替代傳統(tǒng)的統(tǒng)計分析技術(shù),而是統(tǒng)計分析方法的延伸和擴展。本文從統(tǒng)計學視角研究數(shù)據(jù)挖掘,以期從統(tǒng)計學角度對數(shù)據(jù)挖掘理論的研究有所突破和創(chuàng)新,同時對統(tǒng)計學理論在數(shù)據(jù)挖掘方向的發(fā)展做出探索。 全文除了緒論,共分為七章。 第一章為:基于統(tǒng)計視角的數(shù)據(jù)挖掘理論體系研究。通過對數(shù)據(jù)挖掘與統(tǒng)計學理論基礎(chǔ)、方法等方面的比較,清晰地提出了基于統(tǒng)計視角的數(shù)據(jù)挖掘體系,改變了目前研究中人們對統(tǒng)計學與數(shù)據(jù)挖掘之間理解的模糊認識。 第二章為:數(shù)據(jù)挖掘統(tǒng)計方法綜述。首先對數(shù)據(jù)挖掘數(shù)據(jù)源、屬性類型和功能三個基本問題作了界定,然后對實現(xiàn)其中的關(guān)聯(lián)、聚類、分類和回歸四項功能的統(tǒng)計方法進行綜述,并對其中一些統(tǒng)計方法從數(shù)據(jù)挖掘應(yīng)用角度作了一些完善和改進。 第三章為:數(shù)據(jù)挖掘統(tǒng)計方法進一步研究。主要進行了特征描述統(tǒng)計方法研究和聚類挖掘距離函數(shù)和相似系數(shù)研究。在特征描述統(tǒng)計方法研究中,提出了在本文設(shè)計的可視化數(shù)據(jù)挖掘系統(tǒng)LavaMiner中將把特征描述作為一個獨立的挖掘功能模塊來實現(xiàn)的思路,提出了特征描述過程模型,進而根據(jù)建立的過程模型系統(tǒng)地研究了各個步驟可采用的統(tǒng)計方法。在聚類挖掘距離函數(shù)和相似系數(shù)研究中,系統(tǒng)地研究了各類屬性的距離函數(shù)和相似系數(shù),并分析了各個距離函數(shù)和相似系數(shù)的優(yōu)缺點或適用性。 第四章為:數(shù)據(jù)挖掘質(zhì)量問題研究。從數(shù)據(jù)挖掘整個過程考慮把數(shù)據(jù)挖掘質(zhì)量問題分為以下三類:源數(shù)據(jù)的質(zhì)量問題、數(shù)據(jù)集成時的質(zhì)量問題和數(shù)據(jù)分析時的質(zhì)量問題,并針對不同問題從統(tǒng)計學的角度分別提出了相應(yīng)有效的解決方法。 第五章為:可視化數(shù)據(jù)挖掘原型實現(xiàn)。首先從數(shù)據(jù)挖掘原型的應(yīng)用場景、使用對象、過程模型和模型表示四個方面研究了數(shù)據(jù)挖掘原型設(shè)計基礎(chǔ),然后設(shè)計并部分實現(xiàn)了可視化數(shù)據(jù)挖掘原型系統(tǒng)LavaMiner,這是本文的另一項重要研究內(nèi)容。該系統(tǒng)具有靈活的操作過程、便捷的擴展方式和全面的接口封裝三大特點。 第六章為:數(shù)據(jù)挖掘在實際數(shù)據(jù)庫上的應(yīng)用示例。完成了數(shù)據(jù)挖掘在浙江省聯(lián)通炫鈴用戶實際數(shù)據(jù)庫中的應(yīng)用示例,首先介紹了實驗數(shù)據(jù)庫,然后分不同時間段來實現(xiàn)最有價值客戶的挖掘,最后作了鈴音關(guān)聯(lián)挖掘。 第七章為:全文總結(jié)及研究展望。主要對全文工作進行總結(jié),并對下一步的研究作出展望。
From the end of 1980s, when data mining was known for the firsttime, more and more experts from distinct areas are interested in studyingdata mining. This thesis studies data mining based on the statistics view.The thesis includes seven chapters apart from introduction. Chapter one: the theory system of data mining from a statisticalperspective. By comparing data mining and statistics in many aspects, thethesis puts forward the theory system of data mining from a statisticalperspective. So we can understand data mining and statistics moredistinctly. Chapter two: summarizing statistics methods of data mining. First,the thesis discusses three issues about data mining: data, attribute typesand functions. Then it summarizes statistics methods about associationrule、clustering、classifying and regression, and also it improves somemethods from data mining application perspectives. Chapter three: studying statistics methods of data mining deeply.The thesis not only studies methods of character mining but also distancefunctions and resemble coefficient of clustering. Chapter four: studying qualities of data mining. The thesis thinksthat qualities of data mining include three parts from whole process: thequality of data, the qulity of data integration, the qulity of data analysis,then it studies sone methods to improve qualities of data mining from thestatistics view. Chapter five: realizing the data mining antetype system. The thesisstudies design elements of the data mining antetype from applicationscenes、users、process models and models expressing. Then it designs thedata mining antetype system LavaMine. LavaMine has threecharacteristics: flexible, expansibility and encapsulation. Chapter six: an example of data mining. The thesis performs datamining on a database as an example. The database is about ZHEJIANGprovince Unicorn colorful ring customers. Chapter seven: summing-up and study expectation.
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Python 數(shù)據(jù)挖掘工具推薦
數(shù)據(jù)挖掘經(jīng)典書籍推薦
數(shù)據(jù)挖掘與知識發(fā)現(xiàn)
美國統(tǒng)計碩士申請與就業(yè)大解析
統(tǒng)計與數(shù)據(jù)挖掘歷史發(fā)展
趨勢分析之數(shù)據(jù)挖掘
更多類似文章 >>
生活服務(wù)
分享 收藏 導長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服