基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究國際經(jīng)濟(jì)貿(mào)易專業(yè)
《基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究國際經(jīng)濟(jì)貿(mào)易專業(yè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究國際經(jīng)濟(jì)貿(mào)易專業(yè)(27頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、 中文題目: 基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究 英文題目: Association Analysis of the Customer Shopping Based on Taobao Platform 目錄中英文摘要與關(guān)鍵詞中英文摘要與關(guān)鍵詞.1一、引言.2二、客戶購物關(guān)聯(lián)分析.2(一)關(guān)聯(lián)分析技術(shù).2(二)客戶購物關(guān)聯(lián)挖掘過程.3三、淘寶商務(wù)平臺(tái)數(shù)據(jù)分析.5(一)分析對象.5(二)數(shù)據(jù)準(zhǔn)備.7(三)數(shù)據(jù)處理.8(四)關(guān)聯(lián)挖掘.11(五)關(guān)聯(lián)結(jié)果分析.15四、淘寶商務(wù)平臺(tái)中的關(guān)聯(lián)規(guī)則應(yīng)用 .17(一)客戶分析.17(二)商品營銷.18五、結(jié)論.191
2、參考文獻(xiàn)參考文獻(xiàn).21附錄附錄.23附錄:原始數(shù)據(jù).23基于淘寶商務(wù)平臺(tái)的客戶購物關(guān)聯(lián)分析研究摘要:摘要:淘寶網(wǎng)站作為國內(nèi)最大的電子商務(wù)平臺(tái),擁有龐大的消費(fèi)群體和海量的交易數(shù)據(jù)。如何對淘寶商務(wù)平臺(tái)上大量的數(shù)據(jù)進(jìn)行有效的收集、組織、挖掘和利用,找出其中真正有價(jià)值的信息和知識(shí),以指導(dǎo)企業(yè)的商業(yè)決策行為,成為電子商務(wù)經(jīng)營者關(guān)注的問題。關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘技術(shù)(Data Mining)中最為典型的一種,為解決這一問題提供了有效途徑。通過關(guān)聯(lián)規(guī)則挖掘,找出商品之間、商品與客戶之間存在的內(nèi)在聯(lián)系,對于電子商務(wù)中客戶關(guān)系管理、企業(yè)市場定位和商品營銷有著非常重要的指導(dǎo)意義。針對目前淘寶平臺(tái)中客戶購物數(shù)據(jù)的利用
3、問題,闡述了關(guān)聯(lián)規(guī)則挖掘的一般過程,并對采集的相關(guān)記錄數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,依據(jù)分析結(jié)果制定相應(yīng)的營銷策略。關(guān)鍵詞:關(guān)鍵詞: 電子商務(wù);數(shù)據(jù)挖掘;關(guān)聯(lián)分析Association Analysis of the Customer Shopping Based on Taobao PlatformAbstract: Taobao platform has huge consumer groups and generates massive transaction data every day. How to effectively collect, organize and mine these da
4、ta based on taobao platform to detect the valuable information and guide the behavior of business decision-making, has become a key problem for e-commerce operators. As one of the most typical data mining techniques, association rules provide an 2effective way to solve this problem. It is important
5、to find the internal relation between sales of goods and customers, which could be applied to customer relationship management, market position and sales strategy in e-commerce. To make effective use of data on Taobao platform, this thesis analyzes the process of association rule mining, and then pe
6、rform the association analysis based the collected relevant data. Finally, the corresponding marketing strategies are given.Keywords: E-commerce; Data mining; Association analysis一、引言近些年來電子商務(wù)迅猛發(fā)展,給人們生活帶來了很多便利,同時(shí)也帶來了不少難題和挑戰(zhàn)。對于企業(yè)來說,進(jìn)行電子商務(wù)轉(zhuǎn)型和發(fā)展,需要有互聯(lián)網(wǎng)思維,即能夠從海量的交易信息中找出有用的、有潛在價(jià)值的信息,以制定更好的經(jīng)營策略;對于消費(fèi)者來說,需要花
7、費(fèi)大量的時(shí)間和精力來瀏覽網(wǎng)上大量的商品信息,并從中比較和選購商品。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)中的一種,它可以反映大量數(shù)據(jù)間特有的聯(lián)系,并將這種聯(lián)系轉(zhuǎn)化為數(shù)據(jù)使用者感興趣的信息,為企業(yè)或消費(fèi)者提供決策支持。用戶網(wǎng)上交易的原始數(shù)據(jù)是海量的,我們可以從電子商務(wù)交易中提取,也可以從百度指數(shù)和阿里指數(shù)等獲得。淘寶數(shù)據(jù)魔方、量子恒道和SAS等數(shù)據(jù)挖掘分析工具能夠幫助企業(yè)對這些數(shù)據(jù)進(jìn)行處理。目前電子商務(wù)平臺(tái)中關(guān)聯(lián)規(guī)則挖掘的普及度和專業(yè)度不高,無法深入提取數(shù)據(jù)中更優(yōu)質(zhì)的信息,并借助這些信息去分析和發(fā)現(xiàn)客戶的消費(fèi)習(xí)慣和行為模式,從而改進(jìn)營銷決策和客戶服務(wù)。論文針對關(guān)聯(lián)規(guī)則技術(shù)在淘寶交易數(shù)據(jù)中的應(yīng)用,實(shí)現(xiàn)指定支持度和
8、置信度下,交易數(shù)據(jù)中關(guān)聯(lián)規(guī)則的挖掘,并對提取到的規(guī)則進(jìn)行分析,與淘寶商務(wù)平臺(tái)現(xiàn)狀結(jié)合,制定相應(yīng)的營銷策略。二、客戶購物關(guān)聯(lián)分析(一)(一)關(guān)聯(lián)分析技術(shù)關(guān)聯(lián)分析技術(shù)使用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則技術(shù)來對客戶購物關(guān)聯(lián)進(jìn)行分析,能夠把隱沒在一大批看似雜亂無章的數(shù)據(jù)中的信息,集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。在互聯(lián)網(wǎng)時(shí)代發(fā)展到大數(shù)據(jù)時(shí)代,數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長。然而,百分之八十的3數(shù)據(jù)是非結(jié)構(gòu)化的,因此需要通過關(guān)聯(lián)挖掘從數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)項(xiàng)中,找出數(shù)據(jù)中結(jié)構(gòu)化的、隱藏的聯(lián)系。這些數(shù)據(jù)聯(lián)系中的交叉性信息反應(yīng)隱含了客戶的潛在購買行為,對電子商務(wù)企業(yè)的營銷決策有著非常重要的價(jià)值。 購物分析是關(guān)聯(lián)規(guī)則的
9、一個(gè)典型案例。指的是當(dāng)顧客購買一些商品A,B,C,D.它們一起購買是偶然,還是顧客的購買行為習(xí)慣?商品A和B同時(shí)購買的概率有多大?如果兩者捆綁銷售是否會(huì)刺激顧客消費(fèi)?了解了顧客的購買行為,能夠幫助企業(yè)制定市場營銷策略。例如,什么樣的商品應(yīng)該放在一起,企業(yè)的顧客群體特征,顧客為什么購買這些商品。在制定商品策略和優(yōu)化客戶服務(wù)時(shí),根據(jù)顧客需求,實(shí)施精準(zhǔn)營銷。關(guān)聯(lián)規(guī)則挖掘的基本模型如圖 1 所示:輸入事務(wù)數(shù)據(jù)庫D輸出關(guān)聯(lián)規(guī)則集1.找出所有頻繁項(xiàng)目集2.產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則用戶最最小小支支持持度度最最小小置置信信度度 圖圖 1 1 關(guān)聯(lián)規(guī)則挖掘的基本模型關(guān)聯(lián)規(guī)則挖掘的基本模型(1)輸入事務(wù)數(shù)據(jù)庫 D,根據(jù)最小
10、支持度找出其中所有的頻繁項(xiàng)目集。(2)由(1)中的頻繁項(xiàng)目集和最小置信度產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,在一定情況下,也可以通過附加興趣度來對規(guī)則進(jìn)行度量。第一個(gè)子問題的核心是如何確定有效的支持度,以找出 D 中所有頻繁項(xiàng)目集。支持度是事務(wù)數(shù)據(jù)庫 D 中包含項(xiàng)集 X 的事務(wù)數(shù)與事務(wù)數(shù)據(jù)庫 D 的總事務(wù)數(shù)的比值,一般支持度越高越好,但是在實(shí)際關(guān)聯(lián)挖掘時(shí),需要根據(jù)業(yè)務(wù)需求不斷調(diào)整、嘗試,才能找到最合適的支持度;第二個(gè)子問題可以直接得到結(jié)果,但也需要根據(jù)不同的求解指標(biāo)如興趣度的度量標(biāo)準(zhǔn)來進(jìn)一步度量關(guān)聯(lián)規(guī)則集的合理性。4(二)客戶購物關(guān)聯(lián)挖掘過程(二)客戶購物關(guān)聯(lián)挖掘過程1.確定業(yè)務(wù)問題客戶購物關(guān)聯(lián)挖掘的主要價(jià)值應(yīng)該
11、是決策或者輔佐決策,因此評(píng)價(jià)關(guān)聯(lián)分析的原點(diǎn)是能否滿足業(yè)務(wù)需求,解決存在的業(yè)務(wù)問題。深入理解業(yè)務(wù)本身,是避免迷失在大量數(shù)據(jù)中的前提。針對電子商務(wù)平臺(tái),這里所說的業(yè)務(wù)問題可以是流量轉(zhuǎn)化、活動(dòng)營銷、關(guān)聯(lián)銷售、會(huì)員提升等。不同業(yè)務(wù)的關(guān)鍵需求決定了關(guān)聯(lián)分析的目標(biāo)用戶和目標(biāo)價(jià)值。2.數(shù)據(jù)探測在確定業(yè)務(wù)問題后就要選擇相關(guān)的數(shù)據(jù),有效挖掘的關(guān)鍵問題有:數(shù)據(jù)來源、數(shù)據(jù)量、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)平衡和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)來源通常是淘寶商務(wù)平臺(tái)的消費(fèi)者交易數(shù)據(jù)和流量數(shù)據(jù)。數(shù)據(jù)量并不是越大越好,要以效用為導(dǎo)向,以實(shí)用價(jià)值為指標(biāo),結(jié)合不同的階段性目標(biāo),進(jìn)行數(shù)據(jù)采集分析。具有一定規(guī)模的企業(yè)或公司會(huì)有自己的數(shù)據(jù)庫來存儲(chǔ)海量數(shù)據(jù),對于規(guī)模
12、很小的店鋪或個(gè)人創(chuàng)業(yè)等,可以借助電商平臺(tái)如淘寶指數(shù),或利用數(shù)據(jù)庫軟件如 Oracle,SQL Server,IBM DB2,MySQL 等,來存儲(chǔ)和有組織的管理各種網(wǎng)站流量數(shù)據(jù)和客戶購物交易數(shù)據(jù)。數(shù)據(jù)平衡是結(jié)合每個(gè)企業(yè)自身實(shí)際,規(guī)劃設(shè)計(jì)數(shù)據(jù)表的特點(diǎn)和結(jié)構(gòu)。很多情況下數(shù)據(jù)的質(zhì)量難以保證,充分的數(shù)據(jù)探測是為了了解數(shù)據(jù)的分布、變化趨勢和數(shù)據(jù)關(guān)系。將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化可理解的、可用的結(jié)構(gòu)化數(shù)據(jù),即對應(yīng)的分布與統(tǒng)計(jì)信息,有助于全面了解數(shù)據(jù)特征,并建立客戶購物關(guān)聯(lián)挖掘模型。3.數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理有助于為客戶購物關(guān)聯(lián)分析提供高質(zhì)量的數(shù)據(jù)?,F(xiàn)實(shí)中數(shù)據(jù)大體上是不完整的、不一致的臟數(shù)據(jù),無法直接進(jìn)行關(guān)聯(lián)分析,需
13、要進(jìn)行清理、集成、變換和歸約,來糾正各種數(shù)據(jù)質(zhì)量問題,否則可能會(huì)影響客戶購物關(guān)聯(lián)分析得到的結(jié)果。4.數(shù)據(jù)建模(挖掘)對于電商平臺(tái)的客戶購物關(guān)聯(lián)分析需要選擇關(guān)聯(lián)規(guī)則方法,結(jié)合商務(wù)智能分析軟5件如 WEKA、SQL Server、IBM cognis 等對相應(yīng)的數(shù)據(jù)進(jìn)行挖掘分析。5.結(jié)果評(píng)估關(guān)聯(lián)分析后會(huì)輸出許多模式,對相關(guān)模式的合理性進(jìn)行測試和評(píng)估是必要的。企業(yè)認(rèn)可的與消費(fèi)者認(rèn)可的結(jié)果不一定相同,甚至可能是相悖的。這個(gè)階段與業(yè)務(wù)人員的充分溝通、比對網(wǎng)站的交易數(shù)據(jù)是保證其效用最大化的有效途徑。6.應(yīng)用部署將分析的關(guān)聯(lián)結(jié)果應(yīng)用到商務(wù)決策中,在客戶關(guān)系管理、個(gè)性化推薦、商品營銷、提高轉(zhuǎn)化率等方面,制定具
14、體的、可執(zhí)行的、可管控的戰(zhàn)略實(shí)施計(jì)劃,以產(chǎn)生經(jīng)濟(jì)效益。三、淘寶商務(wù)平臺(tái)數(shù)據(jù)分析淘寶商務(wù)平臺(tái)中的數(shù)據(jù),信息量巨大,結(jié)構(gòu)復(fù)雜,類型眾多。對購物數(shù)據(jù)的分析,不再局限于商品名稱、商品類型、商品價(jià)格和交易時(shí)間,也包括購買商品的客戶信息。很多商家只是把這些交易信息當(dāng)作一個(gè)展示頁面,但基于交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘還是不夠深入,缺乏專業(yè)的挖掘工具和分析工具以及專業(yè)的分析人員對這些信息的潛在性進(jìn)行挖掘和分析。(一)分析對象(一)分析對象淘寶商務(wù)平臺(tái)中的商品品種繁多,價(jià)格相對便宜,支付方便,易于消費(fèi)者選購,深受廣大網(wǎng)絡(luò)消費(fèi)者的歡迎,淘寶中的客戶購物數(shù)據(jù)龐大,關(guān)聯(lián)性高,蘊(yùn)含的信息多。所以本文選取淘寶商務(wù)平臺(tái)中 305
15、 個(gè)用戶在淘寶天貓超市中交易記錄,來挖掘潛在的、有價(jià)值的信息。首先可以利用圖表看一下這些記錄展示出來的數(shù)據(jù)信息。6圖圖 2 2 性別分布餅圖性別分布餅圖圖圖 3 3 職業(yè)分布柱狀圖職業(yè)分布柱狀圖由圖 2、圖 3 可以得出,天貓的消費(fèi)人群與淘寶網(wǎng)相比,更偏女性化,即女性消費(fèi)者占比更高;學(xué)生群體消費(fèi)比重大,可以看出目前網(wǎng)絡(luò)消費(fèi)者總體較為年輕;消費(fèi)人群學(xué)歷水平整體較高。圖圖 4 4 購買類目柱狀圖購買類目柱狀圖從購買類目上看,購買進(jìn)口食品的可能性值是 30.3%,購買食品飲料的可能性值是783.33%,購買油糧副食的可能性值是 15.15%,購買美容洗護(hù)的可能性值是 42.42%,購買家具家電的可能
16、性值是 9.09%,購買家庭清潔的可能性值是 42.42%,購買母嬰用品的可能性值是 3.03%,購買生鮮水果的可能性值是 10.61%,食品飲料、美容洗護(hù)、家庭清潔排在前三位,這與調(diào)查人群中女性占比例大,學(xué)生、家庭主婦、白領(lǐng)職業(yè)分布比重高有很大的關(guān)系。圖圖 5 5 購買原因柱狀圖購買原因柱狀圖在購買原因中,價(jià)格優(yōu)惠的認(rèn)可度是 5.38,物流速度快的認(rèn)可度是 4.8,質(zhì)量保障的認(rèn)可度是 4.44,品種豐富的認(rèn)可度是 4.26,配送范圍廣的認(rèn)可度是 2.2,優(yōu)惠促銷活動(dòng)豐富的認(rèn)可度是 2.14,支付方式完善的認(rèn)可度是 1.2,包裝規(guī)范的認(rèn)可度是 1,其他的認(rèn)可度是 0.83,運(yùn)費(fèi)便宜的認(rèn)可度是
17、0.76。由此說明價(jià)格、物流、商品質(zhì)量、品種數(shù)量等因素對客戶購買決策的影響很大。8圖圖 6 6 受吸引的優(yōu)惠活動(dòng)柱狀圖受吸引的優(yōu)惠活動(dòng)柱狀圖對消費(fèi)者而已,最受吸引的優(yōu)惠活動(dòng)中,直接打折降價(jià)吸引度為 66.67%,限時(shí)搶購、低價(jià)秒殺吸引度為 45.45%,團(tuán)購吸引度為 28.79%,積分兌換券、抵用券吸引度為25.76%,滿指定金額包郵、禮品卡和購買得贈(zèng)品吸引度為 24.24%,名品特賣吸引度為19.7%,抽獎(jiǎng)和其他吸引度為 6.06%。直接打折降價(jià)雖然是比較傳統(tǒng)的優(yōu)惠活動(dòng),消費(fèi)者尤其是女性消費(fèi)者會(huì)對這類活動(dòng)樂此不疲,所以淘寶商務(wù)平臺(tái)經(jīng)常會(huì)在各種節(jié)假日開展優(yōu)惠活動(dòng)。以上是部分展示出來的數(shù)據(jù)信息,
18、這些數(shù)據(jù)信息比較單一,為商家的決策提供的價(jià)值有限,無法提供更深層次的、隱藏的信息,所以需要通過關(guān)聯(lián)分析將企業(yè)面臨的業(yè)務(wù)問題和研究的分析框架相結(jié)合,推導(dǎo)出具有實(shí)用價(jià)值的結(jié)論。(二)數(shù)據(jù)準(zhǔn)備(二)數(shù)據(jù)準(zhǔn)備代寫各專業(yè)碩博學(xué)位論文,代寫代發(fā) CSSCI、北大核心論文,合作加 QQ:97079517、 97079518 ; 微 電同號(hào):1580 1280 825。淘寶交易,安全無憂。CSSCI 來源期刊:電子政務(wù) 、 漢語學(xué)習(xí) 、 會(huì)計(jì)與經(jīng)濟(jì)研究 、 現(xiàn)代中文學(xué)刊 、 甘肅行政學(xué)院學(xué)報(bào) 、 天津體育學(xué)院學(xué)報(bào) 民族學(xué)刊 、 大學(xué)教育科學(xué) 、 金融論壇 、 南方經(jīng)濟(jì)、 東北亞論壇 、 寧夏社會(huì)科學(xué) 、 法商
19、研究 、 云南社會(huì)科學(xué) 、 人文雜志 、 甘肅社會(huì)科學(xué) 、 東北大學(xué)學(xué)報(bào) 、 自然資源與環(huán)境 。審稿周期:35-90 天辦結(jié)查稿。北大核心期刊:西安理工大學(xué)學(xué)報(bào) 、 心理與行為研究 、 統(tǒng)計(jì)與信息論壇 、 人口與發(fā)展 、廣西民族大學(xué)學(xué)報(bào).哲學(xué)社會(huì)科學(xué)版 、 南昌大學(xué)學(xué)報(bào)理科版 、 現(xiàn)代法學(xué) 、 江西財(cái)經(jīng)大學(xué)學(xué)報(bào) 、 武漢金融 、 學(xué)校黨建與思想教育 、 成人教育 、 中國科技翻9譯審稿周期:35-90 天辦結(jié)查稿。普刊:中國新通信 、 蘭臺(tái)內(nèi)外 、 中國多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(bào) 、 農(nóng)村科學(xué)實(shí)驗(yàn) 、 今日財(cái)富 、 心血管外科 中國結(jié)合醫(yī)學(xué) 、 經(jīng)貿(mào)實(shí)踐 、 語文課內(nèi)外 、記者觀察 、 新課程 、
20、現(xiàn)代職業(yè)教育 、 建筑與裝飾 、 畜牧獸醫(yī)科學(xué) 、 化工管理 、 魅力中國 、 人力資源管理 、 新教育時(shí)代 、 心理月刊等 300 多家國家級(jí)、省級(jí)普刊。審稿周期:1-7 天辦結(jié)查稿。將原始數(shù)據(jù)中與客戶特征、使用情況等信息保存為用戶信息表(tb_user) ,與購買商品有關(guān)的保存為商品購買表(tb_good) ,以 Oracle 數(shù)據(jù)庫為載體記錄相關(guān)表格。兩表的部分信息如下:表表 1 1 用戶信息表用戶信息表編號(hào)字段字段解釋1id序號(hào)2ip用戶 IP3sex性別4age年齡5education受教育程度6vocation職業(yè)7icome月收入或生活費(fèi)8frequency最近三個(gè)月購物的總次數(shù)
21、9cost平均每次購物的總花費(fèi)表表 2 2 商品購買表商品購買表編號(hào)字段字段解釋1id序號(hào)2ip用戶 IP3import_milk進(jìn)口牛奶104import_cookie進(jìn)口餅干/糕點(diǎn)(三)數(shù)據(jù)處理(三)數(shù)據(jù)處理原始的數(shù)據(jù)通常由于主、客觀原因,會(huì)包含異常數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)或重復(fù)數(shù)據(jù),是不能直接進(jìn)行關(guān)聯(lián)分析的,因此必須進(jìn)行數(shù)據(jù)預(yù)處理。1.數(shù)據(jù)選擇首先是篩選用戶信息表,用戶的性別、年齡、受教育程度、月收入或生活費(fèi)、最近三個(gè)月購物的總次數(shù)、平均每次購物的總花費(fèi)等屬性,這些屬性能夠預(yù)測顧客的購買行為,對推薦產(chǎn)生作用;而次要屬性比如序號(hào),用戶IP 等屬性對于統(tǒng)計(jì)分析是必要的,但是關(guān)聯(lián)分析可以刪除。對于商品購
22、買表,客戶購買的產(chǎn)品涉及50種,要從中選取出購買頻率高的前 10 位產(chǎn)品,所以先做一個(gè)簡單的統(tǒng)計(jì),然后篩選下能夠進(jìn)行關(guān)聯(lián)分析的購買相對較多的產(chǎn)品。選擇后兩表的字段如下:表表 3 3 數(shù)據(jù)選擇后用戶信息表數(shù)據(jù)選擇后用戶信息表編號(hào)字段字段解釋1sex性別2age年齡3education受教育程度4icome月收入或生活費(fèi)5frequency最近三個(gè)月購物的總次數(shù)6cost平均每次購物的總花費(fèi)7reason選擇在這購物的理由8campaign最喜歡的優(yōu)惠活動(dòng)9way下單方式10satisfaction滿意度表表 4 4 數(shù)據(jù)選擇后商品購買表數(shù)據(jù)選擇后商品購買表編號(hào)字段字段解釋1import進(jìn)口零食1
23、12sweet糖果/巧克力3drink飲料/水4protein肉類/豆干制品5cookie餅干糕點(diǎn)6milk牛奶乳品7nut堅(jiān)果炒貨8washing個(gè)人洗護(hù)9tissue紙制品/衛(wèi)生紙10fruit水果2.數(shù)據(jù)清理數(shù)據(jù)清理以提高數(shù)據(jù)質(zhì)量為目標(biāo),將數(shù)據(jù)質(zhì)量提高到挖掘技術(shù)所要求的水平。去掉不完整的數(shù)據(jù)和噪聲數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果的質(zhì)量。例如將一行記錄中全是空值的記錄,殘缺的記錄去除,以方便進(jìn)行數(shù)據(jù)挖掘。清理后最終留下300 條記錄。3.數(shù)據(jù)轉(zhuǎn)換主要是對數(shù)據(jù)進(jìn)行規(guī)格化操作,來適應(yīng)關(guān)聯(lián)分析工具和相應(yīng)的算法。常用的開源挖掘工具如 WEKA、RapidMiner、NLTK、Orange 等,需要將字符集轉(zhuǎn)
24、換為英文,否則可能出現(xiàn)亂碼的情況。常見的關(guān)聯(lián)規(guī)則算法,如Apriori 算法是布爾類型的算法,原始數(shù)據(jù)表格中所使用的字段,數(shù)據(jù)類型不一的,需要進(jìn)行轉(zhuǎn)化成相應(yīng)的布爾類型:(1)量化屬性離散化:對于數(shù)值類型的屬性,需要進(jìn)行離散化處理,先進(jìn)行最大最小值統(tǒng)計(jì),對于如果最大值是離群點(diǎn),可以選擇相對正常的較高值作為最大值,再劃分為幾個(gè)區(qū)間。例如用戶信息表中的 “月收入或生活費(fèi)、最近三個(gè)月購物的總次數(shù)、平均每次購物的總花費(fèi) ”字段就是數(shù)值屬性。根據(jù)取值的分布規(guī)律,我們將月收入或生活費(fèi)其劃分為五個(gè)組,分別是0-1500(1) 、1501-3000(2) 、3001-5000(3) 、5001-10000(4)
25、和 10001-20000(5) 。將最近三個(gè)月購物的總次數(shù)分12成三個(gè)組,分別是 0-2 次(1) ,3-5 次(2) ,5 次以上(3) ,將平均每次購物的總花費(fèi)分成 6 個(gè)組,分別是 50 元及以下( 1) ,51-100 元(2) ,101-300 元(3) ,301-500 元(4) ,501-1000 元(5) ,1000 元以上(6) 。(2)類別屬性轉(zhuǎn)化:用戶戶信息表中的 “性別”字段,需要轉(zhuǎn)化為 M(男)和 F(女)這樣的布爾型; “受教育程度 ”可分為 college(大專及以下) 、undergraduate(本科) ;“選擇在這購物的理由 ”可分為 price(價(jià)格優(yōu)惠
26、) 、pay(支付方式完善) 、logistics(物流速度快) 、quality(質(zhì)量保障) 、variety(品種豐富) 、promotion(優(yōu)惠促銷活動(dòng)豐富)。 “最喜歡的優(yōu)惠活動(dòng)、下單方式、滿意度 ”三個(gè)字段按照以上方式依次進(jìn)行類別布爾轉(zhuǎn)換。對于商品購買表,需要處理為布爾矩陣格式,即每行表示一條交易記錄,列中的 yes/no 值表示這條記錄中顧客是否購買了該商品,并不考慮各個(gè)商品自身的價(jià)格、購買單位等。最終完成轉(zhuǎn)化的表部分?jǐn)?shù)據(jù)如下:圖圖 7 7 數(shù)據(jù)轉(zhuǎn)化后用戶信息表數(shù)據(jù)轉(zhuǎn)化后用戶信息表13圖圖 8 8 數(shù)據(jù)轉(zhuǎn)化后商品購買表數(shù)據(jù)轉(zhuǎn)化后商品購買表(四)關(guān)聯(lián)挖掘(四)關(guān)聯(lián)挖掘本文將使用挖掘
27、工具 WEKA 來進(jìn)行關(guān)聯(lián)挖掘。 WEKA 的全名是懷卡托智能分析環(huán)境,是一款開源數(shù)據(jù)挖掘軟件,集合了大量數(shù)據(jù)挖掘算法和數(shù)據(jù)處理功能,關(guān)聯(lián)規(guī)則是其中典型的一種。點(diǎn)擊啟動(dòng)運(yùn)行 WEKA 軟件后,發(fā)現(xiàn) WEKA 存儲(chǔ)數(shù)據(jù)的格式是 ARFF 文件。除了ARFF 格式,WEKA 還支持另外一種常見格式, CSV 格式。而對于保存在數(shù)據(jù)庫中的數(shù)據(jù),WEKA 支持 JDBC 訪問數(shù)據(jù)庫。具體的挖掘過程如下:1.導(dǎo)入數(shù)據(jù)環(huán)境:(1)主機(jī):Weka 3.8,PL/SQL,ojdbc14.jar(2)VMware Workstation:Oracle11g連接步驟:(1)安裝 weka 軟件,完成后將 orac
28、le 的架包 ojdbc14.jar 放到 weka 安裝目錄(D:/Program Files/Weka-3-8/)下;(2)打開 D:/Program Files/Weka-3-8/weka.jar 這個(gè)文件,修改文件weka.jar-weka-experiment-DatabaseUtils.props.oracle ,指定虛擬機(jī)中的14oracle 數(shù)據(jù)庫為連接的 jdbc,設(shè)置相應(yīng)的數(shù)據(jù)庫的 URL、端口號(hào)和數(shù)據(jù)庫名:“jdbcURL=jdbc:oracle:thin:192.168.163.3:1521:XE” ,然后將文件另存為DatabaseUtils.props,刪除安裝目錄
29、下的原文件。(3)打開 D:/Program Files/Weka-3-8/目錄下的 runweka.ini 文件,找到最后一行,設(shè)置環(huán)境變量:cp=%CLASSPATH%;D:/Program Files/Weka-3-8/lib/ojdbc14.jar。(4)重新啟動(dòng) weka,選擇進(jìn)入 Explorer 應(yīng)用,以 Open DB 方式載入 SQL-Viewer 界面,此時(shí) Connection-URL 文本框中已經(jīng)自動(dòng)設(shè)置為DatabaseUtils.props 中的值“jdbc:oracle:thin:192.168.163.3:1521:XE” ,點(diǎn)擊 User 按鈕,設(shè)置數(shù)據(jù)庫連接
30、的 Username 和 Password,分別為 HR 和123456。如圖 9 所示圖圖 9 9 數(shù)據(jù)庫連接配置數(shù)據(jù)庫連接配置點(diǎn)擊 OK 后連接,如果連接成功, Info 下會(huì)顯示提醒信息。(5)在 Query 窗口中根據(jù)查詢需要輸入 SQL 語句“select * from tb_user”和“select * from tb_good”,點(diǎn)擊“Execute”按鈕執(zhí)行,可在“Result”框下看到對應(yīng)的表格數(shù)據(jù)。如圖 10 所示15圖圖 1010 查詢的結(jié)果集查詢的結(jié)果集(6)點(diǎn)擊“OK”按鈕即可導(dǎo)入。如圖 11 所示圖圖 1111 數(shù)據(jù)導(dǎo)入完成數(shù)據(jù)導(dǎo)入完成2.關(guān)聯(lián)規(guī)則分析作關(guān)聯(lián)規(guī)則的
31、分析,將 WEKA 切換到“Associate”選項(xiàng)卡??蛇x擇的算法有Apriori、FilteredAssociator、FPGrowth,默認(rèn)使用 Apriori 算法。如果發(fā)現(xiàn)該算法呈現(xiàn)灰色不能點(diǎn)擊,可能是數(shù)據(jù)不符合類型,需要重新調(diào)整數(shù)據(jù)。 關(guān)聯(lián)規(guī)則是形如 L-R 的規(guī)則,它的重要指標(biāo)支持度( Support)和置信度(Confidence) ,描述了其有用性和確定性。對于客戶購物關(guān)聯(lián)分析來說,支持度s(L-R)就是購買了一些商品中同時(shí)觀察到商品L 和 R 的概率,而置信度就是所有購買了 L 商品的記錄中時(shí) L 和 R 的同時(shí)存在的概率。支持度和置信度都較高的規(guī)則實(shí)用價(jià)值比較高。16Ap
32、riori 算法的基本思想是先設(shè)置最小支持度和最小置信度,通過對n 條記錄產(chǎn)生候選頻繁項(xiàng)集進(jìn)行支持度和置信度進(jìn)行計(jì)算,將滿足最小支持度和最小置信度的項(xiàng)集保留下來,作為新的記錄,再次產(chǎn)生候選頻繁項(xiàng)集。通過迭代,最后記錄中所有滿足要求的頻繁項(xiàng)集就是關(guān)聯(lián)規(guī)則。點(diǎn)擊“Choose”右邊的文本框修改默認(rèn)的參數(shù),計(jì)劃挖掘出最小支持度(lowerBoundMinSupport)為 20%,并且最小置信度( minMetric)為 90%的關(guān)聯(lián)規(guī)則。將“metricType”設(shè)為 confidence,其他參數(shù)不變。如圖 12 所示圖圖 1212 支持度、置信度設(shè)置支持度、置信度設(shè)置點(diǎn)擊“start”得到結(jié)果
33、如下:圖圖 1313 用戶信息關(guān)聯(lián)結(jié)果用戶信息關(guān)聯(lián)結(jié)果17圖圖 1414 商品購買關(guān)聯(lián)結(jié)果商品購買關(guān)聯(lián)結(jié)果(五)關(guān)聯(lián)結(jié)果分析(五)關(guān)聯(lián)結(jié)果分析Apriori 算法的參數(shù),設(shè)置最小支持度為 20%,最小項(xiàng)集大小為 0,這兩項(xiàng)值可根據(jù)實(shí)際情況進(jìn)行設(shè)置。通過關(guān)聯(lián)規(guī)則算法找到了那些頻繁項(xiàng)目集,每一條對應(yīng)的可得到的結(jié)論為:1.用戶信息表(1)性別為女,購買頻率在 0-2 次的人,下單方式為手機(jī)的概率為100%;(2)性別為女,喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為 100%;(3)喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為98%;(4)購買頻率在 0-2 次,喜愛的優(yōu)惠活
34、動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為 97%;(5)受教育程度為本科,喜愛的優(yōu)惠活動(dòng)為直接打折降價(jià)的人,下單方式為手機(jī)的概率為 97%;(6)平均每次在天貓超市購物的總花費(fèi) 為 51-100 元的人,下單方式為手機(jī)的概率為 97%;(7)購買頻率在 0-2 次的人,下單方式為手機(jī)的概率為96%;(8)滿意度為“基本能滿足 ”的人,下單方式為手機(jī)的概率為 95%;18(9)受教育程度為本科,購買頻率在0-2 次的人,下單方式為手機(jī)的概率為95%;(10)性別為女,下單方式為手機(jī)的概率為92%;2.商品購買表(1)購買了肉類 /豆干制品并且購買了水果的人,會(huì)購買紙制品 /衛(wèi)生紙的概率為 9
35、9%;(2)購買了肉類 /豆干制品、餅干糕點(diǎn)和水果的人,會(huì)購買紙制品 /衛(wèi)生紙的概率為 98%;(3)購買了進(jìn)口零食并且購買了個(gè)人洗護(hù)的人,會(huì)購買肉類/豆干制品的概率為 95%;(4)購買了糖果 /巧克力、肉類 /豆干制品和堅(jiān)果炒貨的人,會(huì)購買餅干糕點(diǎn)的概率為 93%;(5)不購買飲料 /水但購買肉類 /豆干制品和紙制品 /衛(wèi)生紙的人,會(huì)購買餅干糕點(diǎn)的概率為 91%;(6)購買了肉類 /豆干制品、牛奶乳品但沒有購買水果的人,會(huì)購買堅(jiān)果炒貨的概率為 91%;(7)購買了糖果 /巧克力和肉類 /豆干制品的人,會(huì)購買餅干糕點(diǎn)的概率為91%;(8)購買了糖果 /巧克力但沒有飲料 /水的人,會(huì)購買餅干糕
36、點(diǎn)的概率為91%。這些結(jié)論和目前已經(jīng)得到日??蛻糍徺I的情況是一致的,可以作為重要參考,這證明了關(guān)聯(lián)規(guī)則算法在淘寶商務(wù)平臺(tái)客戶購物中的有效性。四、淘寶商務(wù)平臺(tái)中的關(guān)聯(lián)規(guī)則應(yīng)用(一)客戶分析(一)客戶分析根據(jù)關(guān)聯(lián)結(jié)果,找出顧客群體的特征,依據(jù)特征,進(jìn)行客戶細(xì)分,實(shí)現(xiàn)精準(zhǔn)營19銷。表表 5 5 客戶特征組合表客戶特征組合表編號(hào)客戶特征1女、0-2 次、手機(jī)下單2女、直接打折降價(jià)、手機(jī)下單3直接打折降價(jià)、手機(jī)下單40-2 次、直接打折降價(jià)、手機(jī)下單5本科、直接打折降價(jià)、手機(jī)下單651-100 元、手機(jī)下單70-2 次、手機(jī)下單8“基本能滿足” 、手機(jī)下單9本科、0-2 次、手機(jī)下單10女、手機(jī)下單根據(jù)
37、以上特征可以對營銷策略做出幾點(diǎn)改進(jìn):(1)提高顧客的購買興趣。 由關(guān)聯(lián)結(jié)果可知購買頻率在 0-2 次,每次花費(fèi)在51-100 元的女性顧客通過手機(jī)下單的概率高,為了提高購買頻率和刺激顧客的購買興趣,可以對這些購買頻率低的顧客推送一些快速瀏覽、即興需求的并且有優(yōu)惠活動(dòng)的商品,以適應(yīng)移動(dòng)端購物的特點(diǎn)?!爸苯哟蛘劢祪r(jià) ”能直接的利用顧客對價(jià)格的敏感心理,促使顧客做出購買的決定。像 特價(jià)只剩 24 小時(shí)!這樣的限期供應(yīng),能夠幫助激發(fā)消費(fèi)者的購買欲。但是要真實(shí),否則最終失去消費(fèi)者信任。(2)讓顧客能較長時(shí)間的停留瀏覽商品??蛻羧后w中女性占比大,學(xué)生、家庭主婦較多,這就不僅僅是標(biāo)題的是否吸引人的問題。在這
38、里針對她們的購買習(xí)慣,對商品詳情的描述非常關(guān)鍵,要盡量采用實(shí)地拍攝的商品圖片,少用官方圖片,以提高顧客對商家的信任度;還要有詳細(xì)的文字說明,不能幾個(gè)字草草了事;對于商品屬性和規(guī)格的描述要盡可能的詳細(xì);使用相關(guān)模板并利用Photoshop 對圖片進(jìn)行編輯等,以提高其美觀度來吸引顧客的眼球。(3)讓新顧客變成老顧客。事實(shí)證明,網(wǎng)店留住老顧客比開發(fā)新顧客要重要的多,前者的成本也要遠(yuǎn)低于后者。這里要充分利用顧客的情感,讓顧客感覺到一絲20溫馨。比如在發(fā)貨時(shí),根據(jù)商品搭配一個(gè)小禮品,給顧客一個(gè)驚喜;在節(jié)假日,通過短信、郵件等工具送去溫馨的祝福,同時(shí)可以根據(jù)顧客的消費(fèi)頻率和每次消費(fèi)金額分組, “VIP 客
39、戶、黃金客戶、普通客戶 ”等,給予不同的優(yōu)惠待遇,以此來加深與顧客的關(guān)系,增加顧客對網(wǎng)店的認(rèn)可度和忠誠度。(二)商品(二)商品營銷營銷由以上對商品購買的關(guān)聯(lián)規(guī)則分析結(jié)果,對商品營銷做出改進(jìn),可以從以下幾個(gè)方面入手:1.商品目錄商品目錄包括全面的導(dǎo)航條和相關(guān)產(chǎn)品展示。對于淘寶商務(wù)平臺(tái)中的天貓超市,它將進(jìn)口食品和食品飲料放在導(dǎo)航區(qū)的上端、訪問頻率高的位置是合理的。收集的數(shù)據(jù)中購買前 10 名的多為食品類,并且進(jìn)口食品和食品飲料一起購買的概率在90%以上。對于相關(guān)產(chǎn)品展示區(qū),一般的食品類店鋪可以將牛奶、餅干、肉類/豆干制品等顧客愿意購買的組合放在典型商品展示區(qū)。2.商品廣告有效的廣告投入可以增加網(wǎng)站
40、的瀏覽量,從而幫助提高銷售額。在淘寶網(wǎng)首頁鉆展展示區(qū)可以投放店鋪活動(dòng)、品牌宣傳,例如強(qiáng)調(diào)主打的肉類/豆干制品、餅干糕點(diǎn)、糖果/巧克力等熱賣商品正在搞活動(dòng);而類似小圖、旺旺彈窗小圖等站位,可以做單品、新品宣傳,建議是熱賣種類里面的具體商品,例如糖果/巧克力種類里面具體的熱賣的費(fèi)列羅巧克力在打折,可以單獨(dú)為其投放廣告,帶來可靠回報(bào)的概率大。3.交叉銷售商品的低位定價(jià)策略在電子商務(wù)低成本的環(huán)境下并不一定一直有效,需要配合其他的銷售策略一起實(shí)施。交叉銷售就是在客戶購買了一種商品,向其推薦他具有潛在購買欲望的商品。關(guān)聯(lián)規(guī)則發(fā)現(xiàn)了客戶隱藏的購買需求,這些交叉銷售的組合有:21表表 6 6 商品銷售組合表商
41、品銷售組合表編號(hào)銷售組合1肉類/豆干制品、水果、紙制品/衛(wèi)生紙2肉類/豆干制品、餅干糕點(diǎn)、水果、紙制品/衛(wèi)生紙3進(jìn)口零食、個(gè)人洗護(hù)、肉類/豆干制品4糖果/巧克力、肉類/豆干制品、堅(jiān)果炒貨、餅干糕點(diǎn)5肉類/豆干制品、紙制品/衛(wèi)生紙、餅干糕點(diǎn)6肉類/豆干制品、牛奶乳品、堅(jiān)果炒貨7糖果/巧克力、肉類/豆干制品、餅干糕點(diǎn)8糖果/巧克力、餅干糕點(diǎn)在促銷時(shí)將類似 “肉類/豆干制品+餅干糕點(diǎn)”的組合放在一起,一起打折,或者買一贈(zèng)一。即使本來客戶打算只買肉類 /豆干制品這一種商品,但看見餅干糕點(diǎn)同時(shí)在促銷時(shí),也會(huì)超出預(yù)想清單,實(shí)施購買。在這些關(guān)聯(lián)規(guī)則中,也會(huì)發(fā)現(xiàn)一些有趣的組合,如 “肉類/豆干制品、水果、紙制
42、品 /衛(wèi)生紙” ,分析可知,紙制品與食品同時(shí)購買,一方面是消費(fèi)者享用食物時(shí)會(huì)需要紙巾清理垃圾,另一方面為了湊滿 88 元包郵,消費(fèi)者會(huì)選擇使用期限較長,不會(huì)變質(zhì)的商品來湊單,所以在零食類商品打折促銷時(shí),將紙制品類商品以一個(gè)小于零食類商品打折幅度的折扣進(jìn)行優(yōu)惠,就會(huì)滿足消費(fèi)者湊單的需求。這些生動(dòng)化的商品組合,不僅減輕了顧客的選擇顧慮,同時(shí)提升了客單量,增強(qiáng)了用戶粘性。五、結(jié)論本文基于關(guān)聯(lián)規(guī)則,根據(jù)客戶購物關(guān)聯(lián)分析的一般過程對采集的數(shù)據(jù)進(jìn)行有針對性的分析,并將提取到的規(guī)則運(yùn)用到電子商務(wù)的應(yīng)用中。由此可知,有效的電子商務(wù)數(shù)據(jù)關(guān)聯(lián)分析,能夠發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品之間的聯(lián)系強(qiáng)度,挖掘用戶潛在的購買模式
43、,并將這些模式所對應(yīng)的服務(wù)或產(chǎn)品展示給用戶,為其提供參考,從而提高用戶的購買率和滿意度,增加了企業(yè)的競爭優(yōu)勢。本文的研究成果存在不足之處,還可以進(jìn)一步完善,具體的體現(xiàn)在以下幾個(gè)方面:(1)由于電商數(shù)據(jù)的封裝性和自身?xiàng)l件的限制,本文的購物記錄為問卷調(diào)查所22得,缺乏普遍性和時(shí)效性。在后期進(jìn)一步研究中,將搜集更多實(shí)體數(shù)據(jù),并擴(kuò)大數(shù)據(jù)量。(2)電子商務(wù)平臺(tái)可以收集到大量用戶相關(guān)的數(shù)據(jù),包括交易數(shù)據(jù)、注冊數(shù)據(jù)、評(píng)分?jǐn)?shù)據(jù)、咨詢數(shù)據(jù)等。企業(yè)的決策目標(biāo)和約束往往是多因素的,如市場占有率、利潤、品牌、平臺(tái)等。本次實(shí)驗(yàn)的算法只側(cè)重于交易數(shù)據(jù)和以增加銷售量為目標(biāo),比較片面??梢赃M(jìn)一步的進(jìn)行多維度、多粒度的整合關(guān)聯(lián)
44、分析,得到的結(jié)果會(huì)比較全面,對企業(yè)和客戶的實(shí)用價(jià)值更高。(3)目前,WEKA 的關(guān)聯(lián)分析功能僅能用來作為示范,不適合用來挖掘大型數(shù)據(jù)集,進(jìn)一步的研究可以是通過云平臺(tái)等大型專業(yè)分析工具,對數(shù)據(jù)實(shí)施更深度、 更廣度的挖掘操作。 參考文獻(xiàn)參考文獻(xiàn)1 王茁,顧潔.三位一體的商務(wù)智能M.北京:電子工業(yè)出版社,2002. 2 箭牌中國:精準(zhǔn)預(yù)測嘗“甜”頭EB/OL.http:/ bcs/ solutions/bao/case.html.3 Dien D Phan, Douglas R Vogel. A model of customer relationship management and busin
45、ess intelligence systems for catalogue and online retailersJ. Information & 23Management, 2010,47:69-77.4 陳暢偉.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘可視化系統(tǒng)的實(shí)現(xiàn)D.武漢:武漢理工大學(xué),2004.5 李國輝,張軍,湯義.挖掘技術(shù)直面多媒體-信息爆炸帶來新挑戰(zhàn)R.計(jì)算機(jī)世界報(bào),2012(27):B1-B3.6 黃曉濤.電子商務(wù)導(dǎo)論M.北京:清華大學(xué)出版社,2005. 7 趙艷霞,梁昌勇.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在電子商務(wù)中的應(yīng)用J.價(jià)值工程.2006,(5):6-7. 8 錢雪忠,孔芳.關(guān)聯(lián)規(guī)則挖掘中對
46、 Apriori 算法的研究J.計(jì)算機(jī)工程與應(yīng)用.2008, (44):56-78.9 毛國君,段立娟. 數(shù)據(jù)挖掘原理與算法M.北京:清華大學(xué)出版社,2005.10 Michael J.A.Berry,Gordon S.Linoff數(shù)據(jù)挖掘M北京:中國財(cái)政經(jīng)濟(jì)出版社,2004. 11高宏賓,潘谷,黃義明.基于頻繁項(xiàng)集特性的 Apriori 算法的改進(jìn)J.計(jì)算機(jī)工程與設(shè)計(jì),2007,28(l0):2273-2275. 12 劉德喜,何炎祥,邢顯黎.一種新的頻繁項(xiàng)集挖掘算法J.計(jì)算機(jī)應(yīng)用研究,2007,(2):17-19. 13王安,仇德成,安云峰,王繼偉.一種雙進(jìn)的基于關(guān)系矩陣的關(guān)聯(lián)規(guī)則快速挖掘
47、算法J.現(xiàn)代電子技術(shù),2007,(3):114-116. 14劉景春,王永利.適合在線式增量更新的關(guān)聯(lián)規(guī)則挖掘算法J.計(jì)算機(jī)工程與應(yīng)用,2004,(12):188-192. 15王瑋,陳思紅.關(guān)聯(lián)規(guī)則的相關(guān)性研究J.計(jì)算機(jī)工程,2012,26(7):33-36. 16王旭,劉明剛.關(guān)聯(lián)規(guī)則研究J.經(jīng)濟(jì)研究導(dǎo)刊,2010,(8):04-15. 17CHAU M, CHENG R, KAO B. Uncertain data mining: a new research directionC. Proceedings of Workshop on the Sciences of the Artif
48、icial. Washington DC: IEEE Computer Society, 2005.199-204. 18趙衛(wèi)東.客戶智能M.北京:清華大學(xué)出版社,2013. 19Ben J S, Joseph A K, John R. E-commerce recommendation applicationR. GroupLens Research Project, 2002.24附錄附錄附錄:原始數(shù)據(jù)附錄:原始數(shù)據(jù)注:表格數(shù)據(jù)量過多,無法將所有字段和記錄都列舉出來,這里的原始數(shù)據(jù)僅展示部分?jǐn)?shù)據(jù)。表頭字段依次為:序號(hào)、提交問卷時(shí)間、所用時(shí)間、來自IP、來源、您的性別、您的年齡、您的受教育程
49、度、您的職業(yè)、您的收入或生活費(fèi)、您最近三個(gè)月在天貓超市購物的總次數(shù)、您平均每次在天貓超市購物的總花費(fèi)、進(jìn)口食品、食品飲料、糧油副食、美容洗護(hù)、家具家電、家庭清潔、母嬰用品、生鮮水果、價(jià)格優(yōu)惠、25品種豐富、質(zhì)量保障、配送范圍廣。表格記錄中的數(shù)字為問卷題目的選項(xiàng)序號(hào),如您的性別這列中的1和2,分別表示男和女兩個(gè)選項(xiàng),其他列以此類推。12017/5/6 0:36:32345秒117.136.66.156手機(jī)提交 微信1113331010000001 2 3 -222017/5/6 13:19:15283秒218.205.18.178手機(jī)提交 微信2123112110000001 2-2-23201
50、7/5/6 13:23:04150秒117.60.102.39手機(jī)提交 微信2123112110100002 -2-2-242017/5/6 13:25:39243秒218.205.20.35手機(jī)提交直接訪問2123112010000001 -2-2252017/5/6 13:28:52135秒183.206.158.14手機(jī)提交 微信2123212010101001 2 3 -262017/5/6 13:34:37223秒140.243.232.40手機(jī)提交 微信21132-3 -3 -3 -3 -3 -3-3-3-3-3-2-2-2-272017/5/6 13:39:35150秒117.1
51、36.81.172手機(jī)提交 微信1316513001111001 2 3 -282017/5/6 13:41:05269秒117.136.79.143手機(jī)提交 微信2123112010100001 -2 2 -292017/5/6 13:41:48100秒112.23.83.114手機(jī)提交 微信2223212010100001 2-2-2102017/5/6 13:42:38128秒180.99.65.49手機(jī)提交 微信222231301000000-22 1 -2112017/5/6 13:43:19143秒112.3.149.191手機(jī)提交 微信2315122011101011 -2-2-
52、2122017/5/6 13:45:52116秒101.88.64.122手機(jī)提交 微信221733201100100-2-2 1 -2132017/5/6 13:47:00788秒49.82.197.180手機(jī)提交 微信1223123010101003 2 1 -2142017/5/6 13:48:52164秒117.136.79.143手機(jī)提交 微信122311311000100-2-2-23152017/5/6 13:50:21722秒36.149.176.139手機(jī)提交 微信2317212000001003 -2 1 2162017/5/6 14:00:36289秒36.149.229
53、.217手機(jī)提交 微信2112111100000001 2 3 -2172017/5/6 14:13:48467秒49.92.121.236手機(jī)提交直接訪問1226513011000002 -2-2-2182017/5/6 14:25:04154秒183.206.136.28手機(jī)提交 微信211222311100100-21 2 -219 2017/5/6 14936.5.9.196手機(jī)提交 直接212312100000001- 3 1 -22614:41:36 秒訪問2202017/5/6 14:45:06278秒122.96.42.130手機(jī)提交 微信2123213010000001 -2
54、-2-2212017/5/6 14:45:59263秒36.149.216.81手機(jī)提交 微信212311201011100-21 2 -2222017/5/6 15:01:57482秒36.149.48.22手機(jī)提交 微信231432200010110-2-2-22232017/5/6 15:13:291492秒180.102.116.175手機(jī)提交 微信2113213100001001 -2 3 -2242017/5/6 16:26:34104秒121.238.244.101手機(jī)提交直接訪問2123113110100002 -2-2-2252017/5/6 16:34:1081 秒39.73.127.192手機(jī)提交直接訪問2123112011100001 -2-2-2
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 六級(jí)上冊科學(xué)ppt課件-誰選擇了它們-教科版
- 護(hù)理核心制度培訓(xùn)一_圖文課件
- 部編《池子與河流》課件
- SWOT分析法(非常全面)課件
- 主題班會(huì)我的成長目標(biāo)課件
- 城市交通擁堵及治理總結(jié)課件
- 輸血相關(guān)性急性肺損傷課件
- 議論文的謀篇布局與論點(diǎn)的提出ppt課件
- 六級(jí)上冊科學(xué)ppt課件-地球的近鄰——月球-冀人版
- 疾病預(yù)防、冬季保暖-課件
- 中考英語語法復(fù)習(xí)之狀語從句ppt課件集4
- 《百分?jǐn)?shù)的意義和讀寫》參考ppt課件
- 主題班會(huì)堅(jiān)持就是勝利課件
- 第二章--用人單位對大學(xué)生的要求概況ppt課件
- 教科版六年級(jí)科學(xué)上冊第三單元檢測卷(含答案)課件