九九热最新网址,777奇米四色米奇影院在线播放,国产精品18久久久久久久久久,中文有码视频,亚洲一区在线免费观看,国产91精品在线,婷婷丁香六月天

基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟貿(mào)易專業(yè)

上傳人:文*** 文檔編號:242741256 上傳時間:2024-09-02 格式:DOC 頁數(shù):27 大?。?58.49KB
收藏 版權(quán)申訴 舉報 下載
基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟貿(mào)易專業(yè)_第1頁
第1頁 / 共27頁
基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟貿(mào)易專業(yè)_第2頁
第2頁 / 共27頁
基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟貿(mào)易專業(yè)_第3頁
第3頁 / 共27頁

下載文檔到電腦,查找使用更方便

20 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟貿(mào)易專業(yè)》由會員分享,可在線閱讀,更多相關(guān)《基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究分析國際經(jīng)濟貿(mào)易專業(yè)(27頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、 中文題目: 基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究 英文題目: Association Analysis of the Customer Shopping Based on Taobao Platform 目錄中英文摘要與關(guān)鍵詞1一、引言2二、客戶購物關(guān)聯(lián)分析2(一)關(guān)聯(lián)分析技術(shù)2(二)客戶購物關(guān)聯(lián)挖掘過程3三、淘寶商務(wù)平臺數(shù)據(jù)分析5(一)分析對象5(二)數(shù)據(jù)準備7(三)數(shù)據(jù)處理8(四)關(guān)聯(lián)挖掘11(五)關(guān)聯(lián)結(jié)果分析15四、淘寶商務(wù)平臺中的關(guān)聯(lián)規(guī)則應(yīng)用17(一)客戶分析17(二)商品營銷18五、結(jié)論19參考文獻21附錄23附錄:原始數(shù)據(jù)23基于淘寶商務(wù)平臺的客戶購物關(guān)聯(lián)分析研究摘要:淘寶網(wǎng)站

2、作為國內(nèi)最大的電子商務(wù)平臺,擁有龐大的消費群體和海量的交易數(shù)據(jù)。如何對淘寶商務(wù)平臺上大量的數(shù)據(jù)進行有效的收集、組織、挖掘和利用,找出其中真正有價值的信息和知識,以指導(dǎo)企業(yè)的商業(yè)決策行為,成為電子商務(wù)經(jīng)營者關(guān)注的問題。關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘技術(shù)(Data Mining)中最為典型的一種,為解決這一問題提供了有效途徑。通過關(guān)聯(lián)規(guī)則挖掘,找出商品之間、商品與客戶之間存在的內(nèi)在聯(lián)系,對于電子商務(wù)中客戶關(guān)系管理、企業(yè)市場定位和商品營銷有著非常重要的指導(dǎo)意義。針對目前淘寶平臺中客戶購物數(shù)據(jù)的利用問題,闡述了關(guān)聯(lián)規(guī)則挖掘的一般過程,并對采集的相關(guān)記錄數(shù)據(jù)進行關(guān)聯(lián)分析,依據(jù)分析結(jié)果制定相應(yīng)的營銷策略。關(guān)鍵詞:

3、電子商務(wù);數(shù)據(jù)挖掘;關(guān)聯(lián)分析Association Analysis of the Customer Shopping Based on Taobao PlatformAbstract: Taobao platform has huge consumer groups and generates massive transaction data every day. How to effectively collect, organize and mine these data based on taobao platform to detect the valuable informatio

4、n and guide the behavior of business decision-making, has become a key problem for e-commerce operators. As one of the most typical data mining techniques, association rules provide an effective way to solve this problem. It is important to find the internal relation between sales of goods and custo

5、mers, which could be applied to customer relationship management, market position and sales strategy in e-commerce. To make effective use of data on Taobao platform, this thesis analyzes the process of association rule mining, and then perform the association analysis based the collected relevant da

6、ta. Finally, the corresponding marketing strategies are given.Keywords: E-commerce; Data mining; Association analysis一、引言近些年來電子商務(wù)迅猛發(fā)展,給人們生活帶來了很多便利,同時也帶來了不少難題和挑戰(zhàn)。對于企業(yè)來說,進行電子商務(wù)轉(zhuǎn)型和發(fā)展,需要有互聯(lián)網(wǎng)思維,即能夠從海量的交易信息中找出有用的、有潛在價值的信息,以制定更好的經(jīng)營策略;對于消費者來說,需要花費大量的時間和精力來瀏覽網(wǎng)上大量的商品信息,并從中比較和選購商品。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)中的一種,它可以反映大量數(shù)據(jù)間特有的

7、聯(lián)系,并將這種聯(lián)系轉(zhuǎn)化為數(shù)據(jù)使用者感興趣的信息,為企業(yè)或消費者提供決策支持。用戶網(wǎng)上交易的原始數(shù)據(jù)是海量的,我們可以從電子商務(wù)交易中提取,也可以從百度指數(shù)和阿里指數(shù)等獲得。淘寶數(shù)據(jù)魔方、量子恒道和SAS等數(shù)據(jù)挖掘分析工具能夠幫助企業(yè)對這些數(shù)據(jù)進行處理。目前電子商務(wù)平臺中關(guān)聯(lián)規(guī)則挖掘的普及度和專業(yè)度不高,無法深入提取數(shù)據(jù)中更優(yōu)質(zhì)的信息,并借助這些信息去分析和發(fā)現(xiàn)客戶的消費習(xí)慣和行為模式,從而改進營銷決策和客戶服務(wù)。論文針對關(guān)聯(lián)規(guī)則技術(shù)在淘寶交易數(shù)據(jù)中的應(yīng)用,實現(xiàn)指定支持度和置信度下,交易數(shù)據(jù)中關(guān)聯(lián)規(guī)則的挖掘,并對提取到的規(guī)則進行分析,與淘寶商務(wù)平臺現(xiàn)狀結(jié)合,制定相應(yīng)的營銷策略。二、客戶購物關(guān)聯(lián)分

8、析(一)關(guān)聯(lián)分析技術(shù)使用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則技術(shù)來對客戶購物關(guān)聯(lián)進行分析,能夠把隱沒在一大批看似雜亂無章的數(shù)據(jù)中的信息,集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律。在互聯(lián)網(wǎng)時代發(fā)展到大數(shù)據(jù)時代,數(shù)據(jù)呈現(xiàn)指數(shù)級增長。然而,百分之八十的數(shù)據(jù)是非結(jié)構(gòu)化的,因此需要通過關(guān)聯(lián)挖掘從數(shù)據(jù)庫中存儲的數(shù)據(jù)項中,找出數(shù)據(jù)中結(jié)構(gòu)化的、隱藏的聯(lián)系。這些數(shù)據(jù)聯(lián)系中的交叉性信息反應(yīng)隱含了客戶的潛在購買行為,對電子商務(wù)企業(yè)的營銷決策有著非常重要的價值。 購物分析是關(guān)聯(lián)規(guī)則的一個典型案例。指的是當(dāng)顧客購買一些商品A,B,C,D.它們一起購買是偶然,還是顧客的購買行為習(xí)慣?商品A和B同時購買的概率有多大?如果兩者捆綁銷

9、售是否會刺激顧客消費?了解了顧客的購買行為,能夠幫助企業(yè)制定市場營銷策略。例如,什么樣的商品應(yīng)該放在一起,企業(yè)的顧客群體特征,顧客為什么購買這些商品。在制定商品策略和優(yōu)化客戶服務(wù)時,根據(jù)顧客需求,實施精準營銷。關(guān)聯(lián)規(guī)則挖掘的基本模型如圖1所示: 圖1 關(guān)聯(lián)規(guī)則挖掘的基本模型(1)輸入事務(wù)數(shù)據(jù)庫D,根據(jù)最小支持度找出其中所有的頻繁項目集。(2)由(1)中的頻繁項目集和最小置信度產(chǎn)生強關(guān)聯(lián)規(guī)則,在一定情況下,也可以通過附加興趣度來對規(guī)則進行度量。第一個子問題的核心是如何確定有效的支持度,以找出D中所有頻繁項目集。支持度是事務(wù)數(shù)據(jù)庫D中包含項集X的事務(wù)數(shù)與事務(wù)數(shù)據(jù)庫D的總事務(wù)數(shù)的比值,一般支持度越高

10、越好,但是在實際關(guān)聯(lián)挖掘時,需要根據(jù)業(yè)務(wù)需求不斷調(diào)整、嘗試,才能找到最合適的支持度;第二個子問題可以直接得到結(jié)果,但也需要根據(jù)不同的求解指標如興趣度的度量標準來進一步度量關(guān)聯(lián)規(guī)則集的合理性。(二)客戶購物關(guān)聯(lián)挖掘過程1.確定業(yè)務(wù)問題客戶購物關(guān)聯(lián)挖掘的主要價值應(yīng)該是決策或者輔佐決策,因此評價關(guān)聯(lián)分析的原點是能否滿足業(yè)務(wù)需求,解決存在的業(yè)務(wù)問題。深入理解業(yè)務(wù)本身,是避免迷失在大量數(shù)據(jù)中的前提。針對電子商務(wù)平臺,這里所說的業(yè)務(wù)問題可以是流量轉(zhuǎn)化、活動營銷、關(guān)聯(lián)銷售、會員提升等。不同業(yè)務(wù)的關(guān)鍵需求決定了關(guān)聯(lián)分析的目標用戶和目標價值。2.數(shù)據(jù)探測在確定業(yè)務(wù)問題后就要選擇相關(guān)的數(shù)據(jù),有效挖掘的關(guān)鍵問題有:

11、數(shù)據(jù)來源、數(shù)據(jù)量、數(shù)據(jù)存儲、數(shù)據(jù)平衡和數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)來源通常是淘寶商務(wù)平臺的消費者交易數(shù)據(jù)和流量數(shù)據(jù)。數(shù)據(jù)量并不是越大越好,要以效用為導(dǎo)向,以實用價值為指標,結(jié)合不同的階段性目標,進行數(shù)據(jù)采集分析。具有一定規(guī)模的企業(yè)或公司會有自己的數(shù)據(jù)庫來存儲海量數(shù)據(jù),對于規(guī)模很小的店鋪或個人創(chuàng)業(yè)等,可以借助電商平臺如淘寶指數(shù),或利用數(shù)據(jù)庫軟件如Oracle,SQL Server,IBM DB2,MySQL等,來存儲和有組織的管理各種網(wǎng)站流量數(shù)據(jù)和客戶購物交易數(shù)據(jù)。數(shù)據(jù)平衡是結(jié)合每個企業(yè)自身實際,規(guī)劃設(shè)計數(shù)據(jù)表的特點和結(jié)構(gòu)。很多情況下數(shù)據(jù)的質(zhì)量難以保證,充分的數(shù)據(jù)探測是為了了解數(shù)據(jù)的分布、變化趨勢和數(shù)據(jù)關(guān)系。

12、將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化可理解的、可用的結(jié)構(gòu)化數(shù)據(jù),即對應(yīng)的分布與統(tǒng)計信息,有助于全面了解數(shù)據(jù)特征,并建立客戶購物關(guān)聯(lián)挖掘模型。3.數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理有助于為客戶購物關(guān)聯(lián)分析提供高質(zhì)量的數(shù)據(jù)?,F(xiàn)實中數(shù)據(jù)大體上是不完整的、不一致的臟數(shù)據(jù),無法直接進行關(guān)聯(lián)分析,需要進行清理、集成、變換和歸約,來糾正各種數(shù)據(jù)質(zhì)量問題,否則可能會影響客戶購物關(guān)聯(lián)分析得到的結(jié)果。4.數(shù)據(jù)建模(挖掘)對于電商平臺的客戶購物關(guān)聯(lián)分析需要選擇關(guān)聯(lián)規(guī)則方法,結(jié)合商務(wù)智能分析軟件如WEKA、SQL Server、IBM cognis等對相應(yīng)的數(shù)據(jù)進行挖掘分析。5.結(jié)果評估關(guān)聯(lián)分析后會輸出許多模式,對相關(guān)模式的合理性進行測試和評估是

13、必要的。企業(yè)認可的與消費者認可的結(jié)果不一定相同,甚至可能是相悖的。這個階段與業(yè)務(wù)人員的充分溝通、比對網(wǎng)站的交易數(shù)據(jù)是保證其效用最大化的有效途徑。6.應(yīng)用部署將分析的關(guān)聯(lián)結(jié)果應(yīng)用到商務(wù)決策中,在客戶關(guān)系管理、個性化推薦、商品營銷、提高轉(zhuǎn)化率等方面,制定具體的、可執(zhí)行的、可管控的戰(zhàn)略實施計劃,以產(chǎn)生經(jīng)濟效益。三、淘寶商務(wù)平臺數(shù)據(jù)分析淘寶商務(wù)平臺中的數(shù)據(jù),信息量巨大,結(jié)構(gòu)復(fù)雜,類型眾多。對購物數(shù)據(jù)的分析,不再局限于商品名稱、商品類型、商品價格和交易時間,也包括購買商品的客戶信息。很多商家只是把這些交易信息當(dāng)作一個展示頁面,但基于交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘還是不夠深入,缺乏專業(yè)的挖掘工具和分析工具以及專業(yè)

14、的分析人員對這些信息的潛在性進行挖掘和分析。(一)分析對象淘寶商務(wù)平臺中的商品品種繁多,價格相對便宜,支付方便,易于消費者選購,深受廣大網(wǎng)絡(luò)消費者的歡迎,淘寶中的客戶購物數(shù)據(jù)龐大,關(guān)聯(lián)性高,蘊含的信息多。所以本文選取淘寶商務(wù)平臺中305個用戶在淘寶天貓超市中交易記錄,來挖掘潛在的、有價值的信息。首先可以利用圖表看一下這些記錄展示出來的數(shù)據(jù)信息。圖2 性別分布餅圖圖3 職業(yè)分布柱狀圖由圖2、圖3可以得出,天貓的消費人群與淘寶網(wǎng)相比,更偏女性化,即女性消費者占比更高;學(xué)生群體消費比重大,可以看出目前網(wǎng)絡(luò)消費者總體較為年輕;消費人群學(xué)歷水平整體較高。圖4 購買類目柱狀圖從購買類目上看,購買進口食品的

15、可能性值是30.3%,購買食品飲料的可能性值是83.33%,購買油糧副食的可能性值是15.15%,購買美容洗護的可能性值是42.42%,購買家具家電的可能性值是9.09%,購買家庭清潔的可能性值是42.42%,購買母嬰用品的可能性值是3.03%,購買生鮮水果的可能性值是10.61%,食品飲料、美容洗護、家庭清潔排在前三位,這與調(diào)查人群中女性占比例大,學(xué)生、家庭主婦、白領(lǐng)職業(yè)分布比重高有很大的關(guān)系。圖5 購買原因柱狀圖在購買原因中,價格優(yōu)惠的認可度是5.38,物流速度快的認可度是4.8,質(zhì)量保障的認可度是4.44,品種豐富的認可度是4.26,配送范圍廣的認可度是2.2,優(yōu)惠促銷活動豐富的認可度是

16、2.14,支付方式完善的認可度是1.2,包裝規(guī)范的認可度是1,其他的認可度是0.83,運費便宜的認可度是0.76。由此說明價格、物流、商品質(zhì)量、品種數(shù)量等因素對客戶購買決策的影響很大。圖6 受吸引的優(yōu)惠活動柱狀圖對消費者而已,最受吸引的優(yōu)惠活動中,直接打折降價吸引度為66.67%,限時搶購、低價秒殺吸引度為45.45%,團購吸引度為28.79%,積分兌換券、抵用券吸引度為25.76%,滿指定金額包郵、禮品卡和購買得贈品吸引度為24.24%,名品特賣吸引度為19.7%,抽獎和其他吸引度為6.06%。直接打折降價雖然是比較傳統(tǒng)的優(yōu)惠活動,消費者尤其是女性消費者會對這類活動樂此不疲,所以淘寶商務(wù)平臺

17、經(jīng)常會在各種節(jié)假日開展優(yōu)惠活動。以上是部分展示出來的數(shù)據(jù)信息,這些數(shù)據(jù)信息比較單一,為商家的決策提供的價值有限,無法提供更深層次的、隱藏的信息,所以需要通過關(guān)聯(lián)分析將企業(yè)面臨的業(yè)務(wù)問題和研究的分析框架相結(jié)合,推導(dǎo)出具有實用價值的結(jié)論。(二)數(shù)據(jù)準備代寫各專業(yè)碩博學(xué)位論文,代寫代發(fā)CSSCI、北大核心論文,合作加QQ:97079517、 97079518 ; 微 電同號:1580 1280 825。淘寶交易,安全無憂。CSSCI來源期刊:電子政務(wù)、漢語學(xué)習(xí)、會計與經(jīng)濟研究、現(xiàn)代中文學(xué)刊、甘肅行政學(xué)院學(xué)報、天津體育學(xué)院學(xué)報民族學(xué)刊、大學(xué)教育科學(xué)、金融論壇、南方經(jīng)濟、東北亞論壇、寧夏社會科學(xué)、法商研

18、究、云南社會科學(xué)、人文雜志、甘肅社會科學(xué)、東北大學(xué)學(xué)報、自然資源與環(huán)境。審稿周期:35-90天辦結(jié)查稿。北大核心期刊:西安理工大學(xué)學(xué)報、心理與行為研究、統(tǒng)計與信息論壇、人口與發(fā)展、廣西民族大學(xué)學(xué)報.哲學(xué)社會科學(xué)版、南昌大學(xué)學(xué)報理科版、現(xiàn)代法學(xué)、江西財經(jīng)大學(xué)學(xué)報、武漢金融、學(xué)校黨建與思想教育、成人教育、中國科技翻譯審稿周期:35-90天辦結(jié)查稿。普刊:中國新通信、蘭臺內(nèi)外、中國多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報、農(nóng)村科學(xué)實驗、今日財富、心血管外科中國結(jié)合醫(yī)學(xué)、經(jīng)貿(mào)實踐、語文課內(nèi)外、記者觀察、新課程、現(xiàn)代職業(yè)教育、建筑與裝飾、畜牧獸醫(yī)科學(xué)、化工管理、魅力中國、人力資源管理、新教育時代、心理月刊等300多家國家級

19、、省級普刊。審稿周期:1-7天辦結(jié)查稿。將原始數(shù)據(jù)中與客戶特征、使用情況等信息保存為用戶信息表(tb_user),與購買商品有關(guān)的保存為商品購買表(tb_good),以O(shè)racle數(shù)據(jù)庫為載體記錄相關(guān)表格。兩表的部分信息如下:表1 用戶信息表編號字段字段解釋1id序號2ip用戶IP3sex性別4age年齡5education受教育程度6vocation職業(yè)7icome月收入或生活費8frequency最近三個月購物的總次數(shù)9cost平均每次購物的總花費表2 商品購買表編號字段字段解釋1id序號2ip用戶IP3import_milk進口牛奶4import_cookie進口餅干/糕點(三)數(shù)據(jù)處理

20、原始的數(shù)據(jù)通常由于主、客觀原因,會包含異常數(shù)據(jù)、錯誤數(shù)據(jù)或重復(fù)數(shù)據(jù),是不能直接進行關(guān)聯(lián)分析的,因此必須進行數(shù)據(jù)預(yù)處理。1.數(shù)據(jù)選擇首先是篩選用戶信息表,用戶的性別、年齡、受教育程度、月收入或生活費、最近三個月購物的總次數(shù)、平均每次購物的總花費等屬性,這些屬性能夠預(yù)測顧客的購買行為,對推薦產(chǎn)生作用;而次要屬性比如序號,用戶IP等屬性對于統(tǒng)計分析是必要的,但是關(guān)聯(lián)分析可以刪除。對于商品購買表,客戶購買的產(chǎn)品涉及50種,要從中選取出購買頻率高的前10位產(chǎn)品,所以先做一個簡單的統(tǒng)計,然后篩選下能夠進行關(guān)聯(lián)分析的購買相對較多的產(chǎn)品。選擇后兩表的字段如下:表3 數(shù)據(jù)選擇后用戶信息表編號字段字段解釋1sex

21、性別2age年齡3education受教育程度4icome月收入或生活費5frequency最近三個月購物的總次數(shù)6cost平均每次購物的總花費7reason選擇在這購物的理由8campaign最喜歡的優(yōu)惠活動9way下單方式10satisfaction滿意度表4 數(shù)據(jù)選擇后商品購買表編號字段字段解釋1import進口零食2sweet糖果/巧克力3drink飲料/水4protein肉類/豆干制品5cookie餅干糕點6milk牛奶乳品7nut堅果炒貨8washing個人洗護9tissue紙制品/衛(wèi)生紙10fruit水果2.數(shù)據(jù)清理數(shù)據(jù)清理以提高數(shù)據(jù)質(zhì)量為目標,將數(shù)據(jù)質(zhì)量提高到挖掘技術(shù)所要求的水

22、平。去掉不完整的數(shù)據(jù)和噪聲數(shù)據(jù),提高數(shù)據(jù)挖掘結(jié)果的質(zhì)量。例如將一行記錄中全是空值的記錄,殘缺的記錄去除,以方便進行數(shù)據(jù)挖掘。清理后最終留下300條記錄。3.數(shù)據(jù)轉(zhuǎn)換主要是對數(shù)據(jù)進行規(guī)格化操作,來適應(yīng)關(guān)聯(lián)分析工具和相應(yīng)的算法。常用的開源挖掘工具如WEKA、RapidMiner、NLTK、Orange等,需要將字符集轉(zhuǎn)換為英文,否則可能出現(xiàn)亂碼的情況。常見的關(guān)聯(lián)規(guī)則算法,如Apriori 算法是布爾類型的算法,原始數(shù)據(jù)表格中所使用的字段,數(shù)據(jù)類型不一的,需要進行轉(zhuǎn)化成相應(yīng)的布爾類型:(1)量化屬性離散化:對于數(shù)值類型的屬性,需要進行離散化處理,先進行最大最小值統(tǒng)計,對于如果最大值是離群點,可以選擇

23、相對正常的較高值作為最大值,再劃分為幾個區(qū)間。例如用戶信息表中的“月收入或生活費、最近三個月購物的總次數(shù)、平均每次購物的總花費”字段就是數(shù)值屬性。根據(jù)取值的分布規(guī)律,我們將月收入或生活費其劃分為五個組,分別是0-1500(1)、1501-3000(2)、3001-5000(3)、5001-10000(4)和10001-20000(5)。將最近三個月購物的總次數(shù)分成三個組,分別是0-2次(1),3-5次(2),5次以上(3),將平均每次購物的總花費分成6個組,分別是50元及以下(1),51-100元(2),101-300元(3),301-500元(4),501-1000元(5),1000元以上(

24、6)。(2)類別屬性轉(zhuǎn)化:用戶戶信息表中的“性別”字段,需要轉(zhuǎn)化為M(男)和F(女)這樣的布爾型;“受教育程度”可分為college(大專及以下)、undergraduate(本科);“選擇在這購物的理由”可分為price(價格優(yōu)惠)、pay(支付方式完善)、logistics(物流速度快)、quality(質(zhì)量保障)、variety(品種豐富)、promotion(優(yōu)惠促銷活動豐富)?!白钕矚g的優(yōu)惠活動、下單方式、滿意度”三個字段按照以上方式依次進行類別布爾轉(zhuǎn)換。對于商品購買表,需要處理為布爾矩陣格式,即每行表示一條交易記錄,列中的yes/no值表示這條記錄中顧客是否購買了該商品,并不考慮各

25、個商品自身的價格、購買單位等。最終完成轉(zhuǎn)化的表部分數(shù)據(jù)如下:圖7 數(shù)據(jù)轉(zhuǎn)化后用戶信息表圖8 數(shù)據(jù)轉(zhuǎn)化后商品購買表(四)關(guān)聯(lián)挖掘本文將使用挖掘工具WEKA來進行關(guān)聯(lián)挖掘。WEKA的全名是懷卡托智能分析環(huán)境,是一款開源數(shù)據(jù)挖掘軟件,集合了大量數(shù)據(jù)挖掘算法和數(shù)據(jù)處理功能,關(guān)聯(lián)規(guī)則是其中典型的一種。點擊啟動運行WEKA軟件后,發(fā)現(xiàn)WEKA存儲數(shù)據(jù)的格式是ARFF文件。除了ARFF格式,WEKA還支持另外一種常見格式,CSV格式。而對于保存在數(shù)據(jù)庫中的數(shù)據(jù),WEKA支持JDBC訪問數(shù)據(jù)庫。具體的挖掘過程如下:1.導(dǎo)入數(shù)據(jù)環(huán)境:(1)主機:Weka 3.8,PL/SQL,ojdbc14.jar(2)VMw

26、are Workstation:Oracle11g連接步驟:(1)安裝weka軟件,完成后將oracle的架包ojdbc14.jar放到weka安裝目錄(D:/Program Files/Weka-3-8/)下;(2)打開D:/Program Files/Weka-3-8/weka.jar這個文件,修改文件weka.jar-weka-experiment-DatabaseUtils.props.oracle ,指定虛擬機中的oracle數(shù)據(jù)庫為連接的jdbc,設(shè)置相應(yīng)的數(shù)據(jù)庫的URL、端口號和數(shù)據(jù)庫名:“jdbcURL=jdbc:oracle:thin:192.168.163.3:1521:X

27、E”,然后將文件另存為DatabaseUtils.props,刪除安裝目錄下的原文件。(3)打開D:/Program Files/Weka-3-8/目錄下的runweka.ini 文件,找到最后一行,設(shè)置環(huán)境變量:cp=%CLASSPATH%;D:/Program Files/Weka-3-8/lib/ojdbc14.jar。(4) 重新啟動weka,選擇進入Explorer應(yīng)用,以O(shè)pen DB方式載入SQL-Viewer界面,此時Connection-URL文本框中已經(jīng)自動設(shè)置為DatabaseUtils.props中的值“jdbc:oracle:thin:192.168.163.3:15

28、21:XE”,點擊User按鈕,設(shè)置數(shù)據(jù)庫連接的Username和Password,分別為HR和123456。如圖9所示圖9 數(shù)據(jù)庫連接配置點擊OK后連接,如果連接成功,Info下會顯示提醒信息。(5)在Query窗口中根據(jù)查詢需要輸入SQL語句“select * from tb_user”和“select * from tb_good”,點擊“Execute”按鈕執(zhí)行,可在“Result”框下看到對應(yīng)的表格數(shù)據(jù)。如圖10所示圖10 查詢的結(jié)果集(6)點擊“OK”按鈕即可導(dǎo)入。如圖11所示圖11 數(shù)據(jù)導(dǎo)入完成2.關(guān)聯(lián)規(guī)則分析作關(guān)聯(lián)規(guī)則的分析,將WEKA切換到“Associate”選項卡。可選擇

29、的算法有Apriori、FilteredAssociator、FPGrowth,默認使用Apriori算法。如果發(fā)現(xiàn)該算法呈現(xiàn)灰色不能點擊,可能是數(shù)據(jù)不符合類型,需要重新調(diào)整數(shù)據(jù)。 關(guān)聯(lián)規(guī)則是形如L-R的規(guī)則,它的重要指標支持度(Support)和置信度(Confidence),描述了其有用性和確定性。對于客戶購物關(guān)聯(lián)分析來說,支持度s(L-R)就是購買了一些商品中同時觀察到商品L和R的概率,而置信度就是所有購買了L商品的記錄中時L和R的同時存在的概率。支持度和置信度都較高的規(guī)則實用價值比較高。Apriori算法的基本思想是先設(shè)置最小支持度和最小置信度,通過對n條記錄產(chǎn)生候選頻繁項集進行支持度

30、和置信度進行計算,將滿足最小支持度和最小置信度的項集保留下來,作為新的記錄,再次產(chǎn)生候選頻繁項集。通過迭代,最后記錄中所有滿足要求的頻繁項集就是關(guān)聯(lián)規(guī)則。點擊“Choose”右邊的文本框修改默認的參數(shù),計劃挖掘出最小支持度(lowerBoundMinSupport)為20%,并且最小置信度(minMetric)為90%的關(guān)聯(lián)規(guī)則。將“metricType”設(shè)為confidence,其他參數(shù)不變。如圖12所示圖12 支持度、置信度設(shè)置點擊“start”得到結(jié)果如下:圖13 用戶信息關(guān)聯(lián)結(jié)果圖14 商品購買關(guān)聯(lián)結(jié)果(五)關(guān)聯(lián)結(jié)果分析Apriori算法的參數(shù),設(shè)置最小支持度為20%,最小項集大小為0

31、,這兩項值可根據(jù)實際情況進行設(shè)置。通過關(guān)聯(lián)規(guī)則算法找到了那些頻繁項目集,每一條對應(yīng)的可得到的結(jié)論為:1.用戶信息表(1)性別為女,購買頻率在0-2次的人,下單方式為手機的概率為100%;(2)性別為女,喜愛的優(yōu)惠活動為直接打折降價的人,下單方式為手機的概率為100%;(3)喜愛的優(yōu)惠活動為直接打折降價的人,下單方式為手機的概率為98%;(4)購買頻率在0-2次,喜愛的優(yōu)惠活動為直接打折降價的人,下單方式為手機的概率為97%;(5)受教育程度為本科,喜愛的優(yōu)惠活動為直接打折降價的人,下單方式為手機的概率為97%;(6)平均每次在天貓超市購物的總花費為51-100元的人,下單方式為手機的概率為97

32、%;(7)購買頻率在0-2次的人,下單方式為手機的概率為96%;(8)滿意度為“基本能滿足”的人,下單方式為手機的概率為95%;(9)受教育程度為本科,購買頻率在0-2次的人,下單方式為手機的概率為95%;(10)性別為女,下單方式為手機的概率為92%;2.商品購買表(1)購買了肉類/豆干制品并且購買了水果的人,會購買紙制品/衛(wèi)生紙的概率為99%;(2)購買了肉類/豆干制品、餅干糕點和水果的人,會購買紙制品/衛(wèi)生紙的概率為98%;(3)購買了進口零食并且購買了個人洗護的人,會購買肉類/豆干制品的概率為95%;(4)購買了糖果/巧克力、肉類/豆干制品和堅果炒貨的人,會購買餅干糕點的概率為93%;

33、(5)不購買飲料/水但購買肉類/豆干制品和紙制品/衛(wèi)生紙的人,會購買餅干糕點的概率為91%;(6)購買了肉類/豆干制品、牛奶乳品但沒有購買水果的人,會購買堅果炒貨的概率為91%;(7)購買了糖果/巧克力和肉類/豆干制品的人,會購買餅干糕點的概率為91%;(8)購買了糖果/巧克力但沒有飲料/水的人,會購買餅干糕點的概率為91%。這些結(jié)論和目前已經(jīng)得到日??蛻糍徺I的情況是一致的,可以作為重要參考,這證明了關(guān)聯(lián)規(guī)則算法在淘寶商務(wù)平臺客戶購物中的有效性。四、淘寶商務(wù)平臺中的關(guān)聯(lián)規(guī)則應(yīng)用(一)客戶分析根據(jù)關(guān)聯(lián)結(jié)果,找出顧客群體的特征,依據(jù)特征,進行客戶細分,實現(xiàn)精準營銷。表5 客戶特征組合表編號客戶特征

34、1女、0-2次、手機下單2女、直接打折降價、手機下單3直接打折降價、手機下單40-2次、直接打折降價、手機下單5本科、直接打折降價、手機下單651-100元、手機下單70-2次、手機下單8“基本能滿足”、手機下單9本科、0-2次、手機下單10女、手機下單根據(jù)以上特征可以對營銷策略做出幾點改進:(1)提高顧客的購買興趣。由關(guān)聯(lián)結(jié)果可知購買頻率在0-2次,每次花費在51-100元的女性顧客通過手機下單的概率高,為了提高購買頻率和刺激顧客的購買興趣,可以對這些購買頻率低的顧客推送一些快速瀏覽、即興需求的并且有優(yōu)惠活動的商品,以適應(yīng)移動端購物的特點?!爸苯哟蛘劢祪r”能直接的利用顧客對價格的敏感心理,促

35、使顧客做出購買的決定。像特價只剩24小時!這樣的限期供應(yīng),能夠幫助激發(fā)消費者的購買欲。但是要真實,否則最終失去消費者信任。(2)讓顧客能較長時間的停留瀏覽商品。客戶群體中女性占比大,學(xué)生、家庭主婦較多,這就不僅僅是標題的是否吸引人的問題。在這里針對她們的購買習(xí)慣,對商品詳情的描述非常關(guān)鍵,要盡量采用實地拍攝的商品圖片,少用官方圖片,以提高顧客對商家的信任度;還要有詳細的文字說明,不能幾個字草草了事;對于商品屬性和規(guī)格的描述要盡可能的詳細;使用相關(guān)模板并利用Photoshop對圖片進行編輯等,以提高其美觀度來吸引顧客的眼球。(3)讓新顧客變成老顧客。事實證明,網(wǎng)店留住老顧客比開發(fā)新顧客要重要的多

36、,前者的成本也要遠低于后者。這里要充分利用顧客的情感,讓顧客感覺到一絲溫馨。比如在發(fā)貨時,根據(jù)商品搭配一個小禮品,給顧客一個驚喜;在節(jié)假日,通過短信、郵件等工具送去溫馨的祝福,同時可以根據(jù)顧客的消費頻率和每次消費金額分組,“VIP客戶、黃金客戶、普通客戶”等,給予不同的優(yōu)惠待遇,以此來加深與顧客的關(guān)系,增加顧客對網(wǎng)店的認可度和忠誠度。(二)商品營銷由以上對商品購買的關(guān)聯(lián)規(guī)則分析結(jié)果,對商品營銷做出改進,可以從以下幾個方面入手:1.商品目錄商品目錄包括全面的導(dǎo)航條和相關(guān)產(chǎn)品展示。對于淘寶商務(wù)平臺中的天貓超市,它將進口食品和食品飲料放在導(dǎo)航區(qū)的上端、訪問頻率高的位置是合理的。收集的數(shù)據(jù)中購買前10

37、名的多為食品類,并且進口食品和食品飲料一起購買的概率在90%以上。對于相關(guān)產(chǎn)品展示區(qū),一般的食品類店鋪可以將牛奶、餅干、肉類/豆干制品等顧客愿意購買的組合放在典型商品展示區(qū)。2.商品廣告有效的廣告投入可以增加網(wǎng)站的瀏覽量,從而幫助提高銷售額。在淘寶網(wǎng)首頁鉆展展示區(qū)可以投放店鋪活動、品牌宣傳,例如強調(diào)主打的肉類/豆干制品、餅干糕點、糖果/巧克力等熱賣商品正在搞活動;而類似小圖、旺旺彈窗小圖等站位,可以做單品、新品宣傳,建議是熱賣種類里面的具體商品,例如糖果/巧克力種類里面具體的熱賣的費列羅巧克力在打折,可以單獨為其投放廣告,帶來可靠回報的概率大。3.交叉銷售商品的低位定價策略在電子商務(wù)低成本的環(huán)

38、境下并不一定一直有效,需要配合其他的銷售策略一起實施。交叉銷售就是在客戶購買了一種商品,向其推薦他具有潛在購買欲望的商品。關(guān)聯(lián)規(guī)則發(fā)現(xiàn)了客戶隱藏的購買需求,這些交叉銷售的組合有:表6 商品銷售組合表編號銷售組合1肉類/豆干制品、水果、紙制品/衛(wèi)生紙2肉類/豆干制品、餅干糕點、水果、紙制品/衛(wèi)生紙3進口零食、個人洗護、肉類/豆干制品4糖果/巧克力、肉類/豆干制品、堅果炒貨、餅干糕點5肉類/豆干制品、紙制品/衛(wèi)生紙、餅干糕點6肉類/豆干制品、牛奶乳品、堅果炒貨7糖果/巧克力、肉類/豆干制品、餅干糕點8糖果/巧克力、餅干糕點在促銷時將類似“肉類/豆干制品+餅干糕點”的組合放在一起,一起打折,或者買一

39、贈一。即使本來客戶打算只買肉類/豆干制品這一種商品,但看見餅干糕點同時在促銷時,也會超出預(yù)想清單,實施購買。在這些關(guān)聯(lián)規(guī)則中,也會發(fā)現(xiàn)一些有趣的組合,如“肉類/豆干制品、水果、紙制品/衛(wèi)生紙”,分析可知,紙制品與食品同時購買,一方面是消費者享用食物時會需要紙巾清理垃圾,另一方面為了湊滿88元包郵,消費者會選擇使用期限較長,不會變質(zhì)的商品來湊單,所以在零食類商品打折促銷時,將紙制品類商品以一個小于零食類商品打折幅度的折扣進行優(yōu)惠,就會滿足消費者湊單的需求。這些生動化的商品組合,不僅減輕了顧客的選擇顧慮,同時提升了客單量,增強了用戶粘性。五、結(jié)論本文基于關(guān)聯(lián)規(guī)則,根據(jù)客戶購物關(guān)聯(lián)分析的一般過程對采

40、集的數(shù)據(jù)進行有針對性的分析,并將提取到的規(guī)則運用到電子商務(wù)的應(yīng)用中。由此可知,有效的電子商務(wù)數(shù)據(jù)關(guān)聯(lián)分析,能夠發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品之間的聯(lián)系強度,挖掘用戶潛在的購買模式,并將這些模式所對應(yīng)的服務(wù)或產(chǎn)品展示給用戶,為其提供參考,從而提高用戶的購買率和滿意度,增加了企業(yè)的競爭優(yōu)勢。本文的研究成果存在不足之處,還可以進一步完善,具體的體現(xiàn)在以下幾個方面:(1)由于電商數(shù)據(jù)的封裝性和自身條件的限制,本文的購物記錄為問卷調(diào)查所得,缺乏普遍性和時效性。在后期進一步研究中,將搜集更多實體數(shù)據(jù),并擴大數(shù)據(jù)量。(2)電子商務(wù)平臺可以收集到大量用戶相關(guān)的數(shù)據(jù),包括交易數(shù)據(jù)、注冊數(shù)據(jù)、評分數(shù)據(jù)、咨詢數(shù)據(jù)等。企業(yè)

41、的決策目標和約束往往是多因素的,如市場占有率、利潤、品牌、平臺等。本次實驗的算法只側(cè)重于交易數(shù)據(jù)和以增加銷售量為目標,比較片面??梢赃M一步的進行多維度、多粒度的整合關(guān)聯(lián)分析,得到的結(jié)果會比較全面,對企業(yè)和客戶的實用價值更高。(3)目前,WEKA的關(guān)聯(lián)分析功能僅能用來作為示范,不適合用來挖掘大型數(shù)據(jù)集,進一步的研究可以是通過云平臺等大型專業(yè)分析工具,對數(shù)據(jù)實施更深度、 更廣度的挖掘操作。 參考文獻1 王茁,顧潔.三位一體的商務(wù)智能M.北京:電子工業(yè)出版社,2002. 2 箭牌中國:精準預(yù)測嘗“甜”頭EB/OL.http:/ bcs/ solutions/bao/case.html.3 Dien

42、D Phan, Douglas R Vogel. A model of customer relationship management and business intelligence systems for catalogue and online retailersJ. Information & Management, 2010,47:69-77.4 陳暢偉.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘可視化系統(tǒng)的實現(xiàn)D.武漢:武漢理工大學(xué),2004.5 李國輝,張軍,湯義.挖掘技術(shù)直面多媒體-信息爆炸帶來新挑戰(zhàn)R.計算機世界報,2012(27):B1-B3.6 黃曉濤.電子商務(wù)導(dǎo)論M.北京:清華大學(xué)出版

43、社,2005. 7 趙艷霞,梁昌勇.基于關(guān)聯(lián)規(guī)則的推薦系統(tǒng)在電子商務(wù)中的應(yīng)用J.價值工程.2006,(5):6-7. 8 錢雪忠,孔芳.關(guān)聯(lián)規(guī)則挖掘中對 Apriori 算法的研究J.計算機工程與應(yīng)用.2008, (44):56-78.9 毛國君,段立娟. 數(shù)據(jù)挖掘原理與算法M.北京:清華大學(xué)出版社,2005.10 Michael J.A.Berry,Gordon S.Linoff數(shù)據(jù)挖掘M北京:中國財政經(jīng)濟出版社,2004. 11高宏賓,潘谷,黃義明.基于頻繁項集特性的 Apriori 算法的改進J.計算機工程與設(shè)計,2007,28(l0):2273-2275. 12 劉德喜,何炎祥,邢顯黎

44、.一種新的頻繁項集挖掘算法J.計算機應(yīng)用研究,2007,(2):17-19. 13王安,仇德成,安云峰,王繼偉.一種雙進的基于關(guān)系矩陣的關(guān)聯(lián)規(guī)則快速挖掘算法J.現(xiàn)代電子技術(shù),2007,(3):114-116. 14劉景春,王永利.適合在線式增量更新的關(guān)聯(lián)規(guī)則挖掘算法J.計算機工程與應(yīng)用,2004,(12):188-192. 15王瑋,陳思紅.關(guān)聯(lián)規(guī)則的相關(guān)性研究J.計算機工程,2012,26(7):33-36. 16王旭,劉明剛.關(guān)聯(lián)規(guī)則研究J.經(jīng)濟研究導(dǎo)刊,2010,(8):04-15. 17CHAU M, CHENG R, KAO B. Uncertain data mining: a n

45、ew research directionC. Proceedings of Workshop on the Sciences of the Artificial. Washington DC: IEEE Computer Society, 2005.199-204.18趙衛(wèi)東.客戶智能M.北京:清華大學(xué)出版社,2013. 19Ben J S, Joseph A K, John R. E-commerce recommendation applicationR. GroupLens Research Project, 2002.附錄附錄:原始數(shù)據(jù)注:表格數(shù)據(jù)量過多,無法將所有字段和記錄都列舉出

46、來,這里的原始數(shù)據(jù)僅展示部分數(shù)據(jù)。表頭字段依次為:序號、提交問卷時間、所用時間、來自IP、來源、您的性別、您的年齡、您的受教育程度、您的職業(yè)、您的收入或生活費、您最近三個月在天貓超市購物的總次數(shù)、您平均每次在天貓超市購物的總花費、進口食品、食品飲料、糧油副食、美容洗護、家具家電、家庭清潔、母嬰用品、生鮮水果、價格優(yōu)惠、品種豐富、質(zhì)量保障、配送范圍廣。表格記錄中的數(shù)字為問卷題目的選項序號,如您的性別這列中的1和2,分別表示男和女兩個選項,其他列以此類推。12017/5/6 0:36:32345秒117.136.66.156手機提交微信111333101000000123-222017/5/6 1

47、3:19:15283秒218.205.18.178手機提交微信21231121100000012-2-232017/5/6 13:23:04150秒117.60.102.39手機提交微信2123112110100002-2-2-242017/5/6 13:25:39243秒218.205.20.35手機提交直接訪問2123112010000001-2-2252017/5/6 13:28:52135秒183.206.158.14手機提交微信212321201010100123-262017/5/6 13:34:37223秒140.243.232.40手機提交微信21132-3-3-3-3-3-3

48、-3-3-3-3-2-2-2-272017/5/6 13:39:35150秒117.136.81.172手機提交微信131651300111100123-282017/5/6 13:41:05269秒117.136.79.143手機提交微信2123112010100001-22-292017/5/6 13:41:48100秒112.23.83.114手機提交微信22232120101000012-2-2102017/5/6 13:42:38128秒180.99.65.49手機提交微信222231301000000-221-2112017/5/6 13:43:19143秒112.3.149.19

49、1手機提交微信2315122011101011-2-2-2122017/5/6 13:45:52116秒101.88.64.122手機提交微信221733201100100-2-21-2132017/5/6 13:47:00788秒49.82.197.180手機提交微信122312301010100321-2142017/5/6 13:48:52164秒117.136.79.143手機提交微信122311311000100-2-2-23152017/5/6 13:50:21722秒36.149.176.139手機提交微信2317212000001003-212162017/5/6 14:00:

50、36289秒36.149.229.217手機提交微信211211110000000123-2172017/5/6 14:13:48467秒49.92.121.236手機提交直接訪問1226513011000002-2-2-2182017/5/6 14:25:04154秒183.206.136.28手機提交微信211222311100100-212-2192017/5/6 14:41:36149秒36.5.9.196手機提交直接訪問212312100000001-231-2202017/5/6 14:45:06278秒122.96.42.130手機提交微信2123213010000001-2-2

51、-2212017/5/6 14:45:59263秒36.149.216.81手機提交微信212311201011100-212-2222017/5/6 15:01:57482秒36.149.48.22手機提交微信231432200010110-2-2-22232017/5/6 15:13:291492秒180.102.116.175手機提交微信2113213100001001-23-2242017/5/6 16:26:34104秒121.238.244.101手機提交直接訪問2123113110100002-2-2-2252017/5/6 16:34:1081秒39.73.127.192手機提交直接訪問2123112011100001-2-2-2

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!