Web數(shù)據(jù)挖掘在電子商務中的應用.
[摘要] 電子商務網(wǎng)站天天都會產生大量的數(shù)據(jù),運用數(shù)據(jù)挖掘技術可以從這些數(shù)據(jù)中發(fā)現(xiàn)對市場分析及猜測非常有益的信息。本文討論了Web數(shù)據(jù)挖掘技術在電子商務中的應用。[關鍵詞] 數(shù)據(jù)挖掘Web數(shù)據(jù)挖掘電子商務
網(wǎng)絡技術和數(shù)據(jù)庫技術飛速發(fā)展,電子商務顯示出越來越強大的生命力,同時各種基于互聯(lián)網(wǎng)的貿易Web站點也面臨越來越激烈的競爭。如何了解到顧客盡可能多的愛好和價值取向,為顧客提供更優(yōu)質的服務成為電子商務發(fā)展迫切要解決的題目。而電子商務網(wǎng)站的顧客在Web上的行為都會產生大量數(shù)據(jù)信息,不僅包括本次交易信息而且還有利用搜索引擎,以及在站點內進行瀏覽的相關數(shù)據(jù)。利用數(shù)據(jù)挖掘技術可以有效地幫助企業(yè)分析這些數(shù)據(jù),優(yōu)化Web站點拓撲結構,指導企業(yè)調整營銷策略,給客戶提供動態(tài)的個性化的高效率服務。
一、Web數(shù)據(jù)挖掘
Web數(shù)據(jù)挖掘(Web Data Mining),是數(shù)據(jù)挖掘技術在Web環(huán)境下的應用,是從大量的Web文檔集合和在站點內進行瀏覽的相關數(shù)據(jù)中發(fā)現(xiàn)潛伏的、有用的模式或信息。它是一項綜合技術,涉及到Internet技術、人工智能、計算機語言學、信息學、統(tǒng)計學等多個領域。對應于不同的Web數(shù)據(jù),Web挖掘也分成三類:Web內容挖掘、Web結構挖掘和Web使用模式挖掘。
Web使用模式挖掘(Web Usage Mining)是對用戶訪問Web時在服務器方留下的訪問記錄進行挖掘,它通過挖掘Web日志文件及客戶交易數(shù)據(jù)來發(fā)現(xiàn)有意義的用戶訪問模式和相關的潛伏用戶群。其主要特點是對用戶信息數(shù)據(jù)進行抽取、轉換、分析和其他模型化處理,從中提取輔助貿易決策的關鍵性數(shù)據(jù)。
盡管Web挖掘的形式和研究方向層出不窮,但隨著電子商務的興起和迅猛發(fā)展,Web挖掘的一個重要應用方向將是電子商務系統(tǒng)。電子商務是數(shù)據(jù)挖掘技術最恰當?shù)膽妙I域,由于電子商務可以很輕易滿足數(shù)據(jù)挖掘所必須的因素:豐富的數(shù)據(jù)源、自動收集的可靠數(shù)據(jù),并且可將挖掘的結果轉化成貿易行為,貿易投資可以及時評價。其中與電子商務關系最為密切的是Web使用模式挖掘。
二、電子商務中Web挖掘的數(shù)據(jù)源
在Web上可以用來作為數(shù)據(jù)挖掘分析的數(shù)據(jù)量比較大,而且類型眾多,總結起來有以下幾種類型的數(shù)據(jù)可用于Web數(shù)據(jù)挖掘技術產生各種知識模式。
1.服務器數(shù)據(jù)
客戶訪問站點時會在Web服務器上留下相應的日志數(shù)據(jù),這些日志數(shù)據(jù)通常以文本文件的形式存儲在服務器上。一般包括sever logs、error logs、cookie logs等。
2.查詢數(shù)據(jù)
它是電子商務站點在服務器上產生的一種典型數(shù)據(jù)。例如,對于在線客戶也許會搜索一些產品或某些廣告信息,這些查詢信息就通過cookie或是登記信息連接到服務器的訪問日志上。
3.在線市場數(shù)據(jù)
這類數(shù)據(jù)主要是傳統(tǒng)關系數(shù)據(jù)庫里存儲的有關電子商務站點信息、用戶購買信息、商品信息等數(shù)據(jù)。
4.Web頁面
主要是指HTLM和XML頁面的內容,包括本文、圖片、語音、圖像等。
5.Web頁面超級鏈接關系
主要是指頁面之間存在的超級鏈接關系,這也是一種重要的資源。
6.客戶登記信息
客戶登記信息是指客戶通過Web頁輸進的、要提交給服務器的相關用戶信息,這些信息通常是關于用戶的人口特征。在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問日志集成,以進步數(shù)據(jù)挖掘的正確度,使之能更進一步的了解客戶。
三、Web數(shù)據(jù)挖掘在電子商務中的應用
利用Web數(shù)據(jù)挖掘技術可以在站點上挖掘出來的知識模式有以下幾個:路徑分析、關聯(lián)規(guī)則的發(fā)現(xiàn)、序列模式的發(fā)現(xiàn)、分類規(guī)則的發(fā)現(xiàn)、聚類分析等。Web數(shù)據(jù)挖掘在電子商務中的具體應用有以下幾點:
1.發(fā)現(xiàn)潛伏客戶
用戶在網(wǎng)站上的瀏覽行為反映了用戶的愛好和購買意向。對一個電子商務網(wǎng)站來說,了解、關注在冊客戶群體非常重要,但從眾多的訪問者中發(fā)現(xiàn)潛伏客戶群體也同樣非常關鍵。假如發(fā)現(xiàn)某些客戶為潛伏客戶群體,就可以對這類客戶實施一定的策略使他們盡快成為在冊客戶群體。對一個電子商務網(wǎng)站來說也許就意味著訂單數(shù)的增多、效益的增加。
2.提供優(yōu)質個性化服務,進步客戶忠誠度
在電子商務中,傳統(tǒng)客戶與銷售商之間的空間間隔對客戶來說己經(jīng)不復存在,客戶從一個電子商務網(wǎng)站轉換到競爭對手那邊,只需點擊幾下鼠標即可。網(wǎng)站的內容和層次、用詞、標題、獎勵方案、服務等任何一個地方都有可能成為吸引客戶、同時也可能成為失往客戶的因素。通過對客戶訪問信息的挖掘,就能知道客戶的瀏覽行為,從而識別用戶的忠實度、喜好、滿足度,了解客戶的愛好及需求,動態(tài)地調整Web頁面以滿足客戶的需要。在Internet上的電子商務中一個典型的序列,恰好就代表了一個購物者以頁面形式在站點上導航的行為,所以可運用數(shù)據(jù)挖掘中的序列模式發(fā)現(xiàn)技術進行挖掘。
3.改進站點設計
對Web站點的鏈接結構的優(yōu)化可從三方面來考慮:
(1)通過對Web Log的挖掘,發(fā)現(xiàn)用戶訪問頁面的相關性,從而對密切聯(lián)系的網(wǎng)頁之間增加鏈接,方便用戶使用。
(2)利用路徑分析技術判定在一個Web站點中最頻繁的訪問路徑,可以考慮把重要的商品信息放在這些頁面中,改進頁面和網(wǎng)站結構的設計,增強對客戶的吸引力,進步銷售量。
(3)通過對Web Log的挖掘,發(fā)現(xiàn)用戶的期看位置。假如在期看位置的訪問頻率高于對實際位置的訪問頻率,可考慮在期看位置和實際位置之間建立導航鏈接,從而實現(xiàn)對Web站點結構的優(yōu)化。
4.聚類客戶
很多企業(yè)都對企業(yè)的客戶、市場、銷售、服務與支持信息進行深層次發(fā)掘和分析,對客戶價值進行分類,發(fā)現(xiàn)新的市場機會,增加收進和利潤。在電子商務中客戶聚類是一個重要的方面。通過分組具有相似瀏覽行為的客戶并分析組中客戶的共同特征,可以幫助電子商務的組織者更好地了解自己的客戶,及時調整頁面及頁面內容使商務活動能夠在一定程度上滿足客戶的要求,向客戶提供更適合、更面向客戶的服務,使商務活動對客戶和銷售商來說更具意義。
四、結束語
運用Web數(shù)據(jù)挖掘技術對電子商務網(wǎng)站上的各種數(shù)據(jù)源進行挖掘,發(fā)現(xiàn)相關的一些知識模式,可以指導企業(yè)更好地運作站點和向客戶提供更優(yōu)質的個性化的服務,有效進步貿易站點的競爭力。
【Web數(shù)據(jù)挖掘在電子商務中的應用.】相關文章:
Web數(shù)據(jù)挖掘在電子商務中的應用研究03-07
Web結構挖掘在電子商務網(wǎng)站結構優(yōu)化中的應用03-21
數(shù)據(jù)挖掘在旅游電子商務中應用論文11-28
談數(shù)據(jù)挖掘技術在電子商務中的應用03-21
Web 2.0技術在電子商務中的應用03-21