GOGO专业大尺度亚洲高清人体,清纯校花的被cao日常np,日本三级香港三级人妇99,亭亭玉立国色天香八戒,秋霞电影在线观看

200

web日志挖掘的信息無障礙網站設計研究

時間: 2013-06-20 15:49:59   點(dian)擊數: 67214   來(lai)源: 耐思智慧

免費會員注冊

0.引言

隨著信息技術和網絡技術的不斷發展,互聯網給現代人們獲取信息帶來極大的便利,成為人們工作生活中非常重要的組成部分。信息無障礙即萬維網對任何人士(包括殘障人士)都是可訪問、可用的,殘障人士能感覺、理解和操縱Web,與Web 互動。如何借助先進的技術,消除數字鴻溝,為殘疾人提供有效的輔助手段,使他們能和健全人一樣無障礙地獲取網上信息,得到世界各國政府和組織越來越多的重視。
1.信息無障礙網站存在的問題
很多部分實現了信息無障礙的網站,用戶每次訪問時,網站語音都得從頭到尾的播報網站內容,對于該用戶曾經訪問過本網站中部分頁面內容期刊網,系統不能自動過濾掉這些已經閱讀的內容,或者跳過這些已閱讀信息,而是依然按照布局順序重復播報。這對于閱讀障礙的用戶來說非常浪費時間和精力。避免重復瀏覽或者播報網站信息,將用戶曾經閱讀過的內容過濾掉,將沒有閱讀過的最新的感興趣的網頁內容優先播報給閱讀障礙用戶,提供智能化、個性化信息服務,是信息無障礙網站設計應該重視的問題。
2. web日志挖掘
web日志文件是在web服務器上每隔一定的時間產生的記錄文件,其內容包括訪問用戶的IP地址,訪問時間、訪問的頁面、頁面的大小、瀏覽器類型、響應狀態等等。web日志挖掘是對用戶訪問Web時服務器方留下的訪問記錄進行挖掘,得到用戶的訪問模式和訪問興趣。通過對Web站點的日志記錄進行預處理,將日志數據組織成傳統的數據挖掘方法能夠處理的事務數據形式,然后利用傳統的數據挖掘方法進行處理。
web日志預處理過程:
(1)數據收集 從服務器端數據、客戶端數據、代理服務器端進行。
(2)數據凈化 刪除Web日志文件中不是由用戶請求,而是由瀏覽器自動“請求”產生的訪問記錄。具體包括圖片和音頻文件、樣式文件和腳本文件、不是GET的HTTP方法、彈出式廣告的記錄等。
(4)會話識別 用戶在規定時間內對服務器的一次有效訪問,通過其連續請求的頁面,可以獲得其在網站中的訪問行為和瀏覽興趣,有4種識別會話的模型:頁面類型模型(page type model),參引長度模型(reference length model),最大前向參引模型(maximal forwordreference model)和時間窗口模型(time window model)。最常采用的是時間窗口模型,以用戶訪問時間作為劃分會話的分界,一般間隔時間取30min。
(5)路徑補充 用戶有時瀏覽的頁面,是從本地緩存和代理服務器中調用的,不會向Web服務器發送請求,也就不會記錄日志,而這些請求可能對后續挖掘的實施有重要作用期刊網,缺少這些頁面記錄可能會使挖掘結果不是很準確。為了能更精確的挖掘用戶的行為模式,有必要把這些缺失的路徑補充上去即路徑補充。如果當前請求的頁與用戶上一次請求的頁之間沒有超文本鏈接,那么用戶很可能使用了瀏覽器上的“BACK"按鈕調用緩存在本機中的頁面。如果用戶的歷史訪問記錄有多個頁面都包含與當前請求頁的鏈接,則將請求時間最接近的Web頁的頁面作為當前請求的來源。
3.基于web日志挖掘的網站設計
3.1網站設計架構
網站為每位存在訪問障礙的用戶建立網站訪問記錄數據庫,用戶訪問網站頁面,產生web日志文件,通過對web站點日志文件進行數據凈化、用戶識別、會話識別,將有用數據存入事務數據庫,對該用戶訪問過的頁面進行相應標記,再對事務數據庫進行傳統的數據挖掘,分析出該用戶比較感興趣的信息類型,為該用戶對網站所有類型信息構造優先顯示頁面類型序列表和對每類信息未訪問頁面、已訪問頁面分別構造優先序列表,當該用戶再次訪問網站時利用離線分析所得的優先序列表和網站文件映射數據庫將網頁鏈接按照用戶興趣高低動態填充到網站導航框架,這樣用戶最感興趣類型的網頁鏈接總是弄夠最先看到、聽到,從而達到優先訪問的目的。
網站設計框架如下圖:
圖1 信(xin)息無障礙網站設(she)計框架
3.2 網站導航
網站導航是根據信息無障礙網站結構布局設計標準所設計的網站通用布局框架,除了包括信息無障礙要求的導航磚,通用切換等功能,還將頁面設計成由幾個通用的布局框架模塊組成,每個框架模塊將顯示網站上某一種類型的網頁信息鏈接,具體網頁鏈接內容則根據序列表先后順序動態填充。網站所包含的信息類型可以有很多,但在網站導航中只列出用戶最感興趣的幾種類型的網頁鏈接,隨著用戶興趣的改變,其他類型的網頁鏈接將動態的填充到相應級別的框架模塊中。
3.3 興趣提取
根據用戶瀏覽的歷史訪問記錄(內容信息和行為信息)、訪問時間和訪問頻率等來分析計算用戶興趣度,用戶的興趣一般集中于某一個主題或者多個主題期刊網,系統在通過聚類進行分析將用戶瀏覽的歷史頁面集自動地分成n個聚簇(n是聚類中聚類中心的數目),每一聚簇的頁面集體現了用戶的某類興趣,構造形成用戶的興趣類。再利用用戶的隱式信息學習提取用戶興趣集,建立樹狀的用戶興趣模型。
3.4 序列模式
序列模式挖掘是對關聯規則挖掘的進一步推廣,它挖掘出序列數據庫中項集之間的時序關聯規則。關聯規則強調的是兩個項之間的關聯,序列模式則加強調兩者之間的先后次序。這里我們將挖掘出兩種序列表:類型序列表和頁面序列表。類型序列表是通過對歷史訪問記錄進行挖掘統計出來的網站每種類型信息訪問優先等級,是一組有序項集對應表;頁面序列表則是以類型挖掘權值和更新時間2個指標得出的頁面訪問有序集對應表。可以采用基于Apfiori算法的改進算法進行挖掘得到上述兩種序列表。
3.5 序列-頁面映射
根據挖掘得到的序列模式對網站的靜態頁面文件進行一一映射,按照興趣高低和文件序列先后動態的填充如網站導航模塊框架中。
4.結束語

本文所提(ti)出對(dui)(dui)web日志文件挖掘(jue)提(ti)取用戶(hu)的興趣類(lei)和訪問(wen)(wen)類(lei)型和頁(ye)面(mian)優先序列,重構站點頁(ye)面(mian)之間(jian)的鏈接(jie)關(guan)系,動(dong)態顯(xian)示(shi)網(wang)頁(ye)信(xin)息(xi)的設計框架,以(yi)適應有障(zhang)礙(ai)用戶(hu)的訪問(wen)(wen)興趣習(xi)慣為主要目(mu)標,在一定程度上可以(yi)避免反復無用的頁(ye)面(mian)瀏(liu)覽和語音播(bo)報所造成的對(dui)(dui)存在訪問(wen)(wen)障(zhang)礙(ai)用戶(hu)產(chan)生的困擾和時間(jian)精力的浪費,提(ti)高(gao)了訪問(wen)(wen)效率,為消(xiao)除信(xin)息(xi)鴻溝,真正做(zuo)到信(xin)息(xi)人人共享發揮積極的作用。

更多網站(zhan)建(jian)設資料:

Microsoft SQL Server Management Studio 如何導入導出數據
國內社交網站創新研究及網站盈利模式
如何去建立一個好的網站
傳統文化網頁設計編排重點
電子商務網站建設規劃
上一篇:網站建設的本質意義是什么,企業為什么要建設公司網站? 下一篇:Microsoft SQL Server Management Studio 如何導入導出數據

旗下網站:耐思智慧 - - - 中(zhong)文(wen)域名:

耐(nai)思(si)智慧 © 版權(quan)所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved

備案號碼:   公安備案號: 公安備案

聲(sheng)明:本網站中(zhong)所使用到的其他各(ge)種版(ban)權(quan)內(nei)容,包括(kuo)但不限于(yu)文(wen)章、圖片、視頻(pin)、音(yin)頻(pin)、字體等(deng)內(nei)容版(ban)權(quan)歸原作者(zhe)所有,如(ru)權(quan)利所有人發現(xian),請及時告知,以(yi)便(bian)我們(men)刪(shan)除版(ban)權(quan)內(nei)容

本站程序界面、源代碼受(shou)相關法律保護, 未經授(shou)權, 嚴(yan)(yan)禁使用(yong); 耐思智(zhi)慧 © 為我公(gong)司注冊(ce)商標, 未經授(shou)權, 嚴(yan)(yan)禁使用(yong)

法律顧問: