前幾天有個朋友在MSN里面問搜索引擎友好指的是(shi)什么,這是(shi)個涉及面(mian)挺寬的問題(ti),今天(tian)從幾方面(mian)談一下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘(zhi)蛛能不能找(zhao)到你的網頁?
要讓搜索引擎找(zhao)(zhao)到(dao)你的(de)(de)主(zhu)頁你就必須(xu)要有外部(bu)鏈接,在找(zhao)(zhao)到(dao)你的(de)(de)主(zhu)頁之后(hou),還必須(xu)能(neng)找(zhao)(zhao)到(dao)你的(de)(de)更深的(de)(de)內容(rong)頁,也(ye)就要求你要有良好的(de)(de)網站結構,符合邏輯,可(ke)能(neng)是一(yi)個(ge)扁平(ping)的(de)(de),可(ke)能(neng)是一(yi)個(ge)樹狀(zhuang)的(de)(de)。
而且(qie)這(zhe)些網頁之(zhi)間要(yao)有良好的鏈(lian)接(jie)結構,這(zhe)些鏈(lian)接(jie)以文字鏈(lian)接(jie)最好,圖像鏈(lian)接(jie)也可以,但(dan)是JavaScript鏈(lian)接(jie),下拉菜單(dan)鏈(lian)接(jie),flash鏈(lian)接(jie)等就會有問(wen)題。
一般(ban)推薦網站(zhan)需要(yao)有(you)一個網站(zhan)地(di)圖,把所有(you)重要(yao)的(de)欄(lan)目(mu)和網頁都列(lie)進(jin)去。如果網站(zhan)比較大(da),網站(zhan)地(di)圖還可以(yi)分成幾(ji)個。
網站的所有頁面都要能從主頁開始,順(shun)著鏈接找到,最好在3,4次(ci)點(dian)擊之內。
搜索引擎蜘(zhi)蛛找到網(wang)頁后能不能抓取網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘(zhi)蛛通常要遠離(li)這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在(zai)努力(li)想讀取flash信(xin)息,但目前為止收效(xiao)甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘(zhi)蛛的大敵。有(you)的時候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不能讀的(de)東西,像音頻(pin)文件,圖片,彈出窗口等。
搜索引擎蜘(zhi)蛛(zhu)抓取(qu)網頁之(zhi)后,怎樣提煉有用信息?
網頁的HTML碼(ma)必須很優化,也就是(shi)格式標(biao)簽占的越少越好,真(zhen)正內容占的越多越好,整個文(wen)件越小越好。把CSS,JavaScript等放在(zai)外部文(wen)件。
把關鍵詞放在應該出現的地方。
檢查網頁對不(bu)同(tong)(tong)操作系(xi)統,不(bu)同(tong)(tong)browser的兼容性(xing)。檢查是否符(fu)合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐(nai)思智慧 © 版權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明(ming):本網站中所使用到的其他各種版權(quan)內(nei)容,包括(kuo)但不限于文章、圖片(pian)、視頻(pin)、音(yin)頻(pin)、字(zi)體等內(nei)容版權(quan)歸原作者所有,如權(quan)利所有人發現,請及(ji)時告知,以(yi)便我們刪(shan)除版權(quan)內(nei)容
本站(zhan)程序界面、源代碼受相關法律保護(hu), 未經授(shou)權, 嚴禁使用; 耐思智(zhi)慧 © 為我公(gong)司注冊(ce)商標, 未經授(shou)權, 嚴禁使用
法律顧問: