前幾天有個朋友在MSN里面問搜索引擎友(you)好指的是(shi)什么,這是(shi)個涉及面(mian)挺寬的問題,今天從(cong)幾方(fang)面(mian)談(tan)一下大概(gai)。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘(zhi)蛛能不能找到你的網頁?
要讓搜索引擎找(zhao)到(dao)你的主頁你就必須要有(you)外部鏈接,在找(zhao)到(dao)你的主頁之后,還必須能找(zhao)到(dao)你的更深的內(nei)容頁,也(ye)就要求你要有(you)良(liang)好的網站結(jie)構,符合(he)邏輯,可能是(shi)一(yi)個(ge)扁平(ping)的,可能是(shi)一(yi)個(ge)樹(shu)狀的。
而且這些網頁(ye)之間要(yao)有(you)良好的鏈(lian)接(jie)結構,這些鏈(lian)接(jie)以文字鏈(lian)接(jie)最好,圖(tu)像(xiang)鏈(lian)接(jie)也可以,但是JavaScript鏈(lian)接(jie),下(xia)拉菜單鏈(lian)接(jie),flash鏈(lian)接(jie)等就會(hui)有(you)問題(ti)。
一(yi)般推(tui)薦網(wang)站(zhan)需要(yao)有(you)一(yi)個網(wang)站(zhan)地圖,把所有(you)重要(yao)的欄(lan)目和網(wang)頁都列進去。如果網(wang)站(zhan)比較(jiao)大,網(wang)站(zhan)地圖還可以分成幾個。
網站的所有頁(ye)面都要能(neng)從(cong)主頁(ye)開(kai)始,順著鏈接(jie)找到,最好在3,4次點擊之內(nei)。
搜索引擎蜘蛛(zhu)找到網(wang)頁后能(neng)不能(neng)抓取(qu)網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠(yuan)離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努(nu)力想讀取flash信(xin)息,但目(mu)前為止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵。有的時(shi)候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不能讀的東西,像音(yin)頻文件,圖(tu)片,彈出窗口等。
搜索引擎蜘蛛抓取網(wang)頁之(zhi)后(hou),怎樣提煉有用信息?
網(wang)頁的HTML碼(ma)必須(xu)很(hen)優(you)化,也就是(shi)格式(shi)標簽占的越(yue)少越(yue)好(hao),真正內(nei)容占的越(yue)多越(yue)好(hao),整個文件越(yue)小越(yue)好(hao)。把CSS,JavaScript等放在(zai)外部文件。
把關鍵詞放(fang)在應該出現的地(di)方(fang)。
檢(jian)查網頁(ye)對(dui)不(bu)同操(cao)作系(xi)統,不(bu)同browser的兼(jian)容(rong)性。檢(jian)查是(shi)否符合(he)W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域(yu)名:
耐(nai)思智慧 © 版權所有(you) Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所使用到的其他各種版(ban)權內(nei)容(rong)(rong),包括但不限于文章、圖片、視頻、音(yin)頻、字體(ti)等內(nei)容(rong)(rong)版(ban)權歸原(yuan)作者所有,如權利所有人發現(xian),請及時告知,以(yi)便我們刪除(chu)版(ban)權內(nei)容(rong)(rong)
本站程序界面、源(yuan)代碼受相關法律保(bao)護, 未經授(shou)權, 嚴禁使(shi)用; 耐思智慧 © 為我公司注冊商標(biao), 未經授(shou)權, 嚴禁使(shi)用
法律顧問: