前幾天有個朋友在MSN里面問搜索引擎友好(hao)指的是什么,這是個涉及面挺寬的問題,今天從幾方面談(tan)一下大(da)概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)不能(neng)找到你的網頁?
要讓搜索引擎找(zhao)(zhao)(zhao)到(dao)你(ni)(ni)的(de)(de)主頁你(ni)(ni)就(jiu)必須要有外部鏈接(jie),在找(zhao)(zhao)(zhao)到(dao)你(ni)(ni)的(de)(de)主頁之后,還必須能找(zhao)(zhao)(zhao)到(dao)你(ni)(ni)的(de)(de)更(geng)深的(de)(de)內容頁,也就(jiu)要求你(ni)(ni)要有良好的(de)(de)網站結構,符合邏輯,可(ke)能是一個扁平(ping)的(de)(de),可(ke)能是一個樹狀的(de)(de)。
而且這些網頁之(zhi)間(jian)要有良好(hao)的鏈(lian)(lian)接(jie)(jie)結構,這些鏈(lian)(lian)接(jie)(jie)以(yi)文字(zi)鏈(lian)(lian)接(jie)(jie)最好(hao),圖像鏈(lian)(lian)接(jie)(jie)也(ye)可以(yi),但(dan)是JavaScript鏈(lian)(lian)接(jie)(jie),下拉(la)菜(cai)單鏈(lian)(lian)接(jie)(jie),flash鏈(lian)(lian)接(jie)(jie)等就會有問(wen)題。
一般推(tui)薦網(wang)(wang)站(zhan)需要有(you)(you)一個(ge)網(wang)(wang)站(zhan)地圖,把所有(you)(you)重(zhong)要的欄(lan)目和網(wang)(wang)頁都(dou)列進去(qu)。如果網(wang)(wang)站(zhan)比較(jiao)大,網(wang)(wang)站(zhan)地圖還(huan)可以(yi)分成幾個(ge)。
網站的所有頁面都要能從主(zhu)頁開始(shi),順(shun)著鏈接找到,最好在3,4次點擊之內。
搜索引擎蜘(zhi)蛛找到網(wang)頁后能(neng)(neng)不能(neng)(neng)抓取網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀取flash信息,但目前為(wei)止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵。有的時候可(ke)以抓取,但別(bie)自找(zhao)麻煩(fan)。
還有盡量去除不必要的搜索引擎不能讀的東西,像音頻文(wen)件,圖(tu)片(pian),彈出窗口等(deng)。
搜索引擎蜘蛛抓取網(wang)頁之后,怎樣提煉有用信息?
網(wang)頁的HTML碼(ma)必須(xu)很優化,也就是格式標簽占(zhan)的越(yue)(yue)少越(yue)(yue)好,真正內容占(zhan)的越(yue)(yue)多越(yue)(yue)好,整個文件越(yue)(yue)小越(yue)(yue)好。把CSS,JavaScript等放在外部文件。
把關鍵詞(ci)放在(zai)應該出現的地方(fang)。
檢查(cha)網頁(ye)對不(bu)同(tong)操(cao)作系(xi)統,不(bu)同(tong)browser的兼(jian)容(rong)性。檢查(cha)是否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐(nai)思智慧 © 版權所(suo)有(you) Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所使用(yong)到的其他各(ge)種版(ban)(ban)權內容(rong),包括但不(bu)限于文章、圖片、視頻(pin)、音(yin)頻(pin)、字體(ti)等(deng)內容(rong)版(ban)(ban)權歸原作者所有,如權利所有人發現,請及時告知,以便(bian)我們(men)刪除版(ban)(ban)權內容(rong)
本站程(cheng)序界面、源代碼受相(xiang)關(guan)法律保護, 未經授(shou)權, 嚴(yan)禁(jin)使(shi)用; 耐思(si)智慧 © 為我(wo)公(gong)司注冊商標, 未經授(shou)權, 嚴(yan)禁(jin)使(shi)用
法律顧問: