前幾天有個朋友在MSN里面問搜索引擎友好指(zhi)的是什么,這是個(ge)涉及面挺寬的問題,今天從幾方面談一下(xia)大概(gai)。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)(neng)不能(neng)(neng)找到你的(de)網頁?
要讓搜索引擎找(zhao)到(dao)(dao)你的主(zhu)頁你就必須要(yao)有外部鏈接,在找(zhao)到(dao)(dao)你的主(zhu)頁之后,還必須能找(zhao)到(dao)(dao)你的更(geng)深的內容頁,也(ye)就要(yao)求你要(yao)有良好的網站(zhan)結(jie)構,符(fu)合邏輯,可能是一個扁(bian)平的,可能是一個樹狀的。
而且這些網頁之間要(yao)有良好的鏈(lian)接(jie)結構,這些鏈(lian)接(jie)以文字鏈(lian)接(jie)最好,圖(tu)像鏈(lian)接(jie)也可以,但是JavaScript鏈(lian)接(jie),下拉菜單(dan)鏈(lian)接(jie),flash鏈(lian)接(jie)等(deng)就(jiu)會有問(wen)題。
一(yi)般推(tui)薦網(wang)(wang)站需要有一(yi)個(ge)網(wang)(wang)站地圖,把所有重要的欄(lan)目和網(wang)(wang)頁都列進去。如果網(wang)(wang)站比較(jiao)大,網(wang)(wang)站地圖還(huan)可以分成幾個(ge)。
網站的所有頁(ye)面都要能(neng)從主頁(ye)開始(shi),順(shun)著鏈接找到,最好在3,4次點擊(ji)之內(nei)。
搜索引擎蜘蛛找(zhao)到網(wang)頁后能不能抓取(qu)網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛(zhu)通常要遠(yuan)離(li)這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀取flash信息,但(dan)目前為(wei)止(zhi)收(shou)效(xiao)甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘(zhi)蛛的(de)(de)大敵。有的(de)(de)時候可以抓取,但別自找麻(ma)煩。
還有盡量去除不必要的搜索引擎不能(neng)讀的(de)東西,像音頻文件(jian),圖片,彈出窗口(kou)等。
搜索引擎蜘蛛抓取網頁之后(hou),怎(zen)樣提(ti)煉(lian)有用信息?
網頁的(de)HTML碼必須很優化,也就是格(ge)式標簽(qian)占的(de)越(yue)少(shao)越(yue)好,真正內(nei)容占的(de)越(yue)多越(yue)好,整個文(wen)件(jian)越(yue)小越(yue)好。把CSS,JavaScript等放在外部文(wen)件(jian)。
把關鍵詞放在應該出現(xian)的地方。
檢查(cha)網頁(ye)對(dui)不同操作(zuo)系統,不同browser的兼容性。檢查(cha)是否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域(yu)名:
耐思智慧 © 版(ban)權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網(wang)站中所使用到的其他各種版權(quan)(quan)內容,包括但不限于文章、圖片、視頻、音頻、字體等(deng)內容版權(quan)(quan)歸原作者所有,如權(quan)(quan)利所有人發現,請及時告知,以便(bian)我(wo)們刪除版權(quan)(quan)內容
本站(zhan)程序界面、源(yuan)代(dai)碼(ma)受相關法律保(bao)護, 未(wei)經授權, 嚴(yan)禁使用(yong); 耐思(si)智慧(hui) © 為我公司注冊商標, 未(wei)經授權, 嚴(yan)禁使用(yong)
法律顧問: