前幾天有個朋友在MSN里面問搜索引擎友好指的(de)是什么,這是個涉(she)及(ji)面(mian)挺寬的(de)問題(ti),今天從幾方面(mian)談(tan)一下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能不(bu)能找到你的網頁?
要讓搜索引擎找(zhao)到你的主頁(ye)你就必(bi)須要有(you)(you)外部鏈接(jie),在找(zhao)到你的主頁(ye)之后(hou),還必(bi)須能找(zhao)到你的更深的內容頁(ye),也就要求你要有(you)(you)良好的網站結(jie)構,符(fu)合邏(luo)輯,可能是一(yi)個(ge)扁平的,可能是一(yi)個(ge)樹狀的。
而且這(zhe)些網頁之間(jian)要有(you)良好(hao)的鏈(lian)接(jie)結構(gou),這(zhe)些鏈(lian)接(jie)以文字鏈(lian)接(jie)最(zui)好(hao),圖(tu)像鏈(lian)接(jie)也可以,但是(shi)JavaScript鏈(lian)接(jie),下(xia)拉菜單鏈(lian)接(jie),flash鏈(lian)接(jie)等就會有(you)問題。
一(yi)般推薦網站需要(yao)有一(yi)個網站地(di)圖,把所(suo)有重(zhong)要(yao)的欄目和網頁都列進去。如果網站比較大,網站地(di)圖還可以分成幾個。
網站的所有頁(ye)面都要能從主頁(ye)開(kai)始(shi),順著鏈(lian)接找(zhao)到,最(zui)好在3,4次(ci)點擊之(zhi)內。
搜索引擎蜘蛛找到(dao)網(wang)頁后能不能抓取網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘(zhi)蛛通常要遠離(li)這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀取flash信息,但(dan)目前為止收(shou)效甚(shen)微(wei)。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵(di)。有的時候可以(yi)抓取(qu),但(dan)別自找(zhao)麻煩。
還有盡量去除不必要的搜索引擎不(bu)能讀的(de)東西,像音頻文件(jian),圖片,彈(dan)出窗口等。
搜索引擎蜘蛛抓取網頁之后,怎樣提煉有(you)用(yong)信(xin)息?
網頁的(de)(de)HTML碼必須很(hen)優化,也就是格式標(biao)簽(qian)占的(de)(de)越(yue)少越(yue)好(hao)(hao),真(zhen)正內容占的(de)(de)越(yue)多越(yue)好(hao)(hao),整個文件越(yue)小越(yue)好(hao)(hao)。把(ba)CSS,JavaScript等(deng)放在外(wai)部文件。
把關鍵詞放在(zai)應該出現的地方。
檢查網頁對(dui)不同操作系統,不同browser的兼容性。檢查是否符合W3C標準(zhun)。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域(yu)名(ming):
耐思智慧 © 版(ban)權所有(you) Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明(ming):本網站中所(suo)使用到的其他各種(zhong)版權內(nei)容,包括但不限于文章、圖(tu)片(pian)、視(shi)頻、音頻、字(zi)體(ti)等內(nei)容版權歸原作(zuo)者(zhe)所(suo)有(you)(you),如權利所(suo)有(you)(you)人(ren)發(fa)現,請及時(shi)告(gao)知,以便我(wo)們刪除版權內(nei)容
本站程(cheng)序界面、源代碼受相關法律(lv)保護(hu), 未經(jing)(jing)授權, 嚴(yan)(yan)禁使用; 耐思(si)智(zhi)慧 © 為我公司注冊商標(biao), 未經(jing)(jing)授權, 嚴(yan)(yan)禁使用
法律顧問: