前幾天有個朋友在MSN里面問搜索引擎友(you)好指的是什么,這(zhe)是個涉及面挺寬(kuan)的問題,今天從幾(ji)方面談一下(xia)大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能(neng)不能(neng)找到你(ni)的網頁?
要讓搜索引擎找到(dao)你(ni)的(de)(de)主頁(ye)你(ni)就必須(xu)要(yao)有外部(bu)鏈接,在(zai)找到(dao)你(ni)的(de)(de)主頁(ye)之后,還必須(xu)能找到(dao)你(ni)的(de)(de)更(geng)深的(de)(de)內容頁(ye),也(ye)就要(yao)求你(ni)要(yao)有良好(hao)的(de)(de)網站結構,符合邏輯,可能是一個(ge)扁平的(de)(de),可能是一個(ge)樹狀的(de)(de)。
而(er)且(qie)這(zhe)些網頁之間要有良(liang)好(hao)的鏈(lian)接(jie)結構(gou),這(zhe)些鏈(lian)接(jie)以文字鏈(lian)接(jie)最好(hao),圖(tu)像鏈(lian)接(jie)也可以,但是JavaScript鏈(lian)接(jie),下拉菜單(dan)鏈(lian)接(jie),flash鏈(lian)接(jie)等就會有問題(ti)。
一般(ban)推(tui)薦網站(zhan)需要(yao)有一個(ge)(ge)網站(zhan)地圖,把(ba)所(suo)有重要(yao)的欄目和網頁(ye)都(dou)列進去。如果(guo)網站(zhan)比較(jiao)大,網站(zhan)地圖還可以分成幾個(ge)(ge)。
網站的所有頁面都要能從主頁開始,順著鏈(lian)接找到(dao),最(zui)好(hao)在3,4次(ci)點擊之內。
搜索引擎蜘(zhi)蛛找到網(wang)頁后能不能抓(zhua)取網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘(zhi)蛛通(tong)常要遠離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想(xiang)讀取(qu)flash信(xin)息(xi),但(dan)目前為止(zhi)收效甚微(wei)。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵。有的時候(hou)可以(yi)抓取,但別自(zi)找(zhao)麻煩。
還有盡量去除不必要的搜索引擎不(bu)能讀(du)的東西,像音頻文(wen)件,圖片,彈出窗口等。
搜索引擎蜘蛛(zhu)抓取網頁之后,怎樣提煉有用信息?
網(wang)頁(ye)的HTML碼(ma)必(bi)須很優化,也就是格式標簽占的越少越好,真正內容(rong)占的越多越好,整個文(wen)件(jian)越小越好。把CSS,JavaScript等(deng)放在外部(bu)文(wen)件(jian)。
把(ba)關鍵詞放在(zai)應該出現的(de)地方。
檢查網頁對(dui)不(bu)(bu)同操作系(xi)統,不(bu)(bu)同browser的兼(jian)容性(xing)。檢查是(shi)否符合(he)W3C標(biao)準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐思智慧 © 版權(quan)所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所使用到的其他(ta)各種版權內容,包括(kuo)但不限(xian)于文章、圖片(pian)、視(shi)頻、音(yin)頻、字體等內容版權歸原作者所有,如權利所有人(ren)發現,請(qing)及時(shi)告知(zhi),以便我(wo)們刪除(chu)版權內容
本站(zhan)程(cheng)序界面、源(yuan)代碼受相(xiang)關(guan)法(fa)律保護, 未經(jing)授權, 嚴禁使用; 耐思智慧 © 為我公司注(zhu)冊商標, 未經(jing)授權, 嚴禁使用
法律顧問: