前幾天有個朋友在MSN里面問搜索引擎友好指(zhi)的是(shi)什么(me),這是(shi)個涉(she)及面挺寬的問題(ti),今(jin)天(tian)從(cong)幾方面談一(yi)下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能不(bu)能找到(dao)你的網頁?
要讓搜索引擎找(zhao)到你的(de)主(zhu)頁你就必須(xu)要有外部鏈接(jie),在找(zhao)到你的(de)主(zhu)頁之后(hou),還必須(xu)能(neng)找(zhao)到你的(de)更(geng)深的(de)內容頁,也(ye)就要求你要有良好(hao)的(de)網站結構,符合邏輯,可(ke)能(neng)是一(yi)個(ge)扁平的(de),可(ke)能(neng)是一(yi)個(ge)樹狀的(de)。
而且這些網頁(ye)之間要有(you)良好(hao)的鏈(lian)(lian)接結構(gou),這些鏈(lian)(lian)接以文字鏈(lian)(lian)接最好(hao),圖像鏈(lian)(lian)接也(ye)可以,但是(shi)JavaScript鏈(lian)(lian)接,下拉(la)菜單鏈(lian)(lian)接,flash鏈(lian)(lian)接等(deng)就會有(you)問題。
一(yi)般推薦(jian)網(wang)站(zhan)需(xu)要有一(yi)個(ge)網(wang)站(zhan)地圖,把所有重要的欄目和網(wang)頁都(dou)列進去。如果網(wang)站(zhan)比較大,網(wang)站(zhan)地圖還可(ke)以分成幾(ji)個(ge)。
網站的所有(you)頁面都要(yao)能從(cong)主頁開始,順著鏈接找到(dao),最好在3,4次點(dian)擊之內。
搜索引擎蜘蛛找到網(wang)頁后能不能抓取網(wang)頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀取flash信息,但(dan)目前為止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘(zhi)蛛的大敵。有的時候可以抓取,但(dan)別自(zi)找麻煩。
還有盡量去除不必要的搜索引擎不能(neng)讀的(de)東西,像音(yin)頻文件,圖片,彈出窗口等。
搜索引擎蜘(zhi)蛛抓取網頁之后(hou),怎樣提煉有用信息?
網頁的(de)HTML碼(ma)必須很優化,也就是格式標(biao)簽占的(de)越(yue)(yue)少越(yue)(yue)好(hao),真正內容(rong)占的(de)越(yue)(yue)多越(yue)(yue)好(hao),整個(ge)文件越(yue)(yue)小越(yue)(yue)好(hao)。把CSS,JavaScript等放(fang)在外(wai)部文件。
把(ba)關鍵(jian)詞放在應該出現的地方(fang)。
檢查網頁對不同操作系統,不同browser的兼(jian)容性(xing)。檢查是否符合W3C標(biao)準(zhun)。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐思智(zhi)慧(hui) © 版(ban)權所有(you) Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明(ming):本網站中所(suo)(suo)使用到的其他各種版權(quan)內(nei)容,包括但不(bu)限于(yu)文章、圖片、視(shi)頻、音(yin)頻、字體等內(nei)容版權(quan)歸原作者所(suo)(suo)有,如權(quan)利(li)所(suo)(suo)有人(ren)發(fa)現,請及時告知(zhi),以便我們(men)刪除(chu)版權(quan)內(nei)容
本(ben)站(zhan)程序(xu)界面(mian)、源(yuan)代碼受(shou)相關法律保護, 未經(jing)授(shou)權, 嚴禁使(shi)用(yong); 耐思智(zhi)慧 © 為我公司注冊商標, 未經(jing)授(shou)權, 嚴禁使(shi)用(yong)
法律顧問: