前幾天有個朋友在MSN里面問搜索引擎友好指的是什么,這(zhe)是個涉(she)及面(mian)挺寬的問題(ti),今天從幾方面(mian)談一下大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘(zhi)蛛(zhu)能不能找到你的網頁?
要讓搜索引擎找到(dao)你(ni)(ni)的(de)主頁(ye)你(ni)(ni)就必(bi)須(xu)要有外部鏈接,在找到(dao)你(ni)(ni)的(de)主頁(ye)之后,還(huan)必(bi)須(xu)能找到(dao)你(ni)(ni)的(de)更深(shen)的(de)內(nei)容頁(ye),也就要求你(ni)(ni)要有良好(hao)的(de)網站結構,符合邏輯,可能是一個(ge)扁平的(de),可能是一個(ge)樹狀的(de)。
而且這些網(wang)頁之(zhi)間要有(you)良好(hao)的鏈接結構,這些鏈接以文字鏈接最好(hao),圖像(xiang)鏈接也(ye)可以,但(dan)是JavaScript鏈接,下拉菜單鏈接,flash鏈接等就會有(you)問題。
一般(ban)推薦網站(zhan)(zhan)需要(yao)有一個網站(zhan)(zhan)地圖,把所(suo)有重要(yao)的欄目和網頁(ye)都列進(jin)去。如果網站(zhan)(zhan)比(bi)較(jiao)大,網站(zhan)(zhan)地圖還可以分成(cheng)幾個。
網站的所有頁面都要能(neng)從主(zhu)頁開始,順著鏈接找到,最好(hao)在3,4次點擊之內。
搜索引擎蜘蛛找(zhao)到網頁后(hou)能不能抓取網頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛(zhu)通常(chang)要遠離(li)這類(lei)URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在(zai)努力(li)想讀(du)取(qu)flash信(xin)息(xi),但目前(qian)為(wei)止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大(da)敵。有的時候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不(bu)能讀的(de)東西,像音頻文件,圖(tu)片,彈出(chu)窗口等。
搜索引擎蜘蛛抓取網頁之后,怎(zen)樣提煉有用信息?
網頁(ye)的(de)HTML碼必須很優(you)化,也就是格式(shi)標簽占(zhan)的(de)越(yue)(yue)少越(yue)(yue)好,真正內容占(zhan)的(de)越(yue)(yue)多越(yue)(yue)好,整個(ge)文件越(yue)(yue)小越(yue)(yue)好。把CSS,JavaScript等放在外(wai)部(bu)文件。
把關鍵詞放在(zai)應該出現的地(di)方。
檢查(cha)網頁對不同(tong)操(cao)作系統,不同(tong)browser的兼容性。檢查(cha)是(shi)否符合(he)W3C標準(zhun)。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域(yu)名(ming):
耐(nai)思智(zhi)慧 © 版(ban)權所(suo)有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明(ming):本網(wang)站中所(suo)使用(yong)到的(de)其他各種版權(quan)(quan)內(nei)容,包括但不限于文章、圖片、視頻、音頻、字體等內(nei)容版權(quan)(quan)歸原作者所(suo)有,如(ru)權(quan)(quan)利所(suo)有人發現,請及(ji)時(shi)告知,以便我們刪除版權(quan)(quan)內(nei)容
本站(zhan)程序界面(mian)、源代碼(ma)受相關法律保護, 未(wei)經授(shou)權(quan)(quan), 嚴(yan)禁(jin)使用; 耐思智慧 © 為(wei)我公司(si)注冊商標, 未(wei)經授(shou)權(quan)(quan), 嚴(yan)禁(jin)使用
法律顧問: