前幾天有個朋友在MSN里面問搜索引擎友好指的是(shi)什么,這是(shi)個涉及面挺寬的問題,今天從幾方(fang)面談一下(xia)大概。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能不(bu)能找到(dao)你(ni)的網頁?
要讓搜索引擎找(zhao)到(dao)(dao)你的(de)主頁(ye)你就(jiu)必(bi)須(xu)要有外部鏈接,在(zai)找(zhao)到(dao)(dao)你的(de)主頁(ye)之后,還必(bi)須(xu)能(neng)(neng)找(zhao)到(dao)(dao)你的(de)更深的(de)內容頁(ye),也(ye)就(jiu)要求(qiu)你要有良(liang)好(hao)的(de)網站(zhan)結構,符合邏輯(ji),可能(neng)(neng)是(shi)一個(ge)扁平(ping)的(de),可能(neng)(neng)是(shi)一個(ge)樹狀的(de)。
而且這些(xie)網頁之(zhi)間要有(you)良好(hao)的(de)鏈(lian)接(jie)(jie)結構,這些(xie)鏈(lian)接(jie)(jie)以文字鏈(lian)接(jie)(jie)最好(hao),圖像鏈(lian)接(jie)(jie)也可以,但(dan)是(shi)JavaScript鏈(lian)接(jie)(jie),下拉菜單鏈(lian)接(jie)(jie),flash鏈(lian)接(jie)(jie)等就(jiu)會有(you)問題(ti)。
一般推薦網站(zhan)需要有一個網站(zhan)地圖(tu),把所有重要的欄目和(he)網頁都列進去。如果網站(zhan)比較大(da),網站(zhan)地圖(tu)還可以分成(cheng)幾個。
網(wang)站的所有頁(ye)面都(dou)要能(neng)從主頁(ye)開始,順著(zhu)鏈接(jie)找(zhao)到,最(zui)好(hao)在(zai)3,4次點擊之內(nei)。
搜索引擎蜘蛛找到網頁后(hou)能不能抓取網頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠(yuan)離(li)這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想(xiang)讀取(qu)flash信息,但目前為止收效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大(da)敵。有的時(shi)候可以抓(zhua)取,但別(bie)自找麻(ma)煩(fan)。
還有盡量去除不必要的搜索引擎不能(neng)讀的(de)東西,像音(yin)頻文件,圖片,彈出(chu)窗口等。
搜索引擎蜘蛛抓取網(wang)頁之后,怎樣(yang)提煉有用信息?
網頁的HTML碼必須很優化,也就是(shi)格式標簽(qian)占的越(yue)少(shao)越(yue)好,真正內容(rong)占的越(yue)多越(yue)好,整個文(wen)件(jian)越(yue)小(xiao)越(yue)好。把CSS,JavaScript等放(fang)在外部文(wen)件(jian)。
把關鍵詞放在應該出現的地方。
檢(jian)查網頁對不同操作系統,不同browser的兼容性。檢(jian)查是否(fou)符合W3C標準(zhun)。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名(ming):
耐思智慧 © 版(ban)權(quan)所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站(zhan)中(zhong)所(suo)使用到的其他各(ge)種版權內容(rong),包括但不限于文章、圖片、視頻(pin)、音頻(pin)、字(zi)體等內容(rong)版權歸原作者所(suo)有,如權利(li)所(suo)有人發(fa)現,請及時告(gao)知,以便我(wo)們刪(shan)除版權內容(rong)
本站程序界面、源代碼受相關法(fa)律保(bao)護, 未經授(shou)權, 嚴禁使用(yong); 耐(nai)思智慧 © 為我(wo)公司注冊商標, 未經授(shou)權, 嚴禁使用(yong)
法律顧問: