前幾天有個朋友在MSN里面問搜索引擎友好指的是什么,這是個涉及面(mian)挺寬(kuan)的問題,今天從幾方(fang)面(mian)談一(yi)下大概(gai)。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘蛛能不能找到你的網頁?
要讓搜索引擎找(zhao)到你的(de)(de)主(zhu)頁你就必須要(yao)有(you)外部鏈(lian)接(jie),在找(zhao)到你的(de)(de)主(zhu)頁之后,還必須能(neng)找(zhao)到你的(de)(de)更深的(de)(de)內(nei)容頁,也(ye)就要(yao)求你要(yao)有(you)良(liang)好的(de)(de)網站結構,符合邏輯,可能(neng)是一(yi)個(ge)扁平的(de)(de),可能(neng)是一(yi)個(ge)樹狀(zhuang)的(de)(de)。
而且這些網頁之間要有(you)良好(hao)的鏈接(jie)(jie)結構(gou),這些鏈接(jie)(jie)以(yi)文字(zi)鏈接(jie)(jie)最好(hao),圖像鏈接(jie)(jie)也可(ke)以(yi),但(dan)是JavaScript鏈接(jie)(jie),下拉菜單鏈接(jie)(jie),flash鏈接(jie)(jie)等就會有(you)問題。
一般(ban)推薦網(wang)站需要(yao)有一個網(wang)站地圖,把所有重(zhong)要(yao)的欄目和網(wang)頁都列進去。如果網(wang)站比(bi)較(jiao)大,網(wang)站地圖還可以(yi)分(fen)成幾(ji)個。
網站的所有(you)頁面都要(yao)能從主頁開始,順(shun)著鏈接找到,最(zui)好在3,4次點擊(ji)之(zhi)內(nei)。
搜索引擎蜘(zhi)蛛找到網頁(ye)后能不(bu)能抓(zhua)取網頁(ye)?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛(zhu)通常要(yao)遠(yuan)離(li)這類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努力想讀(du)取flash信息(xi),但目前為(wei)止收效(xiao)甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘(zhi)蛛的(de)大(da)敵(di)。有(you)的(de)時候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不能讀的東西,像(xiang)音頻文(wen)件,圖片,彈出窗口等。
搜索引擎蜘(zhi)蛛(zhu)抓(zhua)取網頁之后,怎樣(yang)提煉有用(yong)信息?
網頁(ye)的HTML碼必須很優化(hua),也就是(shi)格式標(biao)簽占的越少(shao)越好,真正(zheng)內容占的越多越好,整個(ge)文(wen)件越小越好。把CSS,JavaScript等放(fang)在(zai)外部文(wen)件。
把關鍵(jian)詞放在(zai)應該出現的(de)地方。
檢查網頁對(dui)不同(tong)操(cao)作系統,不同(tong)browser的兼(jian)容(rong)性。檢查是(shi)否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐(nai)思智(zhi)慧 © 版權所(suo)有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲明:本網站中所(suo)使用到(dao)的(de)其他各種版(ban)權內容(rong),包括但(dan)不限于文章、圖片、視頻、音頻、字體等內容(rong)版(ban)權歸原作(zuo)者所(suo)有(you),如權利所(suo)有(you)人發(fa)現,請及時告知,以便我(wo)們刪除版(ban)權內容(rong)
本站程序界面、源代碼受相關法律保護, 未經授權(quan), 嚴禁使用; 耐(nai)思智慧 © 為我(wo)公司注(zhu)冊商標(biao), 未經授權(quan), 嚴禁使用
法律顧問: