前幾天有個朋友在MSN里面問搜索引擎友(you)好(hao)指的是什么,這是個涉及面挺寬的問題,今天從幾方面談一下大概(gai)。
假設我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
搜索引擎蜘(zhi)蛛能不能找到你(ni)的網(wang)頁?
要讓搜索引擎找(zhao)到你的(de)(de)主頁(ye)你就必(bi)須(xu)要(yao)有外部鏈(lian)接,在(zai)找(zhao)到你的(de)(de)主頁(ye)之后(hou),還必(bi)須(xu)能(neng)找(zhao)到你的(de)(de)更深的(de)(de)內容頁(ye),也就要(yao)求(qiu)你要(yao)有良好的(de)(de)網站結構,符合(he)邏輯,可(ke)(ke)能(neng)是(shi)一個扁平(ping)的(de)(de),可(ke)(ke)能(neng)是(shi)一個樹狀(zhuang)的(de)(de)。
而且(qie)這些(xie)網頁之間要有良好的鏈接(jie)(jie)(jie)結構,這些(xie)鏈接(jie)(jie)(jie)以(yi)文字(zi)鏈接(jie)(jie)(jie)最好,圖(tu)像鏈接(jie)(jie)(jie)也可以(yi),但是JavaScript鏈接(jie)(jie)(jie),下(xia)拉菜單鏈接(jie)(jie)(jie),flash鏈接(jie)(jie)(jie)等就會有問題。
一(yi)般推薦網站需要(yao)有(you)(you)一(yi)個網站地圖,把所(suo)有(you)(you)重要(yao)的欄(lan)目和網頁都列進(jin)去。如(ru)果網站比較大,網站地圖還可(ke)以分成幾個。
網站(zhan)的所有頁(ye)面都要能從主頁(ye)開始,順著鏈接找到,最好在(zai)3,4次點擊之(zhi)內。
搜索引擎蜘蛛(zhu)找到(dao)網頁后能不能抓取網頁?
網頁的URL必須是可以被抓取的,如果網頁是由數據庫動態生成的,那么URL一般要經過改寫成靜態的,也就是去掉那些URL中問號參數之類的東西, 也要去掉Session ID。技術上倒不是搜索引擎不能讀取這種URL,但是為了避免陷入無限循環,搜索引擎蜘蛛通常要遠離這(zhe)類URL。
還有如果你的網站是一個整個的flash,那也沒辦法讀取。雖然搜索引擎在努(nu)力想讀(du)取flash信息,但(dan)目前為止收(shou)效甚微。
還有框架結構(frame),在網站剛出現的時候,框架結構風行一時,現在還有不少網站在用,這是搜索引擎蜘蛛的大敵(di)。有的時候可以抓取,但別自找麻煩。
還有盡量去除不必要的搜索引擎不能讀的東(dong)西,像(xiang)音頻文件(jian),圖片,彈出窗口等。
搜索引擎蜘蛛抓取網頁之后(hou),怎樣提(ti)煉有用(yong)信息?
網頁的HTML碼(ma)必須很優化(hua),也就是格式標簽占的越(yue)少越(yue)好,真正(zheng)內容占的越(yue)多越(yue)好,整個文件(jian)越(yue)小越(yue)好。把(ba)CSS,JavaScript等放在外(wai)部文件(jian)。
把關(guan)鍵詞放在(zai)應該出現的地(di)方(fang)。
檢(jian)查(cha)網頁對不同操作系(xi)統,不同browser的(de)兼容性。檢(jian)查(cha)是否符合W3C標準。
只有搜索引擎能順利找到你的所有網頁,抓取這些網頁并取出其中真正的有相關性的內容,這個網站才可以被視為是搜索引擎友好的。
旗下網站:耐思智慧 - - - 中文域名:
耐思智(zhi)慧 © 版權所有 Copyright © 2000-2025 szjicheng.cn,Inc. All rights reserved
備案號碼:
公安備案號:
聲(sheng)明:本網站中所使(shi)用到的其他各種版權內容(rong)(rong),包(bao)括但不限于文(wen)章(zhang)、圖片、視頻、音頻、字體等內容(rong)(rong)版權歸原作者所有(you),如權利(li)所有(you)人發現,請及時(shi)告知,以(yi)便我們刪除版權內容(rong)(rong)
本站程序界面、源代(dai)碼受相關法律保護, 未經(jing)授權, 嚴禁使用; 耐思智慧 © 為(wei)我(wo)公司注冊商標, 未經(jing)授權, 嚴禁使用
法律顧問: