網站只收錄一個首頁是怎么回事?對于網站來說,正常的應該是首頁和內頁都被收錄,但是有些網站優化了很長一段時間,也只是首頁被收錄,這是怎么回事呢?為什么內頁都不收錄?下面就跟著小編一起來看看吧!
1、沙盒期—建立信任
網站剛上線,特別是新域名新站,百度也有“建立信任期”的機制,這一點體現在新站的收錄情況,百度會對新站進行考核,而百度先收錄主頁,是因為主頁權重高,而內頁不收錄是在百度的考核期內,這一點可以從網站日志上看,每天蜘蛛是否都有爬取,返回的是200代碼還是400或404代碼等。
2、網站架構
對于新站而言,百度爬蟲的抓取頻率是非常有限的,如果你的網站架構設計的不合理,在某種程度上,是會影響站內相關頁面收錄的。
它主要包括:
① 首頁到內容頁與欄目頁的距離,比如:Flash網站,首頁一張圖的網站。
② 首頁到核心內容頁的點擊深度,盡量控制在1次點擊,而不要超過3次。
③ 是否合理利用nofollow屏蔽一些不需要索引的頁面,比如:about.html等。
④ URL地址是否標準化,是否產生過多的動態參數,產生蜘蛛陷阱。
3、新站原創保護
對于一個全新的站點上線,而非是老域名,理論上,域名是沒有任何信譽度的,實際上,這個時候我們需要盡量保持站內優質內容,一時間被優先索引,而非被采集,為此:
① 禁止將未被收錄的頁面,向高權重網站投稿,而是一時間,做百度網址提交。
② 如果你的網站有備案,并且備案號是獨立全新的,你可以向百度資源平臺提交新站保護。
③ 如果可以這里明確給大家一個建議就是做版權登記。
4、網站日志分析
對于網站日志分析,是解決百度不收錄網站其他頁面一個非常有效的工具,它可以清晰了解整站被用戶與蜘蛛的訪問情況:
① 審查部分頁面是否由于錯誤配置以及百度系統緩存,導致蜘蛛被封禁,而無法訪問。
② 比對不同搜索引擎到訪與抓取的頻率,審查是否是自身網站系統配置問題。
③ 選擇一定周期,記錄蜘蛛到訪相對頻繁的時間節點。
④ 是否有異常蜘蛛,比如:SEO推廣軟件的數據分析爬蟲,它是否占用大量帶寬,為此,你同時,需要定期做服務器性能監控,保障蜘蛛來訪時間段,頁面可以順利訪問。
5、robots.txt協議
Robots.txt協議是告訴搜索引擎哪些頁面可以抓取,哪些頁面不可以抓取,但是如果不小心設置錯了參數,導致內頁被屏蔽了,便會造成內頁不被收錄的情況。
新手建站,特別是對網站結構沒把握的站長,會有很多顧慮,經常是先禁止蜘蛛爬取,等網站結構設置好后才允許蜘蛛爬取,而解禁Robots.txt協議的時間大概要一周左右,而在這個時間段蜘蛛即使爬取了,也不會收錄。所以站長要檢查一下是否是把內頁禁止了。
6、服務器問題
服務器穩定性問題,蜘蛛爬取網站時,正巧趕上服務器不穩定,那么蜘蛛就會留下不好的印象,這樣也是會影響到收錄的。
7、網站資源分配
從多年的百度SEO的經驗來看,任何一個站點的收錄于排名,都是建立在一定的資源基礎上,它包括:
① 網站內容質量
如果你的站點全書偽原創代寫,亦或是采集內容,那么,百度收錄網站首頁,是非常正常的,對于新站而言,一定不要選擇提交舊內容。
② 站外外部鏈接
產生頁面不被百度收錄的情況,還有一個原因就是缺少外鏈資源的支持,蜘蛛沒辦法在一時間抓取到新發內容,為此,你可能需要撰寫一些高質量內容,發布的在高權重站點,并透過外鏈的形式,指向經常更新的頁面。
③ 站內內鏈構建
相對于熊掌ID而言,實際上我們可以忽略內鏈的存在,而如果你并沒有配置熊掌ID,那么,內鏈,是有利于提高新內容被發現的幾率。
當你的頁面長期不被收錄的時候,你可以適當的利用內鏈,構建站內的信息流動。
以上就是關于網站只收錄一個首頁的介紹,希望對您有所幫助!