網(wǎng)站頁面過長,也會導(dǎo)致搜索引擎不收錄?
最近公司收到一個非常典型的頁面收錄的優(yōu)化例子,整理一下分享給各位,各位站長們以后避免不要出現(xiàn)相同的情況。
站點反饋:
網(wǎng)站主體內(nèi)容都是用js文件生成,用戶訪問沒問題,但是沒有做優(yōu)化。網(wǎng)站針對爬蟲抓取做了優(yōu)化,且將圖片也直接做了轉(zhuǎn)化,然而后來發(fā)現(xiàn)內(nèi)容卻不被百度收錄
頁面質(zhì)量很好,還針對爬蟲做了相關(guān)優(yōu)化,為什么內(nèi)容反而不收錄了呢?
百度工程師分析:
1、網(wǎng)站針對爬蟲爬取做的優(yōu)化,直接將圖片二進(jìn)制內(nèi)容放到了html中導(dǎo)致頁面太長,網(wǎng)站頁面長度達(dá)164k;
2、 站點優(yōu)化后將主體內(nèi)容放于最后,圖片卻放于前面;
3、爬蟲抓取內(nèi)容后,由于頁面內(nèi)容過長而被截斷,已抓取部分無法識別到主體內(nèi)容,最終導(dǎo)致頁面被認(rèn)定為主題不明確而不收錄。
昆山優(yōu)化公司建議:
1、站點不要使用js生成主體內(nèi)容,如js渲染出錯,很可能出現(xiàn)頁面內(nèi)容讀取錯誤,導(dǎo)致頁面無法抓取。
2、 如站點針對爬蟲爬取做過優(yōu)化,建議頁面長度在128k之內(nèi),切記內(nèi)容不要過長。
3、針對爬蟲爬取做優(yōu)化,請將主題內(nèi)容放于前方,圖片后置,避免抓取截斷造成內(nèi)容不全。