网站页面长度过长如何优化提高收录
2017-07-18 13:35:33  By: shinyuu

最近院长收到一个非常典型的抓取优化例子、整理一下分享给各位、各位站长们谨记不要出现相同的情况、网页长度对收录的影响吗

网页过长好吗


站点场景

网站主体内容都是js生成、针对用户访问、没有做优化;但是网站特针对爬虫抓取做了优化、直接将图片二进制内容放到了html中导致页面长度过长;然而优化后发现内容却不被百度收录

页面质量很好、还特意针对爬虫做了优化、为什么内容反而不收录了呢?


工程师分析

1、网站针对爬虫爬取做的优化、直接将图片二进制内容放到了html中导致页面长度过长、网站页面长度达164k;

2、 站点优化后将主体内容放于最后、图片却放于前面;

3、爬虫抓取内容后、页面内容过长被截断、已抓取部分无法识别到主体内容、最终导致页面被认定为空短而不收录


工程师建议

1、不建议站点使用js生成主体内容、如js渲染出错、很可能导致页面内容读取错误、页面无法抓取

2、 如站点针对爬虫爬取做优化、建议页面长度在128k之内、不要过长

3、针对爬虫爬取做优化、请将主体内容放于前方、避免抓取截断造成的内容抓取不全


若资源对你有帮助、浏览后有很大收获、不妨小额打赏我一下、你的鼓励是维持我不断写博客最大动力

想获取DD博客最新资讯、你可以扫描下方的二维码、关注DD博客微信公众号(ddblogs)

或者你也可以关注我的新浪微博、了解DD博客的最新动态:DD博客官方微博(dwtedx的微博)

如对资源有任何疑问或觉得仍然有很大的改善空间、可以对该博文进行评论、希望不吝赐教

为保证及时回复、可以使用博客留言板给我留言: DD博客留言板(dwtedx的留言板)

感谢你的访问、祝你生活愉快、工作顺心、欢迎常来逛逛


快速评论


博文评论

  • 该博文还没有评论、赶快抢沙发吧...
DD记账
top
+