• VIP大讲堂(上海站) QA集锦——解析篇 

 • 上周为站长朋友们 献出了,本周继续将解析 方面的QA内容奉上。 
  问:我们的页面本 身就很大,会不会解析不出来?
  答:页面本身很大倒没 问题,赶集、安居客这些量都很大,没有问题。我刚才说的例子,你每次都follow出来新链接,随机 把后面的参数去掉都不影响这个网页的正常访问,这种肯定有问题的。
  问:刚才说对 URL的长度有要求,那 对每一段、就是目录名的长度有没有要求
  答:没有要求,我们是 要求url从www开始到结束,总长 度不超过1024个字节。
  问:站内重复内容 是怎么判断的?文本内容一样结构不一样,算不算重复?
  答:算重复
  问:假设是整个页 面全是Flash,如果我把一些栏 目或者最新的内容隐藏掉,不影响美观隐藏掉,如果用hidden属性能不能提取出 来?CSS可不可以?
  答:hidden可以提出来,但如 果是注释就不会管。CSS不可以。
  问:页面大小不超 过1兆,是指页面压缩 以前还是以后。
  答:指页面压缩以后, 不要超过1兆
  问:我网站的信息 已经过时了,但网页返回的是200,会受惩罚?为什 么呀?
  答:用户在搜索结果里 点了你的结果,导流导到你的网站,但没什么可看的,对用户没有用,百度当然不喜欢。
  问:现在我们很多 网站,为了让用户觉得有意思,内容没了就放一张图片,写一些有意思的话,什么“工程师去哪啦 ”之类的,对百度友 好不?
  答:最好不要用,我知 道站点是想让百度当内容死链来识别,但内容死链识别起来是有准确率和召回率风险的。
  问:我们团购网站 的确会有过期团购的页面,会受惩罚吗
  答:如果量特别大、点 击量很大的话肯定会有惩罚的。有些可以当内容死链被分析出来,如果分析不出来,会被一些其他的策略挖出来,会有这样的问题。
  问:刚才说资讯内 容页面,上面有个发布时间好,那如果页面上没有时间呢?
  答:那我们往往是按当 时抓取的时间来做判定。
  问:评论里面时间 重要吗。
  答:百度更重视主体内 容的时间,评论不算主体内容。
  问:我们是个平台 ,很多产品其实只是一个型号变更了,其实颜色都是一模一样的,对蜘蛛而言仅仅只是几个字符,会被识别为重复吗

上一篇:企业为什么需要网 站实名认证服务? | 下一篇:没有了
来源:站长学院 作者:八度网络 添加时间: 2014-12-11 06:51 点击次数:

八度网络   |   律师声明   |   商务合作   |   联系我们   |   网站地图   |   网站百科

搜索

微信号:baduwangluo 、 ytwangluo

鲁ICP备13020272号-2

友情链接:    豪胜彩票官方网址   幸运彩票   爱彩票注册   鸿博彩票   大公鸡七星彩