NEWS

建站资讯

百度谷歌搜索引擎网站对页面的收录

新闻资讯编辑:【三行网络 - 广州网站建设公司www.3gonet.com】 发布时间2010.11.18.浏览数:3456
, 广州网站建设www.3gonet.com三行网络 为您详细介绍 - 请往下阅读》

百度谷歌搜索引擎网站对页面的收录

如何避免重复性收录

在互联网中,信息的重复是在所难免的。然而,搜索引擎怎么样才能识别重复的信息呢?怎样判断哪些网页的信息是原创,哪些是“复制”的?哪些重复的信 息室有价值的,哪些又是可以舍弃的?下面大敏给各位分享下自学后得出的答案。

一个网站里,重复信息主要包括转载内容及镜像内容这两种,搜索引擎在对页面进行分析时,必须具备识别重复信息的能力。因为,存储大量的重复的信息, 不仅给服务器增加负担,而且还会给用户体验造成影响。但这不意味着所有重复信息都是没价值的,搜索引擎认为转载内容不如原创内容重要,赋予原创性的内容页 面有着更高的权重,而镜像内容则几乎被忽略

转载页面

转载页面是指那些与原创页面的正文内容(搜索引擎通过算法,清楚文章页面多余的信息,例如:广告,图片,侧边栏,然后,就得到正文内容)相近或相同 的页面。然后,搜索引擎如何识别转载页面呢?首先,把正文内容分为N个区域,如果有M个区域(M是搜索引擎指定的一个阈值)是相同或者相似的,则搜索引擎 认为这些页面互为转载内容,

镜像页面

内容完全相同的页面互为镜像页面。要想判断页面是否互为镜像页面,搜索引擎首先把这些页面分成N个区域进行比较,如果这N个区域的内容完全一样,则 认为这些也页面互为镜像页面。然后再综合页面权重值,页面最后修改时间,判断哪个才是源页面,哪个是镜像页面。

本文由广州网站建设公司-三行网络原创,转载请保留版权( 广州网站建设www.3gonet.com三行网络——专注于企业网站建设、响应式营销型网站定制,欢迎来电咨询!热线:020-85628720、15915767698

标签:

上一篇:网站备案新规让国外市场空前繁荣    下一篇:谷歌建站-谷歌Google排名优化指南

有想法,想做网站。别光想,GO ! GO !GO !说出的您的需求,剩下的交给我们!!
建网站咨询+