的过程 现在我们将简要讨论 年的 概念,以及搜索引擎如何使用它来计算信任度。 让我们从这个简单的图表开始: 从左侧开始,如果您想象您有一个 信任的网站列表,它可能包括 、 、纽约时报等网站。在这个 种子列表 中,您没有垃圾邮件无论如何,因为这些都是具有高水平编辑控制的超高质量网站。当我们向右移动一步时,我们首先有一个网站列表,这些网站与受信任的种子集只有一个链接。垃圾邮件的数量略有增加,但不会很多。向 致敬,以获取其原始可视化效果。 现在转到图表的最右侧,我们可以看到,即使网站列表距离受信任的种子集只有三个链接。
列表中的网站也更有可能是垃圾邮件 多达
该 他们事实上 因此,搜索引擎可以定义自己的可信网 马耳他电话号码数据 站种子集,并将其用作抓取网络的起点。当他们浏览这些网站并跟踪外部链接时,他们可以看到任何给定网站与受信任的种子集的距离。这意味着网站离那里越远,它成为垃圾邮件的可能性就越大。虽然这不是一门精确的科学,但当您想到需要衡量信任度的数十亿在线页面时,这是一种高度可扩展的方法,原始论文的测试表明它也很有效 多样化的链接 我想在这里介绍两种类型的多样性: 链接域的多样性 链接类型的多样性 如果我们想要建立良好的链接并拥有强大的链接配置文件,那么这两点都很重要。
链接域的多样性仅仅意味着从许多不同的域
相同的域我将在下面更详细地讨论这个问题。 链接类型的多样性意味着从不同类型的域中获取链接。如果您所有的链接都来自网络目录,那就不是很多样化。如果您的所有链接都来自新闻稿联合组织,那就不是很多样化。我相信你明白我的意思。自然链接配置文件将包含来自许多不同类型网站的链接。 相关链接 这里的 相关 一词不是指链接所在的页面,而是指链接本身。锚文本使 无需抓取页面即可发现页面的可能主题,这对他们来说是一个强烈的信号。 因此,我们需要获取与我们相关的网站链接 我们可以通过尝试使锚文本包含我们定位的且与我们相关的关键字来做到这一点。