的是抓取有局限性一些网站(如谷歌)并不真的希望任何人抓取他们的内容。这篇文章的目的纯粹是为了帮助您聪明的 读者比您想象的更快、更容易地提取和排序数据。 让我们在 上找到一些我们应该关注的有趣的人(或目标。这真的很重要吗?)。在 上搜索有趣人物的主题,我发现自己进入了以下页面: 有趣的人 答对了。直接复制并粘贴到 文档中将是一场灾难;页面上的其他内容太多了。这就是 的用武之地。 第一步是打开 表格并将所需的 输入到单元格中。它可以是任何单元格,但在下面的示例中,我将 放入单元格 中。
导入 在我们开始抓取之前我们需要
弄清楚我们计划抓取哪些数据在这种情况下,它恰好是 江西电话号码数据 句柄,所以这就是我们要做的。 首先,右键单击我们的目标( 句柄)并单击 检查元素 。 检查元素 进入 后,我们想找出目标在页面上的位置。 推特检是 标签的 孩子 。这些值的含义是另一篇文章的主题,但我们需要记住的是,对于这个特定的 ,这是我们它几乎肯定会存在于任何其他给定 上具有不同修饰符的不同区域;这只是我们所在网站的独有信息。 让我们来看看可怕的东西(也许?):如何编写公式。 导入 公式 我将公式放在单元格 中,其中有红色箭头。
需要提取的所需信息所在的位置
从突出显示的矩形中可以看出,我写了 ,它产生了一个精 搜索引擎优化论坛 彩的、有组织的列表,列出了所有要关注的顶级 句柄这页纸。瞧。很酷,对吧? 执行此操作时要记住,值是通过公式创建的,因此尝试定期复制和粘贴它们会变得混乱;您需要复制并粘贴为值。 现在,让我们打破这种疯狂。 与表格中的任何其他函数一样,您需要以等号开头,因此我们以 开头。接下来,我们找到具有目标 的单元格(在本例中为单元格 ),然后添加一个逗号。始终需要双引号来开始查询,后跟两个正斜杠接下来,您选择要抓取。