使用jsoup刮谷歌广告

使用jsoup刮谷歌广告

问题描述:

我用几个月后jsoup刮去所有的谷歌搜索结果,不包括广告。 现在与此工作完全相反,我需要从谷歌搜索结果中获得所有广告。 事情是我无法找到他们在我的文档。使用jsoup刮谷歌广告

问题肯定是一个错误的标签......

Elements elements = doc.select("div[class=*What do i need to put here?*]"); 
        for (Element link : elements) { 
         position++; 

         Elements tempTitles = link.select("h3[]"); 
         Element tempSmtng = link.select("a").first(); 
         ............. 

这是从去年的工作采取了代码。它曾经说class=g和工作很好,但现在看来广告类标签只是剂量工作。 任何建议什么是标签即时寻找?

你应该可以很容易地弄清楚你自己。只需使用带有Chrome等开发工具的浏览器,并在广告上使用Inspect Element即可。你应该看看正在实现哪些CSS类。如何使用Chrome

详情这里检查元素:https://developers.google.com/web/tools/chrome-devtools/iterate/inspect-styles/?hl=en

JSoup使用CSS选择器来查找元素。您可以阅读如何在这里使用它们:http://css.maxdesign.com.au/selectutorial/

通过学习底层概念来理解代码的工作方式会更好,因为网页浏览器本质上很脆弱,因为网站提供者可以随时更改输出。

+0

这就是要点 - 我做的。 我之前做过这件事,而且工作。事情是,现在它实际上不工作,它看起来像我想念的东西 –