Python Selenium Webdriver:枚举超链接并下载文件
问题描述:
我想从网页中枚举所有超链接(包含要从中下载的文件),然后一个接一个地下载这些文件。点击时的超链接需要填写表格,我已经创建了一个类来完成相同的工作。在代码运行期间,我收到“AttributeError:'元组'对象没有'click'属性。我在此附上代码,任何建议纠正这一点将非常感激。Python Selenium Webdriver:枚举超链接并下载文件
import os
import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
fp = webdriver.FirefoxProfile()
fp.set_preference("browser.download.folderList", 2)
fp.set_preference("browser.download.manager.showWhenStarting", False)
fp.set_preference("browser.download.dir", "F:\Projects\Poli_Map\DatG_Py_Dat")
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "text/xml")
driver = webdriver.Firefox(firefox_profile=fp)
driver.get('https://data.gov.in/catalog/variety-wise-daily-market-prices-data-cauliflower')
assert "resources" in driver.title
continue_link = driver.find_element_by_tag_name('a')
elem = driver.find_elements_by_xpath("//*[@href]")
z = elem
for links in enumerate(z):
driver.implicitly_wait(4)
for link in enumerate(links):
link.click()
class FormPage(object):
def fill_form(self, data):
driver.execute_script("document.getElementById('edit-download-reasons-non-commercial').click()")
driver.execute_script("document.getElementById('edit-reasons-d-rd').click()")
driver.find_element_by_xpath('//input[@name = "name_d"]').send_keys(data['name_d'])
driver.find_element_by_xpath('//input[@name = "mail_d"]').send_keys(data['mail_d'])
return self
def submit(self):
driver.execute_script("document.getElementById('edit-submit').click()")
data = {
'name_d': 'xyz',
'mail_d': '[email protected]',
}
time.sleep(3)
FormPage().fill_form(data).submit()
答
请检查您使用的枚举,这是明显错误的。 鉴于
elem = driver.find_elements_by_xpath("//*[@href]")
,你现在可以简单地在这个集合进行迭代,如:
for link in elem:
link.click()
你并不需要所有的休息。
谢谢澄清安德烈亚斯。虽然现在我在运行代码时收到断言错误,但是在将driver.title中包含“resources”之前,我确实检查了页面源代码。我在这里错过了什么吗? – Cashi
我只是评论了这一行,因为我不确定你对assert的意图是什么。如果这是一项功能,请澄清您的意图。 –
嗨安德烈亚斯,其目的是找到并下载网页中的所有XML链接。我已经更新了代码,但面对CSS选择器的问题https://stackoverflow.com/questions/46784644/python-selenium-css-selector-element-is-not-visible – Cashi