Python:检查最后一个html标记
问题描述:
我想知道是否有可能检查beautifulsoup对象中的最后一个html标记。这是代码。Python:检查最后一个html标记
try:
f = urllib.request.urlopen('http://www.taylor-enviro.com' + link)
soup = BeautifulSoup(f)
except Exception as e:
print (e)
if len(soup.find_all("td",{"class":"pages"})) > 0:
print('pages true')
pagelinkrow = soup.find("td",{"class":"pages"})
if len(pagelinkrow.find_all("li")) > 0:
print('litrue')
for pagelinkrow1 in pagelinkrow.findAll('li'):
try:
print('intry')
pagelink = pagelinkrow1.a['href']
if pagelink not in linklist:
linklist.append(pagelink)
print (pagelink)
return pagelink
found = 'done'
except Exception as e:
print(e)
我想检查最后'李'。
答
pagelinkrow.find_all("li")
返回一个li
元素的数组。您可以使用索引-1
获取该阵列的最后一项:
pagelinkrow.find_all("li")[-1]