Python:检查最后一个html标记

问题描述:

我想知道是否有可能检查beautifulsoup对象中的最后一个html标记。这是代码。Python:检查最后一个html标记

try: 
    f = urllib.request.urlopen('http://www.taylor-enviro.com' + link) 
    soup = BeautifulSoup(f) 
except Exception as e: 
    print (e) 

if len(soup.find_all("td",{"class":"pages"})) > 0: 
    print('pages true') 
    pagelinkrow = soup.find("td",{"class":"pages"}) 
    if len(pagelinkrow.find_all("li")) > 0: 
     print('litrue') 
     for pagelinkrow1 in pagelinkrow.findAll('li'): 
      try: 
       print('intry') 
       pagelink = pagelinkrow1.a['href'] 
       if pagelink not in linklist: 
        linklist.append(pagelink) 
        print (pagelink) 
       return pagelink 

       found = 'done' 
      except Exception as e: 
         print(e) 

我想检查最后'李'。

pagelinkrow.find_all("li")返回一个li元素的数组。您可以使用索引-1获取该阵列的最后一项:

pagelinkrow.find_all("li")[-1]