python中的网页解析,BeautifulSoup
1.了解网页的结构,HTML的组成。
2.BeautifulSoup的用法。
3.指定的解析器通常为“lxml”
encoding:指定编码格式。
如果不指定,通常认为和网页读进来的格式一致,不一致的话会出现乱码。
4.查找结点。
1.了解网页的结构,HTML的组成。
2.BeautifulSoup的用法。
3.指定的解析器通常为“lxml”
encoding:指定编码格式。
如果不指定,通常认为和网页读进来的格式一致,不一致的话会出现乱码。
4.查找结点。