源码之家

  • 首页
  • 文章
  • 问答
  • 下载
您的位置: 首页  >  文章  >  response.text中包含中文的乱码问题

response.text中包含中文的乱码问题

分类: 文章 • 2022-10-09 15:09:46

import requests
from lxml import etree
url = “https://www.jb51.net/article/168449.htm” #请求地址
response = requests.get(url= url,) #返回结果
response.encoding=‘gbk’(有些网站可能是utf-8)
wb_data = response.text #文本展示返回结果
print(wb_data)
html = etree.HTML(wb_data) #将页面转换成文档树
b = html.xpath(’//h1[@class=“title”]/text()’) #提取标题中内容
print(b) #打印b,这里的b是一个数组
效果如下图:
response.text中包含中文的乱码问题

相关推荐

  • tomcat启动和运行中的乱码问题
  • idea中在maven框架中的乱码问题
  • IDEA最新的2019.2.4版本注释或代码引号种的中文出现部分乱码问题
  • java打包jar中文乱码问题,maven中nexusjar乱码解决
  • doGet方法返回的中文值乱码的问题(spring mvc)
  • linguist 乱码问题 : Qt国际化(源码含中文时)的点滴分析
  • JavaWeb学习笔记八:Ajax学习,使用Ajax引擎访问服务器,以及Servlet技术中乱码问题的再梳理
  • layui的reload:function()后面中文参数传到后端出现乱码的问题
  • 当element-ui的el-dialog组件中包含子组件时,用refs调用子组件时的undefined问题
  • Eclipse中javadoc的使用以及中文乱码的解决
  • 爬虫 lxml 模块
  • python3爬虫记(一)------------------利用 requests 和 lxml 爬取小说
    网站免责声明 网站地图 最新文章 用户隐私 版权申明
本站所有数据收集于网络,如果侵犯到您的权益,请联系网站进行下架处理。   

Copyright © 2018-2021   Powered By 源码之家    备案号:   粤ICP备20058927号