爬取doc文件后文件中出现文字重叠
问题:用爬虫批量下载doc文件,打开后发现文字重叠。如图:
解决方法:
一般字体重叠的情况是由于字体的不匹配造成的,更改为“中文字体”和“西文字体”,就可以解决问题,并保留原文格式。ctrl+A全选文字,右键点击选择“字体”,进行修改。修改后:
问题:用爬虫批量下载doc文件,打开后发现文字重叠。如图:
解决方法:
一般字体重叠的情况是由于字体的不匹配造成的,更改为“中文字体”和“西文字体”,就可以解决问题,并保留原文格式。ctrl+A全选文字,右键点击选择“字体”,进行修改。修改后: