Html实体解码isue使用html2pdf
问题描述:
我试图正确显示从PDF文档中的数据库中提取的文本字符串。我无法弄清楚的是以下几点。Html实体解码isue使用html2pdf
我使用fpdf和html2pdf生成PDF文档。我从我的数据库获取我的信息后,我用:
iconv('UTF-8', 'windows-1252', $data);
这在PDF文档中正确显示如果我使用:
$pdf->Cell();
但是当我使用:
$pdf->WriteHtmlCell();
似乎它有解码问题。它似乎是在另一个字符集中,因为ù变成¹并且Ä变成Ó等等。我试图将它转换为UTF-8(它原来是在)或ISO,但我一直得到相同的结果。当我运行一个
mb_detect_encoding();
对于字符串它总是以ASCII(即UTF-8?)的形式返回。
是WriteHtmlCell();
使用另一种编码?
答
试试这个
html_entity_decode($your_data, ENT_XHTML,"ISO-8859-1");
那么你可以看到检测编码部分是正确的:那ù解码为utf8'C3 b9',或在latin1编码为2个字符[A波浪号(HTTP:// WWW .fileformat.info/info/unicode/char/c3/index.htm)+ [上标1](http://www.fileformat.info/info/unicode/char/b9/index.htm)。你的新HTML文件是否表明它是用UTF8编码的? – usr2564301
@RadLexus是的页面的字符集元是:。我认为它与fpdf的html2pdf扩展有关。或者我错了? – Jaap115
有谁知道我在哪里可以找到解决方案?我在输出之前尝试过编码,但那不起作用。 – Jaap115