Html实体解码isue使用html2pdf

问题描述:

我试图正确显示从PDF文档中的数据库中提取的文本字符串。我无法弄清楚的是以下几点。Html实体解码isue使用html2pdf

我使用fpdf和html2pdf生成PDF文档。我从我的数据库获取我的信息后,我用:

iconv('UTF-8', 'windows-1252', $data); 

这在PDF文档中正确显示如果我使用:

$pdf->Cell(); 

但是当我使用:

$pdf->WriteHtmlCell(); 

似乎它有解码问题。它似乎是在另一个字符集中,因为ù变成¹并且Ä变成Ó等等。我试图将它转换为UTF-8(它原来是在)或ISO,但我一直得到相同的结果。当我运行一个

mb_detect_encoding(); 

对于字符串它总是以ASCII(即UTF-8?)的形式返回。

WriteHtmlCell();使用另一种编码?

+0

那么你可以看到检测编码部分是正确的:那ù解码为utf8'C3 b9',或在latin1编码为2个字符[A波浪号(HTTP:// WWW .fileformat.info/info/unicode/char/c3/index.htm)+ [上标1](http://www.fileformat.info/info/unicode/char/b9/index.htm)。你的新HTML文件是否表明它是用UTF8编码的? – usr2564301

+0

@RadLexus是的页面的字符集元是:。我认为它与fpdf的html2pdf扩展有关。或者我错了? – Jaap115

+0

有谁知道我在哪里可以找到解决方案?我在输出之前尝试过编码,但那不起作用。 – Jaap115

试试这个

html_entity_decode($your_data, ENT_XHTML,"ISO-8859-1");