使用Perl将html中的阿拉伯文字母读入csv

问题描述:

我正在使用带有阿拉伯文字母的Html。我试图将字母解析为在Excel中默认打开的csv文件。使用Perl将html中的阿拉伯文字母读入csv

我使用Perl脚本解析刻字了,但是我想通过

use feature 'unicode_strings';

用Perl

这将使CSV存储阿拉伯语刻字但事实并非如此。

有没有办法解决这个问题?

+0

对不起,这不是一个[好问题描述(http://catb.org/~esr/faqs/smart-questions.html),因为没有人能[复制什么不顺心]( http://www.chiark.greenend.org.uk/~sgtatham/bugs.html#showmehow),我们只能猜测。显示你的代码。提供样本输入和输出。 – daxim

use autodie qw(:all); 
use Web::Query qw(wq); 
use Text::CSV_XS qw(); 

my $csv = Text::CSV_XS->new({binary => 1}) 
    or die "Cannot use CSV: ".Text::CSV_XS->error_diag; 
open my $fh, '>:encoding(UTF-8)', 'm.csv'; 
$csv->print($fh, [wq(
    '<!DOCTYPE html> 
    <html><head><title></title></head><body>&#x645;&#x643;&#x629; &#x623;&#x648; 
    &#x645;&#x643;&#x629; &#x627;&#x644;&#x645;&#x643;&#x631;&#x645;&#x629; 
    &#x647;&#x64a; &#x645;&#x62f;&#x64a;&#x646;&#x629; 
    &#x645;&#x642;&#x62f;&#x633;&#x629; &#x644;&#x62f;&#x649; 
    &#x627;&#x644;&#x645;&#x633;&#x644;&#x645;&#x64a;&#x646;&#x60c; 
    &#x628;&#x647;&#x627; &#x627;&#x644;&#x645;&#x633;&#x62c;&#x62f; 
    &#x627;&#x644;&#x62d;&#x631;&#x627;&#x645;&#x60c; 
    &#x648;&#x627;&#x644;&#x643;&#x639;&#x628;&#x629; &#x627;&#x644;&#x62a;&#x64a; 
    &#x62a;&#x639;&#x62f; &#x642;&#x628;&#x644;&#x629; 
    &#x627;&#x644;&#x645;&#x633;&#x644;&#x645;&#x64a;&#x646; &#x641;&#x64a; 
    &#x635;&#x644;&#x627;&#x62a;&#x647;&#x645;.</body></html>' 
)->find('body')->text]); 
close $fh; 
+0

你无法快速解释你的剧本可以让你满意吗? – Ebikeneser

+0

快速说明:解析HTML并将其写入CSV文件。 - 请[编辑你的问题](http://stackoverflow.com/posts/7661910/edit)并填写[缺乏信息](http://stackoverflow.com/q/7661910#comment-9358313)。 – daxim

尝试使用Encode::Arabic;看看是否有助于解析。

+0

会做什么,如果我得到它的工作将标记为正确。 – Ebikeneser