使用Perl将html中的阿拉伯文字母读入csv
问题描述:
我正在使用带有阿拉伯文字母的Html。我试图将字母解析为在Excel中默认打开的csv文件。使用Perl将html中的阿拉伯文字母读入csv
我使用Perl脚本解析刻字了,但是我想通过
use feature 'unicode_strings';
这将使CSV存储阿拉伯语刻字但事实并非如此。
有没有办法解决这个问题?
答
use autodie qw(:all);
use Web::Query qw(wq);
use Text::CSV_XS qw();
my $csv = Text::CSV_XS->new({binary => 1})
or die "Cannot use CSV: ".Text::CSV_XS->error_diag;
open my $fh, '>:encoding(UTF-8)', 'm.csv';
$csv->print($fh, [wq(
'<!DOCTYPE html>
<html><head><title></title></head><body>مكة أو
مكة المكرمة
هي مدينة
مقدسة لدى
المسلمين،
بها المسجد
الحرام،
والكعبة التي
تعد قبلة
المسلمين في
صلاتهم.</body></html>'
)->find('body')->text]);
close $fh;
+0
你无法快速解释你的剧本可以让你满意吗? – Ebikeneser
+0
快速说明:解析HTML并将其写入CSV文件。 - 请[编辑你的问题](http://stackoverflow.com/posts/7661910/edit)并填写[缺乏信息](http://stackoverflow.com/q/7661910#comment-9358313)。 – daxim
对不起,这不是一个[好问题描述(http://catb.org/~esr/faqs/smart-questions.html),因为没有人能[复制什么不顺心]( http://www.chiark.greenend.org.uk/~sgtatham/bugs.html#showmehow),我们只能猜测。显示你的代码。提供样本输入和输出。 – daxim