使用 Perl 将 html 中的阿拉伯字母读入 csv

发布于 2024-12-08 13:32:43 字数 215 浏览 0 评论 0原文

我正在使用其中包含阿拉伯字母的 Html。我正在尝试将字母解析为 csv 文件,该文件默认在 Excel 中打开。

我正在使用 Perl 脚本来解析字母,但是我认为通过在 Perl 中使用

use feature 'unicode_strings';

这将允许 csv 存储阿拉伯字母,但事实并非如此。

有办法解决这个问题吗?

I am Working with Html that has Arabic lettering in it. I am trying to parse the lettering into a csv file that opens as default in Excel.

I am using a Perl script to parse the lettering out however I thought by using

use feature 'unicode_strings';

in the Perl this would allow the csv to store Arabic lettering however it does not.

Is there a way round this?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

很酷不放纵 2024-12-15 13:32:43
use autodie qw(:all);
use Web::Query qw(wq);
use Text::CSV_XS qw();

my $csv = Text::CSV_XS->new({binary => 1})
    or die "Cannot use CSV: ".Text::CSV_XS->error_diag;
open my $fh, '>:encoding(UTF-8)', 'm.csv';
$csv->print($fh, [wq(
    '<!DOCTYPE html>
    <html><head><title></title></head><body>مكة أو
    مكة المكرمة
    هي مدينة
    مقدسة لدى
    المسلمين،
    بها المسجد
    الحرام،
    والكعبة التي
    تعد قبلة
    المسلمين في
    صلاتهم.</body></html>'
)->find('body')->text]);
close $fh;
use autodie qw(:all);
use Web::Query qw(wq);
use Text::CSV_XS qw();

my $csv = Text::CSV_XS->new({binary => 1})
    or die "Cannot use CSV: ".Text::CSV_XS->error_diag;
open my $fh, '>:encoding(UTF-8)', 'm.csv';
$csv->print($fh, [wq(
    '<!DOCTYPE html>
    <html><head><title></title></head><body>مكة أو
    مكة المكرمة
    هي مدينة
    مقدسة لدى
    المسلمين،
    بها المسجد
    الحرام،
    والكعبة التي
    تعد قبلة
    المسلمين في
    صلاتهم.</body></html>'
)->find('body')->text]);
close $fh;
可遇━不可求 2024-12-15 13:32:43

尝试使用 Encode::Arabic;看看这是否有助于解析。

Try using Encode::Arabic; see if that helps the parsing.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文