为什么 gedit 无法识别从 perl 程序创建的输出文件的编码？

发布于 2024-09-17 19:30:57 字数 656 浏览 8 评论 0原文

#!/usr/bin/perl -w
use strict;

open (EVENTLOGFILE, "<eventlog.txt") || die("Could not open file eventlog file");
open (EVENTLOGFILE_NODATETIME, ">eventlog_nodatetime.txt") || die("Could not open new event log file");


my($line) = "";

while ($line = <EVENTLOGFILE>) {
 my @fields = split /[ \t]/, $line;
 my($newline) = "";
 my($i) = 1;

 foreach( @fields )
 {
  my($field) = $_;
  if( $i ne 3 )
  {
   $newline = $newline . $field;
  }

  $i++;
 }

 print EVENTLOGFILE_NODATETIME "$newline";
}

close(EVENTLOGFILE);
close(EVENTLOGFILE_NODATETIME);

如果我每次打印 $line 而不是 $newline 它可以检测编码没有问题。只有当我尝试修改线条时，它才会变得混乱。

原文

#!/usr/bin/perl -w
use strict;

open (EVENTLOGFILE, "<eventlog.txt") || die("Could not open file eventlog file");
open (EVENTLOGFILE_NODATETIME, ">eventlog_nodatetime.txt") || die("Could not open new event log file");


my($line) = "";

while ($line = <EVENTLOGFILE>) {
 my @fields = split /[ \t]/, $line;
 my($newline) = "";
 my($i) = 1;

 foreach( @fields )
 {
  my($field) = $_;
  if( $i ne 3 )
  {
   $newline = $newline . $field;
  }

  $i++;
 }

 print EVENTLOGFILE_NODATETIME "$newline";
}

close(EVENTLOGFILE);
close(EVENTLOGFILE_NODATETIME);

If I print out $line each time instead of $newline it can detect the encoding no problem. It's only when I try to modify the lines that it gets messed up.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

紫南 2024-09-24 19:30:57

我猜它不是编码（如 ISO 8859-1 与 UTF-8），而是行结尾（CR、LF 与 LF）。

如果您使用 chomp 并打印“\n”，您可能会将行结尾转换为平台本机。

我认为你的脚本可能更好地写成这样（未经测试）：

#!/usr/bin/perl 
use strict;
use warnings;

open ($old, '<', 'eventlog.txt') or die 'Could not open eventlog.txt';
open ($new, '>', 'eventlog_nodatetime.txt') 
  or die 'Could not open eventlog.nodatetime.txt');

$\ = "\n";

while (<$old>) {
  chomp;
  s/^(\S+\s+\S+\s+)\S+\s+(.*)/$1$2/;
  print $new;
}

close $old;
close $new;

或者

perl -pe 's/^(\S+\s+\S+\s+)\S+\s+(.*)/$1$2/' eventlog.txt >eventlog.nodatetime.txt

或者在拆分上使用拼接？
或者 ...

I guess it isn't encoding (as in say ISO 8859-1 vs UTF-8) but line-endings (CR, LF vs LF).

If you used chomp and printed "\n" you'd probably get line endings converted to platform native.

I think your script might be better written something like this (Untested):

#!/usr/bin/perl 
use strict;
use warnings;

open ($old, '<', 'eventlog.txt') or die 'Could not open eventlog.txt';
open ($new, '>', 'eventlog_nodatetime.txt') 
  or die 'Could not open eventlog.nodatetime.txt');

$\ = "\n";

while (<$old>) {
  chomp;
  s/^(\S+\s+\S+\s+)\S+\s+(.*)/$1$2/;
  print $new;
}

close $old;
close $new;

perl -pe 's/^(\S+\s+\S+\s+)\S+\s+(.*)/$1$2/' eventlog.txt >eventlog.nodatetime.txt

Or use a splice on a split?
Or ...

回复收藏 0 原文

~没有更多了~

关于作者

沉默的熊

暂无简介

0 文章

0 评论

22 人气

关注发私信

淡笑忘祈一世凡恋

文章 0 评论 0

关注

我们的影子

文章 0 评论 0

关注

素年丶

文章 0 评论 0

关注

南笙

文章 0 评论 0

关注

18215568913

文章 0 评论 0

关注

qq_xk7Ean

文章 0 评论 0

友情链接

文江博客

为什么 gedit 无法识别从 perl 程序创建的输出文件的编码？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

淡笑忘祈一世凡恋

我们的影子

素年丶

南笙

18215568913

qq_xk7Ean

友情链接

为什么 gedit 无法识别从 perl 程序创建的输出文件的编码？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

淡笑忘祈一世凡恋

我们的影子

素年丶

南笙

18215568913

qq_xk7Ean

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。