怎么知道一篇文章是用什么字符集的?

发布于 2022-07-25 00:45:23 字数 96 浏览 31 评论 8

我有一篇txt是从windows上导入的,我在windows上可以看出是GB2312的

我想问一下linux有什么工具看txt的字符集是GB2312的还是UTF8呢?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(8

简单爱 2022-07-27 03:04:03

原帖由 wxm8000 于 2006-9-6 08:34 发表
我在windows的notepad里只找到gb2312,所以知道那个txt是gb2312的。
所以才想问一下linux怎么知道一个文档的字符集格式呢?一个一个去试吗?

写个循环即可

  1. for file in /path/*;do
  2. file $file|grep gb2312
  3. done

复制代码
如果需要转化的话,用iconv这个工具即可

画离情绘悲伤 2022-07-27 03:00:50

ubuntu:~$ file file.txt
file.txt: UTF-8 Unicode text

三生殊途 2022-07-27 02:34:41

我在windows的notepad里只找到gb2312,所以知道那个txt是gb2312的。
所以才想问一下linux怎么知道一个文档的字符集格式呢?一个一个去试吗?

天生の放荡 2022-07-27 01:39:39

一般来说都是GB18030的好像,,,

情仇皆在手 2022-07-27 00:05:15

烈火兄不要生气嘛,我试了上面的所有的参数,没有用啊。而且没看到你所给的那个参数啊?

能不能说的详细点?拜托了 :P

深居我梦 2022-07-26 22:02:46

Usage: file [OPTION]... [FILE]...

浊酒尽余欢 2022-07-26 20:32:40

[root@test tmp]# file --help
Usage: file [OPTION]... [FILE]...
Determine file type of FILEs.

  -m, --magic-file LIST      use LIST as a colon-separated list of magic
                               number files
  -z, --uncompress           try to look inside compressed files
  -b, --brief                do not prepend filenames to output lines
  -c, --checking-printout    print the parsed form of the magic file, use in
                               conjunction with -m to debug a new magic file
                               before installing it
  -f, --files-from FILE      read the filenames to be examined from FILE
  -F, --separator string     use string as separator instead of `:'
  -i, --mime                 output mime type strings
  -k, --keep-going           don't stop at the first match
  -L, --dereference          causes symlinks to be followed
  -n, --no-buffer            do not buffer output
  -N, --no-pad               do not pad output
  -p, --preserve-date        preserve access times on files
  -r, --raw                  don't translate unprintable chars to ooo
  -s, --special-files        treat special (block/char devices) files as
                             ordinary ones
      --help                 display this help and exit
      --version              output version information and exit

找不见这个参数啊

執念 2022-07-26 08:10:32

file ur-file.txt

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文