替换包含#0 的字符串？

发布于 2024-09-07 23:12:07 字数 582 浏览 8 评论 0原文

我使用此函数将文件读取为字符串

function LoadFile(const FileName: TFileName): string;
begin
  with TFileStream.Create(FileName,
      fmOpenRead or fmShareDenyWrite) do begin
    try
      SetLength(Result, Size);
      Read(Pointer(Result)^, Size);
    except
      Result := '';  
      Free;
      raise;
    end;
    Free;
  end;
end;

这是文件的文本：

version

这是 LoadFile 的返回值：

'ÿþv'#0'e'#0'r'#0's'#0'i'#0'o'#0'n'#0

我想创建一个包含“verabc”的新文件。问题是我仍然无法用“abc”替换“sion”。我用的是D2007。如果我删除所有#0，那么结果就变成了汉字。

原文

I use this function to read file to string

function LoadFile(const FileName: TFileName): string;
begin
  with TFileStream.Create(FileName,
      fmOpenRead or fmShareDenyWrite) do begin
    try
      SetLength(Result, Size);
      Read(Pointer(Result)^, Size);
    except
      Result := '';  
      Free;
      raise;
    end;
    Free;
  end;
end;

Here's the text of file :

version

Here's the return value of LoadFile :

'ÿþv'#0'e'#0'r'#0's'#0'i'#0'o'#0'n'#0

I want to make a new file contain "verabc". The problem is I still have a problem to replace "sion" with "abc". I am using D2007. If I remove all #0 then the result become Chinese character.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一人独醉 2024-09-14 23:12:07

您认为的文件文本并不是真正的文件文本。您读入字符串变量的内容是准确的。您有一个编码为小端 UTF-16 的 Unicode 文本文件。前两个字节表示字节顺序标记，之后的每对字节表示字符串的另一个字符。

如果您正在读取 Unicode 文件，则应使用 Unicode 数据类型，例如 WideString。设置字符串长度时，您需要将文件大小除以二，并且需要丢弃前两个字节。

如果您不知道正在读取哪种文件，那么您需要先读取前两个或三个字节。如果前两个字节是 $ff $fe，如上所述，那么您可能有一个小端 UTF-16 文件；将文件的其余部分读入 WideString 或 UnicodeString（如果您有该类型）。如果它们是 $fe $ff，那么它可能是大端字节序；将文件的其余部分读取到 WideString 中，然后交换每对字节的顺序。如果前两个字节是 $ef $bb，则检查第三个字节。如果是$bf，那么它们可能是UTF-8字节顺序标记。丢弃所有三个并将文件的其余部分读入 AnsiString 或字节数组，然后使用 UTF8Decode 等函数将其转换为 WideString< /代码>。

将数据放入 WideString 后，调试器将显示它包含 version，并且使用支持 Unicode 的 StringReplace< 版本应该不会有任何问题。 /code> 进行替换。