当前位置：文江博客话题详情

帮助读取文本文件中的换行符

发布于 2024-07-21 05:28:19 字数 206 浏览 8 评论 0原文

我有一个 TXT 文件，需要通过应用程序导入，但由于某种原因，我需要先在写字板中打开它，然后在导入之前保存它。我猜这与换行符有关。因为如果我先在记事本中打开它，则没有换行符，但如果我用写字板打开它，则行会分开。

有谁知道为什么会发生这种情况以及如何避免手动打开文件并用写字板保存？该应用程序是用 vb 6 编写的（哎呀！）。

谢谢你的帮助

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

把回忆走一遍 2024-07-28 05:28:19

这是一个行结束问题。您的代码（和记事本）想要查看回车符 (CR)/换行符 (LF) 对，这可能是仅 CR (Macintosh) 或仅 LF (Unix) 文件。写字板更宽容，并且在保存时显然（尚未测试）为您保存 CR/LF 对。

您可以更改应用程序中的代码以查找任何结尾并轻松处理它们：只需停止将 vbCrLf 作为一对查找并查找其中一个作为行尾即可。我自己的策略是扫描 CR 或 LF 并消耗后面的所有 CR/LF 字符：这也会清除空白行。

回复收藏 0 原文

-柠檬树下少年和吉他 2024-07-28 05:28:19

文件的每行末尾可能只有一个回车符 (CR) 或换行符 (LF)。

在 Windows 中，每行末尾都需要一个 CR 和 LF 字符。这可以在 VB6 中通过使用常量 vbCRLF 轻松完成。

另一方面，如果您是读取文件的人，则可以确定缺少哪一个并在读取文件时手动添加它（即使用替换功能将 CR 转换为 CRLF 或 LF 转换为 CRLF）。

回复收藏 0 原文

温柔一刀 2024-07-28 05:28:19

除非这些文件非常大并且性能至关重要，否则可以通过 ADODB.Stream 对象轻松完成按行读取它们。

这不仅可以处理多个行分隔符（Stream.LineSeparator = adCR、adCRLF 或 adLF），还可以用于处理包含 Unicode (UTF-16)、UTF-8、系统代码页 ANSI 和替代“ANSI”编码的文件对于其他语言环境。

例如，如果您有一个包含俄语区域设置中的“ANSI”的文本文件，您可以设置 Stream.Charset = "koi8-r" 并通过正确转换为 VB6 Unicode (UTF-16) 读取数据：

Dim Stm As ADODB.Stream
Dim Line As String
Dim Counter As Long
Set Stm = New ADODB.Stream
With Stm
    .Open
    .LoadFromFile "russian.txt"
    .Type = adTypeText
    .Charset = "koi8-r"
    .LineSeparator = adLF
    Do Until .EOS
        Line = .ReadText(adReadLine) 'Text is in Unicode now.
        Counter = Counter + 1
    Loop
    .Close
End With

字符集默认为值“unicode”（UTF-16），但要使用默认代码页以 ANSI 读取或写入流，您可以将其设置为“ascii”。

HKCR\MIME\Database\Charset 包含可用值。

Unless these files are very large and performance is critical, reading them by line can be accomplished easily via the ADODB.Stream object.

Not only will this handle several line delimiters (Stream.LineSeparator = adCR, adCRLF, or adLF) it can also be used to process files containing Unicode (UTF-16), UTF-8, system codepage ANSI, and alternative "ANSI" encodings for other locales.

For example if you have a text file that contains "ANSI" from a Russian language locale you can set Stream.Charset = "koi8-r" and read the data with proper translation into VB6 Unicode (UTF-16):

Dim Stm As ADODB.Stream
Dim Line As String
Dim Counter As Long
Set Stm = New ADODB.Stream
With Stm
    .Open
    .LoadFromFile "russian.txt"
    .Type = adTypeText
    .Charset = "koi8-r"
    .LineSeparator = adLF
    Do Until .EOS
        Line = .ReadText(adReadLine) 'Text is in Unicode now.
        Counter = Counter + 1
    Loop
    .Close
End With

Charset defaults to the value "unicode" (UTF-16) but to read or write the Stream in ANSI with the default codepage you can set it to "ascii" instead.

HKCR\MIME\Database\Charset contains the available values.

回复收藏 0 原文

~没有更多了~