- 前言
- Go 与操作系统
- Go 内部机制
- Go 基本数据类型
- 4 组合类型的使用
- 5 数据结构
- 6 Go package 中不为人知的知识
- 7 反射和接口
- 8 Go UNIX 系统编程
- 08.1 关于 UNIX 进程
- 08.2 flag 包
- 8.2 flag 包
- 08.3 io.Reader 和 io.Writer 接口
- 08.4 bufio 包
- 08.5 读取文本文件
- 08.6 从文件中读取所需的数据量
- 08.7 为什么我们使用二进制格式
- 08.8 读取 CSV 文件
- 08.9 写入文件
- 08.10 从磁盘加载和保存数据
- 08.11 再看strings包
- 08.12 关于bytes包
- 08.13 文件权限
- 08.14 处理 Unix 信号
- 08.15 Unix 管道编程
- 08.16 遍历目录树
- 08.17 使用 ePBF
- 08.18 关于 syscall.PtraceRegs
- 08.19 跟踪系统调用
- 08.20 User ID 和 group ID
- 08.21 其他资源
- 08.22 练习
- 08.23 总结
- 9 并发 Goroutines、Channel 和 Pipeline
- 10 Go 并发-进阶讨论
- 11 代码测试、优化及分析
- 12 Go 网络编程基础
- 13 网络编程 - 构建服务器与客户端
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
08.5.2 逐词读取文本文件
本节中展示的技术将通过byWord.go
文件演示,它由四部分组成。正如你在Go
代码中看到的,分隔一行中的单词可能比较棘手。程序的第一部分如下:
package main
import (
"bufio"
"flag"
"fmt"
"io"
"os"
"regexp"
)
byWord.go
的第二部分代码如下:
func wordByWord(file string) error {
var err error
f, err := os.Open(file)
if err != nil {
return err
}
defer f.Close()
r := bufio.NewReader(f)
for {
line, err := r.ReadString('\n')
if err == io.EOF {
break
} else if err != nil {
fmt.Printf("error reading file %s", err)
return err
}
wordByWord()
函数的这部分代码和byLine.go
程序的lineByLine()
函数一样。
byWord.go
第三部分代码如下:
r := regexp.MustCompile("[^\\s]+")
words := r.FindAllString(line, -1)
for i := 0; i < len(words); i++ {
fmt.Printf(words[i])
}
}
return nil
}
wordByWord()
函数的剩余代码是全新的,并使用正则表达式对输入的每行进行单词分割。正则表达式regexp.MustCompile("[^\\s]+")
使用空格分割单词。
byWord.go
的最后一部分代码如下:
func main() {
flag.Parse()
if len(flag.Args()) == 0 {
fmt.Printf("usage: byWord <file1> [<file2> ...]\n")
return
}
for _, file := range flag.Args() {
err := wordByWord(file)
if err != nil {
fmt.Println(err)
}
}
}
执行byWord.go
会产生如下的输出:
$ go run byWord.go /tmp/adobegc.log
01/08/18
20:25:09:669
|
[INFO]
可以使用wc(1)
验证byWord.go
的正确性:
$ go run byWord.go /tmp/adobegc.log | wc
91591 91591 559005
$ wc /tmp/adobegc.log
4831 91591 583454 /tmp/adobegc.log
如你所见,wc(1)
计算所得的单词数和byWord.go
一致。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论