btt 命令

发布于 2025-02-21 22:36:02 字数 14808 浏览 9 评论 0

语法

btt [选项]

命令选项

[ -a               | --seek-absolute ]  
[ -A               | --all-data ] 通常，btt 不会打印有关每个进程和每个设备数据的详细信息。如果需要该详细级别，可以指定此选项。
[ -B <output name> | --dump-blocknos=<output name> ] 此选项将以指定的输出名称为前缀向三个文件输出绝对块号
[ -d <seconds>     | --range-delta=<seconds> ] btt 输出一个包含 Q 和 C 活动的文件，活动跟踪的概念简单地意味着在彼此的某个时间段内存在 Q 或 C 跟踪。默认值为 0.1 秒；该选项允许您更改粒度。值越小，提供的数据点越多。
[ -D <dev;...>     | --devices=<dev;...> ] 通常，btt 将为在分析的跟踪中检测到的所有设备生成数据。使用此选项，可以将分析减少到传递给此选项的字符串中提供的一个或多个设备
[ -e <exe,...>     | --exes=<exe,...>  ] -e 选项提供将分析 I/O 的可执行文件列表。
[ -h               | --help ] 打印此帮助
[ -i <input name>  | --input-file=<input name> ] 指定输入文件
[ -I <output name> | --iostat=<output name> ] -I 选项指示 btt 将类似 iostat 的数据输出到指定的文件。有关数据列的详细信息，请参阅 iostat（sysstat）文档。
[ -l <output name> | --d2c-latencies=<output name> ] -l 选项允许分别输出每个 IO D2C 延迟。提供的参数为每个设备的输出名称提供了基础。
[ -L <freq>        | --periodic-latencies=<freq> ]  -L 选项允许输出 Q2C 和 D2C 延迟的周期性延迟信息。指定的频率将调节输出平均延迟的频率——表示秒的浮点值。
[ -m <output name> | --seeks-per-second=<output name> ]  触发 btt 以输出每秒寻道信息。第一列将包含时间值（秒），第二列将指示此时每秒的寻道次数。
[ -M <dev map>     | --dev-maps=<dev map>
[ -o <output name> | --output-file=<output name> ] 指定输出文件名。
[ -p <output name> | --per-io-dump=<output name> ] -p 选项将生成一个包含所有 IO“序列”列表的文件，显示每个 IO 的部分（Q、a、I/M、D 和 C）。
[ -P <output name> | --per-io-trees=<output name> ]  -P 选项将生成一个包含所有 IO“序列”列表的文件，仅显示 Q、D 和 C 操作时间。D&C 时间值与 Q 时间值用竖条隔开。
[ -q <output name> | --q2c-latencies=<output name> ] -q 选项允许分别输出每个 IO Q2C 延迟。提供的参数为每个设备的输出名称提供了基础。
[ -Q <output name> | --active-queue-depth=<output name> ]  -Q 选项允许输出显示时间戳和活动命令深度（已发出但尚未完成的命令）的数据文件。
[ -r               | --no-remaps ] 忽略重映射跟踪；较旧的内核没有实现完整的重映射 PDU。
[ -s <output name> | --seeks=<output name> ] -s 选项指示 btt 输出搜索数据，提供的参数是文件名输出的基础。每个设备有两个文件，读查找和写查找。
[ -S <interval>    | --iostat-interval=<interval> ] -S 选项指定数据输出之间使用的间隔，默认为每秒一次。
[ -t <sec>         | --time-start=<sec> ] 分析的开始时间
[ -T <sec>         | --time-end=<sec> ]  分析的结束时间
[ -u <output name> | --unplug-hist=<output name> ]  输出直方图
[ -V               | --version ] 版本信息
[ -v               | --verbose ] 详细信息
[ -X               | --easy-parse-avgs ] 以易于解析的形式提供数据，并将其写入带有.avg exentsion 的文件
[ -z <output name> | --q2d-latencies=<output name> ]  -z 选项允许分别输出每个 IO Q2D 延迟。提供的参数为每个设备的输出名称提供了基础。
[ -Z               | --do-active -Z 将输出包含数据的文件，这些数据可以绘制为显示每个设备（和整个系统）的 I/O 活动。

追踪 vda 磁盘 10 秒钟，指定目录到 mydata，文件名为 myvda，blkparse 指定输入 myvda ，输出二进制报告在 myvdabin 中，btt 输入二进制报告 myvdabin，输出 iostat 信息在 iostatreport 中，报告打印在屏幕上： https://wenjiangs.com/wp-content/uploads/2025/01/log.txt

每一行代表一次 I/O 操作。字段的含义如下：

1. 设备号和队列号

253,0 ：设备号。在这里， 253 是设备的主设备号， 0 是设备的从设备号，表示 /dev/vda 。
31360 ：是 I/O 请求的进程 ID。

2. 事件编号

1 , 2 , 3 , ..., 8 ：这是该行输出的事件编号，每个事件编号代表一次块设备的 I/O 操作。

3. 时间戳

0.000000000 、 0.000002963 、 0.000005948 等：这是该事件发生的时间戳（单位为秒），相对于 blktrace 追踪的开始时间。

4. 操作类型

这些是不同的操作类型，表示块设备的不同 I/O 操作。常见的操作类型包括：

A ：请求添加（Add）
Q ：请求排队（Queue）
G ：请求获取（Get）
P ：请求处理（Process）
UT ：请求完成的未处理（Unprocessed）
I ：请求完成（Interrupt）
D ：请求完成（Dispatch）
C ：请求完成（Complete）
在这条输出中，我们可以看到不同操作的状态，例如 A （添加）， Q （排队）， D （分派）， C （完成）。

5. 请求大小和偏移量

WS 18285248 + 8 ：表示请求的操作类型（ WS 是写操作， 18285248 是操作的偏移量， 8 是请求的大小）。这表示写操作将数据写入偏移量为 18285248 的位置，数据大小为 8 字节。

这表示设备上的块请求。 WS 表示写操作， 18285248 + 8 表示请求大小。

6. 进程信息

[barad_agent] ：这是执行该 I/O 操作的进程名称。在这个例子中， barad_agent 是操作的进程。

7. I/O 目标设备

<- (253,1) 18283200 ：这表示该操作是来自另一个设备的 I/O 请求。这是源设备和偏移量。 253,1 表示一个不同的块设备（可能是 /dev/vdb ）和 18283200 是设备上的偏移量。

解释各行：

行 1 ：
```
253,0    0        1     0.000000000 31360  A  WS 18285248 + 8 <- (253,1) 18283200
```
这是一个 I/O 请求，设备 253,0（可能是 /dev/vda ）发起了一个写操作（ WS ），写入偏移量 18285248 ，请求大小为 8 字节。它从设备 253,1 （可能是 /dev/vdb ）上获取了数据。

行 2 ：

253,0    0        2     0.000002963 31360  Q  WS 18285248 + 8 [barad_agent]

这是队列操作， barad_agent 进程将请求添加到队列中。

行 3 ：
```
253,0    0        3     0.000005948 31360  G  WS 18285248 + 8 [barad_agent]
```
这是获取请求的操作， barad_agent 进程获取请求并准备执行。
行 4 ：
```
253,0    0        4     0.000008960 31360  P   N [barad_agent]
```
这是处理请求的操作， barad_agent 进程处理该请求。

行 5 ：

253,0    0        5     0.000011457 31360 UT   N [barad_agent] 1

这是请求完成时未处理的状态。

行 6 ：

253,0    0        6     0.000012926 31360  I  WS 18285248 + 8 [barad_agent]

这是中断操作，表示该请求的 I/O 完成。

行 7 ：
```
253,0    0        7     0.000016476 31360  D  WS 18285248 + 8 [barad_agent]
```
这是分派操作，表示请求已被分配给设备并开始执行。

行 8 ：

253,0    0        8     0.000910827     0  C  WS 18285248 + 8 [0]

这是完成操作，表示请求已完成。

这些输出表明，设备 /dev/vda 上正在进行一系列的块设备 I/O 操作。每个请求从发起到完成都经历了多个步骤，包括排队、获取、处理、分派和完成。可以通过这些信息来分析磁盘 I/O 操作的时间、队列长度、请求大小等，进一步确定是否有 I/O 性能问题。如果你发现某些操作的延迟过高，或者排队时间过长，可能是磁盘存在性能瓶颈。

要判断 blktrace 中的 I/O 操作时间是否过长，主要关注每个 I/O 请求的 延迟时间 。延迟时间是指从请求发起到完成的时间间隔。以下是几种方法来分析这些延迟，并判断是否存在性能问题：

1. 计算每个 I/O 操作的延迟时间

在 blktrace 输出中，每条记录的时间戳指示了该事件发生的时间点。例如，在你的输出中，我们可以看到事件的时间戳：

253,0    0        1     0.000000000 31360  A  WS 18285248 + 8 <- (253,1) 18283200
253,0    0        2     0.000002963 31360  Q  WS 18285248 + 8 [barad_agent]
253,0    0        3     0.000005948 31360  G  WS 18285248 + 8 [barad_agent]
253,0    0        4     0.000008960 31360  P   N [barad_agent]
253,0    0        5     0.000011457 31360 UT   N [barad_agent] 1
253,0    0        6     0.000012926 31360  I  WS 18285248 + 8 [barad_agent]
253,0    0        7     0.000016476 31360  D  WS 18285248 + 8 [barad_agent]
253,0    0        8     0.000910827     0  C  WS 18285248 + 8 [0]

时间戳 ：每个事件前面的数字（例如 0.000000000 , 0.000002963 , 0.000005948 ）表示事件发生的时间，单位是秒。
事件：每个事件标识符（例如 A 、 Q 、 G 、 P 、 D 、 C ）代表不同的操作阶段。

如何计算延迟：

获取开始时间和结束时间 ：
通常，你需要关注 请求发起（A） 和 请求完成（C） 事件。例如，假设请求的开始时间是 0.000000000 ，完成时间是 0.000910827 。
计算延迟 ：
你可以通过以下方式计算延迟：
```
延迟 = 完成时间 - 发起时间
延迟 = 0.000910827 - 0.000000000 = 0.000910827 秒
```
也就是说，该 I/O 请求的延迟时间为 0.000910827 秒 。

2. 分析延迟时间

单个请求延迟 ：检查每个 I/O 操作的延迟。如果单个 I/O 请求的延迟时间超过了系统的预期或业务需求，那么就可以认为该请求的延迟过长。
多个请求的延迟 ：如果你有大量的 I/O 操作，并且发现大部分操作的延迟都超过了一定的阈值（例如，1ms 或 10ms），那么系统可能存在性能瓶颈。

3. 查看延迟分布和平均值

如果你在使用 blktrace 进行大规模跟踪时，可以提取所有 I/O 操作的时间戳，并计算以下内容：

平均延迟 ：所有 I/O 操作的平均延迟时间。如果平均延迟很高，可能是磁盘设备或存储系统存在瓶颈。
最大延迟 ：最大延迟时间。如果某些 I/O 请求的延迟非常高，可能是由于某些突发负载或硬件故障导致的。
延迟的标准差 ：标准差可以帮助你了解延迟的波动范围。如果标准差很大，说明 I/O 操作的延迟不稳定。

4. 设置延迟阈值

在生产环境中，你可以设置一个 延迟阈值 ，比如 1 毫秒、10 毫秒，或者根据你的应用需求设定一个合理的阈值。如果任何 I/O 操作的延迟超过这个阈值，就可以认为该操作存在问题。

例如，你可以分析延迟超过 1 毫秒的操作：

blkparse trace | awk '$4 > 0.001'

这条命令将筛选出延迟超过 1 毫秒的操作。

5. 寻找长期延迟的模式

如果你看到某些 I/O 操作的延迟特别长，且持续时间很长，可能是系统中某些操作一直处于等待状态。例如：

I/O 队列堵塞 ：如果多个请求的延迟时间持续增加，可能表示设备 I/O 队列过长，磁盘处理能力不足。
硬件问题 ：硬盘的物理损坏或存储设备故障可能导致 I/O 请求长时间得不到响应，从而产生高延迟。

6. 诊断过高延迟的原因

如果发现延迟过长，可以通过以下几种方式进行诊断：

I/O 排队 ：过长的队列可能导致延迟增加，可以通过查看 blktrace 输出中的 Q （排队）和 C （完成）事件来分析。
硬件性能瓶颈 ：检查磁盘性能（如使用 iostat , dstat 等工具）来查看设备的 I/O 响应时间。
系统负载 ：高系统负载或大量并发 I/O 操作也可能导致延迟增高。可以使用 top 或 vmstat 等工具来监控系统资源使用情况。
要判断 I/O 延迟是否过长，关键是 计算每个请求的延迟时间 （即请求完成时间减去请求发起时间）。
如果发现延迟时间显著高于预期，或者有大量的请求的延迟过高，可以进一步分析是否存在性能瓶颈。
如果 I/O 延迟过长，可能需要分析磁盘的排队情况、硬件性能、系统负载等因素，找到延迟的根本原因并加以解决。

CPU0 (myvda):
 Reads Queued:           0,        0KiB  Writes Queued:          87,      348KiB
 Read Dispatches:        0,        0KiB  Write Dispatches:       34,      348KiB
 Reads Requeued:         0               Writes Requeued:         0
 Reads Completed:        0,        0KiB  Writes Completed:       72,      640KiB
 Read Merges:            0,        0KiB  Write Merges:           53,      212KiB
 Read depth:             0               Write depth:             3
 IO unplugs:             0               Timer unplugs:          17
CPU1 (myvda):
 Reads Queued:           0,        0KiB  Writes Queued:          63,      268KiB
 Read Dispatches:        0,        0KiB  Write Dispatches:       18,      268KiB
 Reads Requeued:         0               Writes Requeued:         0
 Reads Completed:        0,        0KiB  Writes Completed:        0,        0KiB
 Read Merges:            0,        0KiB  Write Merges:           45,      180KiB
 Read depth:             0               Write depth:             3
 IO unplugs:             0               Timer unplugs:          13

这是 blkparse 命令的部分输出，用于分析系统的块设备 I/O 操作。该输出涉及两个 CPU 核心（CPU0 和 CPU1），并展示了与 myvda 块设备相关的 I/O 操作的各种统计信息。下面逐个解释这些字段的含义：

CPU0 (myvda) 和 CPU1 (myvda)

这表示两个 CPU 核心的 I/O 活动，它们都在与块设备 myvda 进行交互。输出中显示了每个 CPU 核心的 I/O 操作统计信息。

关键字段解释

Reads Queued / Writes Queued :
- 这些字段表示当前有多少读/写操作排队等待处理。 0, 0KiB 表示没有读操作排队， 87, 348KiB 表示有 87 个写操作排队，总数据量为 348 KiB。
Read Dispatches / Write Dispatches :
- 这些表示已调度的读/写操作数。 0, 0KiB 表示没有调度读操作， 34, 348KiB 表示 34 个写操作已经调度，总数据量为 348 KiB。
Reads Requeued / Writes Requeued :
- 这些表示读/写操作重新排队的次数。 0 表示没有读/写操作被重新排队。
Reads Completed / Writes Completed :
- 这些字段表示已完成的读/写操作数量。 0, 0KiB 表示没有读操作完成， 72, 640KiB 表示 72 个写操作已经完成，总数据量为 640 KiB。
Read Merges / Write Merges :
- 这些字段表示读取/写入操作合并的次数。 0, 0KiB 表示没有合并的读操作， 53, 212KiB 表示有 53 次写操作合并，总数据量为 212 KiB。
Read Depth / Write Depth :
- 这些表示 I/O 队列的深度，即等待处理的读/写操作数量。 0 表示没有等待的读操作， 3 表示有 3 个写操作在等待处理。
IO Unplugs :
- 这个字段表示 I/O 操作解堵塞的次数。 0 表示没有 I/O 解堵塞。
Timer Unplugs :
- 这个字段表示与 I/O 操作相关的定时器解堵塞次数。 17 表示 17 次定时器解堵塞。

从输出中来看，CPU0 的写操作相对较多，且写操作已经完成了 72 次，数据量为 640 KiB。
CPU1 主要有一些写操作排队，但没有完成任何写操作。
没有读操作被调度或完成，表明大多数活动是写操作。
合并写操作和写操作的队列深度表明系统可能正在优化写入，以减少 I/O 操作的开销。

Throughput (R/W): 0KiB/s / 88KiB/s
Events (myvda): 690 entries
Skips: 0 forward (0 -   0.0%)

这段输出来自 blkparse 的统计信息，主要包含以下几个字段：

1. Throughput (R/W): 0KiB/s / 88KiB/s

Read Throughput (R) : 0KiB/s 表示当前没有进行任何读操作，因此读的吞吐量为 0 KB/s。
Write Throughput (W) : 88KiB/s 表示写操作的吞吐量为 88 KB 每秒。这表明系统正在进行写操作，并且写入速率为 88 KB/s。

2. Events (myvda): 690 entries

这表示与 myvda 设备相关的 I/O 事件总数为 690 条。这些事件可能包括读写操作、调度、合并等其他 I/O 处理活动。

3. Skips: 0 forward (0 - 0.0%)

Skips ：这表示在 I/O 追踪过程中跳过的事件数。 0 forward 表示没有跳过任何事件。
0.0% 表示跳过的事件占总事件的百分比，0% 表示没有跳过任何事件。
系统没有读操作，写操作的吞吐量为 88 KB/s，表明有稳定的写入流量。
共记录了 690 条 I/O 事件，没有事件被跳过。

[root@VM-0-16-centos mydata]# btt -I iostatreport  -i myvdabin
==================== All Devices ====================

            ALL           MIN           AVG           MAX           N
--------------- ------------- ------------- ------------- -----------
Q2Qdm             0.000000438   0.047675694   5.468759846         152
Q2Cdm             0.000631999   0.001516763   0.003607410         153

Q2G               0.000000160   0.000000786   0.000004391          55
G2I               0.000001009   0.000004959   0.000026337          38
Q2M               0.000000126   0.000000332   0.000011216          98
I2D               0.000000630   0.000002691   0.000017820          38
M2D               0.000001295   0.000008099   0.000024640          98
D2C               0.000630444   0.001496100   0.003603108         153

分享到QQ

分享到微博