ResultSet：通过索引检索列值与通过标签检索

发布于 2024-07-07 17:22:53 字数 439 浏览 8 评论 0原文

使用 JDBC 时，我经常遇到这样的结构，就像

ResultSet rs = ps.executeQuery();
while (rs.next()) {
    int id = rs.getInt(1);
    // Some other actions
}

我问自己（以及代码作者）为什么不使用标签来检索列值：

int id = rs.getInt("CUSTOMER_ID");

我听到的最好的解释是关于性能的。但实际上，它会使处理速度变得非常快吗？我不相信这一点，尽管我从未进行过测量。尽管通过标签检索会慢一些，但在我看来，它提供了更好的可读性和灵活性。
那么有人可以给我很好的解释，避免通过列索引而不是列标签检索列值吗？两种方法的优缺点是什么（也许对于某些 DBMS 而言）？

原文

When using JDBC, I often come across constructs like

ResultSet rs = ps.executeQuery();
while (rs.next()) {
    int id = rs.getInt(1);
    // Some other actions
}

I asked myself (and authors of code too) why not to use labels for retrieving column values:

int id = rs.getInt("CUSTOMER_ID");

The best explanation I've heard is something concerning performance. But actually, does it make processing extremely fast? I don't believe so, though I have never performed measurements. Even if retrieving by label would be a bit slower, nevertheless, it provide better readability and flexibility, in my opinion.
So could someone give me good explanation of avoiding to retrieve column values by column index instead of column label? What are pros and cons of both approaches (maybe, concerning certain DBMS)?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

作妖 2024-07-14 17:22:53

警告：我会在这里夸夸其谈，因为这让我发疯。

99%* 的时间里，这是一种荒谬的微观优化，人们有一些模糊的想法让事情变得“更好”。这完全忽略了这样一个事实：除非您始终处于数百万个 SQL 结果的极其紧张和繁忙的循环中（希望这种情况很少见），否则您永远不会注意到它。对于每个不这样做的人来说，开发人员维护、更新和修复列索引中的错误所花费的时间成本远远大于性能极其糟糕的应用程序的硬件增量成本。

不要在维护它的人的代码中编写这样的优化代码。然后观察、测量、分析和优化。再观察、再测量、再分析、再优化。

优化几乎是开发的最后一步，而不是第一步。

* 图为虚构。

回复收藏 0 原文

你的背包 2024-07-14 17:22:53

您应该默认使用字符串标签。

优点：

列顺序的独立性
更好的可读性/可维护性

缺点：

您无法控制列名称（通过存储过程访问）

您更喜欢哪个？

整数？

int i = 1;  
customerId = resultSet.getInt(i++);  
customerName = resultSet.getString(i++);  
customerAddress = resultSet.getString(i++);

还是字符串？

customerId = resultSet.getInt("customer_id");  
customerName = resultSet.getString("customer_name");  
customerAddress = resultSet.getString("customer_address");

如果在位置 1 插入新列怎么办？您更喜欢哪个代码？或者，如果列的顺序发生变化，您需要更改哪个代码版本？

这就是为什么您应该默认使用字符串标签。

You should use string labels by default.

Pros:

Independence of column order
Better readability/maintainability

Cons:

You have no control over the column names (access via stored procedures)

Which would you prefer?

ints?

int i = 1;  
customerId = resultSet.getInt(i++);  
customerName = resultSet.getString(i++);  
customerAddress = resultSet.getString(i++);

or Strings?

customerId = resultSet.getInt("customer_id");  
customerName = resultSet.getString("customer_name");  
customerAddress = resultSet.getString("customer_address");

And what if there is a new column inserted at position 1? Which code would you prefer? Or if the order of the columns is changed, which code version would you need to change at all?

That's why you should use string labels by default.

回复收藏 0 原文

潦草背影 2024-07-14 17:22:53

尽管如此，答案已被接受，这里有一些我尚未看到的附加信息和个人经验。

如果可能的话，一般使用列名（最好是常量而不是文字）。这更清晰，更容易维护，并且未来的更改不太可能破坏代码。

然而，列索引是有用途的。在某些情况下，这些速度更快，但不足以覆盖上述名称*的原因。在开发处理 ResultSet 的工具和通用方法时，这些非常有价值。最后，可能需要索引，因为列没有名称（例如未命名的聚合）或者存在重复的名称，因此没有简单的方法来引用两者。

*请注意，我已经编写了一些 JDBC 驱动程序，并查看了一些开源驱动程序，这些驱动程序在内部使用列索引来引用结果列。在我处理过的所有情况下，内部驱动程序首先将列名映射到索引。因此，您可以很容易地看到，在所有这些情况下，列名总是会花费更长的时间。但这可能不适用于所有驾驶员。

回复收藏 0 原文

紫罗兰の梦幻 2024-07-14 17:22:53

来自java文档：

ResultSet 接口提供 getter 方法（getBoolean、getLong 等）用于从当前行检索列值。可以使用列的索引号或列的名称来检索值。一般来说，使用列索引会更高效。列从 1 开始编号。为了获得最大的可移植性，每行中的结果集列应按从左到右的顺序读取，并且每列只能读取一次。

当然，每个方法（命名或索引）都有它的位置。我同意命名列应该是默认值。但是，在需要大量循环的情况下，以及在同一代码（或类）部分中定义和维护 SELECT 语句的情况下，索引应该没问题 - 建议列出正在选择的列，而不仅仅是列出“SELECT * FROM...”，因为任何表更改都会破坏代码。

回复收藏 0 原文

尸血腥色 2024-07-14 17:22:53

我在 Oracle 数据库上针对这个具体主题做了一些性能分析。在我们的代码中，我们有一个包含大量列和大量行的结果集。在执行方法 oracle.jdbc.driver.ScrollableResultSet.findColumn(String name) 的 20 秒 (!) 请求中，大约需要 4 秒。

显然整体设计有问题，但是使用索引而不是列名可能会缩短 4 秒的时间。

回复收藏 0 原文

风吹过旳痕迹 2024-07-14 17:22:53

您可以两全其美！使用索引的速度以及使用列名的可维护性和安全性。

首先 - 除非您循环遍历结果集，否则只需使用列名称。

定义一组整型变量，每个变量对应您将访问的每一列。变量的名称可以包括列的名称：例如 iLast_Name。
在结果集循环之前，迭代列元数据并将每个整数变量的值设置为相应列名称的列索引。如果“Last_Name”列的索引为 3，则将“iLast_Name”的值设置为 3。
在结果集循环中，使用 GET/SET 方法中的整型变量名称。变量名称是开发人员/维护人员关于正在访问的实际列名称的视觉线索，但值是列索引，将提供最佳性能。

注意：初始映射（即列名到索引映射）仅在循环之前完成一次，而不是针对循环中的每个记录和列。

回复收藏 0 原文

夏末 2024-07-14 17:22:53

当然，使用列名可以提高可读性并使维护变得容易。但使用列名也有不利的一面。如您所知，SQL 允许多个列名同名，但不能保证您在 resultSet 的 getter 方法中键入的列名实际上指向您要访问的列名。理论上，使用索引号代替列名是首选，但这会降低可读性。

回复收藏 0 原文

葬花如无物 2024-07-14 17:22:53

我认为使用标签不会对性能产生太大影响。但不使用 String 还有另一个原因。或者 int ，就此而言。

考虑使用常量。使用 int 常量使代码更具可读性，但也不太可能出现错误。

除了更具可读性之外，该常量还可以防止您在标签名称中出现拼写错误 - 如果您这样做，编译器将抛出错误。任何有价值的 IDE 都会选择它。如果您使用String或int，则情况并非如此。

回复收藏 0 原文

摇划花蜜的午后 2024-07-14 17:22:53

JDBC 驱动程序负责索引查找的列。因此，如果每次驱动程序进行查找（通常在哈希映射中）时按列名称提取值，以检查列名称的相应索引。

回复收藏 0 原文

柳絮泡泡 2024-07-14 17:22:53

我同意之前的答案，即性能并不能迫使我们选择任何一种方法。最好考虑以下几点：

代码可读性：对于每个阅读代码的开发人员来说，标签比索引更有意义。
维护：考虑 SQL 查询及其维护方式。在修复/改进/重构 SQL 查询后，您的情况更有可能发生什么：更改提取列的顺序或更改结果列名称。在我看来，更改提取的列的顺序（作为在结果集中添加/删除新列的结果）发生的可能性更大。
封装：无论您选择哪种方式，都尝试隔离在同一组件中运行 SQL 查询和解析结果集的代码，并仅让该组件了解列名及其到索引的映射（如果您决定使用它们））。

回复收藏 0 原文

奢华的一滴泪 2024-07-14 17:22:53

使用索引是一种优化尝试。

由此节省的时间被开发人员花费额外的精力来查找必要的数据以检查他们的代码在更改后是否能正常工作而浪费了。

我认为使用数字而不是文本是我们的本能。

回复收藏 0 原文

梦途 2024-07-14 17:22:53

除了在 Map 中查找标签之外，它还会导致额外的 String 创建。虽然它会发生在堆栈上，但仍然会带来成本。

这一切都取决于个人选择，到目前为止我只使用了索引:-)

回复收藏 0 原文

与之呼应 2024-07-14 17:22:53

正如其他发帖者所指出的那样，我会坚持使用列名称，除非您有非常充分的理由不这样做。与查询优化等相比，对性能的影响可以忽略不计。在这种情况下，维护比小的优化重要得多。

回复收藏 0 原文

笨死的猪 2024-07-14 17:22:53

其他答案主要关注性能，首先要进行正确性讨论。这是一个简单的情况，其中列标签不起作用，但列索引起作用：

CREATE TABLE author (
  id BIGINT PRIMARY KEY,
  first_name TEXT, ...
);

CREATE TABLE book (
  id BIGINT PRIMARY KEY,
  author_id BIGINT REFERENCES author,
  title TEXT, ...
);

然后查询：

SELECT *
FROM author
JOIN book ON author.id = book.author_id

对我来说这似乎是日常情况。代理键、连接，很常见。在这种情况下，ID 是什么？您无法通过标签来读取它们。当然，您可以为列添加别名，或者设计架构以避免任何命名冲突，但谁总是这样做呢？

这取决于这对您来说是否是一个问题，但对于任何重要的 JDBC 使用，您要么创建一个围绕 JDBC 的包装器，要么使用任何通过 JDBC 抽象的现成 API，这不会有这个不再有歧义了。

我已经详细阐述了为什么 jOOQ 在幕后使用列索引在这个类似问题的答案中。这个答案还说明了为什么仅出于性能原因，ORM 或 JDBC 包装器（如 jOOQ 或 Hibernate）更适合使用索引而不是标签。

Other answers focused a lot on performance, when there's a correctness discussion to be had, first. Here's a simple case where column labels won't work but column indexes do:

CREATE TABLE author (
  id BIGINT PRIMARY KEY,
  first_name TEXT, ...
);

CREATE TABLE book (
  id BIGINT PRIMARY KEY,
  author_id BIGINT REFERENCES author,
  title TEXT, ...
);

Then query:

SELECT *
FROM author
JOIN book ON author.id = book.author_id

Seems like an every day case to me. Surrogate keys, joins, quite common. What's ID in this case? You can't read them both with labels. Of course, you could alias your columns, or design your schema to avoid any naming conflicts, but who does that all the time?

It depends on whether this is a problem for you, but for any non-trivial JDBC usage, you'll either create a wrapper around JDBC or use any off-the-shelf API that abstracts over JDBC anyway, which won't have this ambiguity anymore.

I've elaborated a bit more on why jOOQ uses column indexes behind the scenes in this answer to a similar question. That answer also shows why ORMs or JDBC wrappers like jOOQ or Hibernate better work with indexes than labels for mere performance reasons.

回复收藏 0 原文

~没有更多了~