当前位置：文江博客话题详情

legacy legacy-code codebase

熟悉大型代码库的最佳方法是什么？

发布于 2024-07-07 03:56:07 字数 919 浏览 19 评论 0原文

加入一个拥有庞大代码库的现有团队可能会令人望而生畏。最好的方法是什么？

广阔; 代码中总体了解所有内容如何链接在一起
尝试从Narrow ；一次专注于一小部分代码，了解它们是如何充分工作的
选择一个功能来开发并边学习边
尝试从类图和 uml 中获得洞察力（如果可用的话）（并且是最新的）
完全是其他东西吗？

我正在开发目前大约 20k 行的 C++ 应用程序和应用程序。图书馆（编辑：在宏伟的计划中很小！）。在工业界，我想你会得到一位经验丰富的程序员的介绍。但是，如果情况并非如此，您可以采取什么措施来尽快开始增加价值？

--
答案摘要：

在调试模式下单步调试代码，看看它是如何工作的
与比你更熟悉代码库的人配对，轮流担任编码人员和观看/讨论人员。在团队成员之间轮换合作伙伴，以便传播知识。
编写单元测试。首先断言您认为代码将如何工作。如果结果如您所料，您可能已经理解了代码。如果没有，您就有一个难题需要解决，或者需要进行调查。（感谢 Donal，这是一个很好的答案）
以与上面类似的方式浏览功能代码的现有单元测试，
阅读 UML、Doxygen 生成的类图和其他文档，以获得对代码的广泛了解。
进行小的编辑或错误修复，然后逐渐建立
保留笔记，不要跳入并开始开发；花时间理解比生成混乱或不适当的代码更有价值。

这篇文章与-熟悉继承代码库的最佳方法

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（19）

深海蓝天 2024-07-14 03:56:07

如果可能的话，从一些小任务开始，围绕您的问题调试代码。
在调试模式下单步执行代码是了解某些内容如何工作的最简单方法。

回复收藏 0 原文

莫多说 2024-07-14 03:56:07

另一种选择是为您感兴趣的功能编写测试。设置测试工具是确定系统具有哪些依赖关系及其状态所在的好方法。每个测试都以关于您认为系统应该如何工作的方式的断言开始。如果事实证明它是这样工作的，那么您就已经取得了一些成就，并且您已经有了一些可以重现它的工作示例代码。如果这不起作用，那么你就需要解决一个难题并进行一系列调查。

回复收藏 0 原文

绝影如岚 2024-07-14 03:56:07

我通常向人们建议尚未提及的一件事是，在成为开发人员之前，成为现有代码库的合格用户非常重要。当新开发人员进入我们的大型软件项目时，我建议他们花时间成为专家用户，然后再尝试编写代码。

也许这是显而易见的，但我看到很多人试图太快地跳入代码，因为他们渴望开始取得进展。

回复收藏 0 原文

为人所爱 2024-07-14 03:56:07

这很大程度上取决于您是哪种类型的学习者和哪种程序员，但是：

首先是广泛的 - 您需要了解范围和规模。如果文档/uml 不错的话，这可能包括浏览它们。如果这是一个长期项目，并且您需要全面了解所有内容，那么我实际上可能会正确阅读文档。再说一次，如果他们很好。
狭窄——选择一些可管理的东西并尝试理解它。体验一下代码。
选择一个功能 - 如果您有信心，可以选择与您刚刚查看的功能不同的功能，然后开始进行一些小的更改。
迭代 - 评估事情的进展情况，看看是否可以从更深入地重复早期步骤中受益。

回复收藏 0 原文

阳光①夏 2024-07-14 03:56:07

我建议在其上运行 Doxygen 以获得最新的类图，然后广泛使用一段时间。这为您提供了一个快速的总体情况，您可以在深入了解代码时使用它。

回复收藏 0 原文

情归归情 2024-07-14 03:56:07

严格轮换配对。

如果可能，在浏览文档/代码库时，尝试采用严格轮换配对。意思是，你们两个人坐在一起一段固定的时间（例如，2 小时的会议），然后交换配对，一个人将继续完成该任务，而另一个人将与另一个伙伴一起完成另一项任务。

你们两人一组都会学到一些知识，然后在轮换时将这些知识提供给团队的其他成员。这样做的好处还在于，当一对新人聚集在一起时，负责该任务的人（在本例中是研究代码）可以以更容易理解的方式总结和解释这些概念。随着时间的推移，每个人都应该处于相似的理解水平，并希望避免“哦，只有约翰知道那段代码”综合症。

根据我对你的情况的了解，你有一个很好的数字（3对），但是，如果你是分布式的，或者没有按照相同的时间尺度工作，那么这是不可能的。

回复收藏 0 原文

美人如玉 2024-07-14 03:56:07

我同意这完全取决于你是什么类型的学习者。话虽如此，我曾在两家拥有非常庞大的代码库的公司工作过。通常，我的工作方式是这样的：

如果可能的话，在查看任何功能代码之前，我会先检查已经编写的单元测试。这些通常可以提供很大帮助。如果它们不可用，那么我会执行以下操作。

首先，我很大程度上忽略了实现，只查看头文件或类接口。我尝试了解每堂课的目的是什么。其次，我从似乎最重要的领域开始深入实施一级。这很难衡量，所以有时我只是从顶部开始，然后在文件列表中向下移动。我称之为广度优先学习。在这个初始步骤之后，我通常会深入了解其余的代码。最初的广度优先的外观有助于巩固/修复我从界面级别获得的任何想法，然后深度的外观向我展示了用于实现系统的模式，以及不同的设计思想。我所说的深度优先，是指您基本上使用调试器单步执行程序，单步执行每个函数以查看其工作原理，等等。对于真正的大型系统来说，这显然是不可能的，但 20k LOC 并不算多。 :)

回复收藏 0 原文

小镇女孩 2024-07-14 03:56:07

与另一位更熟悉系统的程序员合作开发新功能或修复错误。这是我见过最有效的方法。

回复收藏 0 原文

情场扛把子 2024-07-14 03:56:07

我也有类似的情况。我想说你可以这样：

如果它是一个数据库驱动的应用程序，那么从数据库开始，尝试理解每个表、它的字段以及它与其他表的关系。
一旦底层存储搞定了，就可以向上移动到 ORM 层。这些表必须在代码中具有某种表示形式。
完成后，然后继续讨论这些对象是如何以及从哪里来的。界面？什么接口？有任何验证吗？在它们进入数据存储之前会对它们进行什么预处理？

这将使您更好地熟悉该系统。请记住，只有当您非常清楚正在测试什么以及为什么需要对其进行测试时，才可以尝试编写或理解单元测试> 那样。

如果大型应用程序不是由数据库驱动的，我会推荐另一种方法：

系统的主要目标是什么？
那么解决这个问题的系统的主要组成部分是什么？
每个组件之间有什么相互作用？制作一个描述组件依赖关系的图表。询问已经在从事这方面工作的人。这些组件必须相互交换某些内容，因此也尝试找出这些组件（例如 IO 可能会将文件对象返回到 GUI 等）
一旦对此感到满意，就深入研究其中依赖性最小的组件。现在研究该组件如何进一步划分为类以及它们如何相互交互。这样，您就可以掌握单个组件的全部内容
移动到下一个最不依赖的组件
最后，移动到通常依赖于您已经解决的许多其他组件的核心
组件在核心组件中，您可能会回顾之前检查过的组件，所以不用担心，继续努力！

对于第一个策略：
以 stackoverflow 网站为例。检查数据存储、存储的内容、存储的方式、这些项目在代码中的表示形式、这些项目在 UI 上的呈现方式和位置。它们从哪里来，一旦它们返回到数据存储，就会对它们进行什么处理。

第二个
以文字处理器为例。有哪些组件？ IO、UI、页面等。它们是如何相互作用的？随着您进一步学习，继续前进。

放松。编写的代码是某人的思维方式，冻结了逻辑和思维方式，需要时间来读懂这种思维方式。

I had a similar situation. I'd say you go like this:

If its a database driven application, start from the database and try to make sense of each table, its fields and then its relation to the other tables.
Once fine with the underlying store, move up to the ORM layer. Those table must have some kind of representation in code.
Once done with that then move on to how and where from these objects are coming from. Interface? what interface? Any validations? What preprocessing takes place on them before they go to the datastore?

This would familiarize you better with the system. Remember that trying to write or understand unit tests is only possible when you know very well what is being tested and why it needs to be tested in only that way.

And in case of a large application that is not driven towards databases, I'd recommend an other approach:

What the main goal of the system?
What are the major components of the system then to solve this problem?
What interactions each of the component has among them? Make a graph that depicts component dependencies. Ask someone already working on it. These componentns must be exchanging something among each other so try to figure out those as well (like IO might be returning File object back to GUI and like)
Once comfortable to this, dive into component that is least dependent among others. Now study how that component is further divided into classes and how they interact wtih each other. This way you've got a hang of a single component in total
Move to the next least dependent component
To the very end, move to the core component that typically would have dependencies on many of the other components which you've already tackled
While looking at the core component, you might be referring back to the components you examined earlier, so dont worry keep working hard!

For the first strategy:
Take the example of this stackoverflow site for instance. Examine the datastore, what is being stored, how being stored, what representations those items have in the code, how an where those are presented on the UI. Where from do they come and what processing takes place on them once they're going back to the datastore.

For the second one
Take the example of a word processor for example. What components are there? IO, UI, Page and like. How these are interacting with each other? Move along as you learn further.

Be relaxed. Written code is someone's mindset, froze logic and thinking style and it would take time to read that mind.

回复收藏 0 原文

墨落成白 2024-07-14 03:56:07

我认为你需要将其与特定任务联系起来。当你有时间的时候，可以选择你喜欢的方法。

当你有事情需要完成时，集中注意力并完成它。

回复收藏 0 原文

时常饿 2024-07-14 03:56:07

让团队让你花两周时间修复错误（如果你有两周时间）。他们会很高兴有人负责这件事，到这段时间结束时，您将花费大量时间解决图书馆的问题，您可能会非常了解它。

回复收藏 0 原文

泼猴你往哪里跑 2024-07-14 03:56:07

如果它有单元测试（我打赌它没有）。从小处开始，确保单元测试不会失败。如果你立刻盯着整个代码库，你的眼睛会变得呆滞，你会感到不知所措。

如果没有单元测试，您需要专注于您想要的功能。运行应用程序并查看您的功能应该影响的结果。然后开始查看代码，尝试找出应用程序如何创建您想要更改的内容。最后更改它并检查结果是否符合您的要求。

您提到它是一个应用程序和一个库。首先更改应用程序并坚持以用户身份使用库。那么当你学会了这个库之后，改变起来就会更容易了。

从自上而下的方法来看，应用程序可能有一个主循环或一个主 GUI 来控制所有操作。值得了解应用程序的主要控制流程。值得阅读代码，让自己对应用程序的主要流程有一个广泛的了解。如果它是一个 GUI 应用程序，请创建一篇论文来显示有哪些屏幕以及如何从一个屏幕转到另一个屏幕。如果是命令行应用程序，处理是如何完成的。

即使在公司中，采用这种方法也并不罕见。通常没有人完全理解应用程序是如何工作的。人们没有时间带你四处参观。他们更喜欢针对具体事物的具体问题，因此您必须自己深入研究并进行实验。然后，一旦您得到具体问题，您就可以尝试隔离该应用程序部分的知识来源并提出问题。

回复收藏 0 原文

戒ㄋ 2024-07-14 03:56:07

首先了解“问题领域”（是工资系统？库存？实时控制还是其他什么）。如果您不理解用户使用的术语，您将永远无法理解代码。

然后看对象模型；可能已经有一个图表，或者您可能必须对一个图表进行逆向工程（手动或使用 Doug 建议的工具）。在此阶段，您还可以调查数据库（如果有），是否应该遵循对象模型，但也可能不遵循，了解这一点很重要。

查看更改历史记录或错误数据库，如果有一个区域经常出现，请先查看该区域。这并不意味着它写得不好，而是说它是每个人都使用的。

最后，记一些笔记（我更喜欢维基百科）。

现有的人可以用它来检查你的假设并帮助你。
您稍后需要再次参考它。
团队中的下一个新人会非常感谢你。

回复收藏 0 原文

梦归所梦 2024-07-14 03:56:07

首先，如果您有具有代码经验的团队成员，您应该安排他们与您一起概述代码。每个团队成员都应该向您提供有关其专业领域的信息。让多人解释事情通常很有价值，因为有些人比其他人更擅长解释，有些人比其他人有更好的理解。

然后，您需要开始在没有任何压力的情况下阅读一段代码（几天或一周，如果您的老板愿意的话）。它通常有助于您自己编译/构建项目，并能够在调试模式下运行项目，以便您可以单步调试代码。然后，开始实践，修复小错误并进行小改进。希望您很快就能为一个中型项目做好准备，然后再为一个大型项目做好准备。在前进的过程中继续依靠你的队友——通常你可以找到一个特别愿意指导你的人。

如果你遇到困难，不要对自己太严厉——这很正常。理解大型代码库可能需要很长时间，甚至几年。实际上，经常出现的情况是，即使经过多年，代码中的某些部分仍然有点令人恐惧和不透明。当您在项目之间遇到停机时间时，您可以深入研究这些领域，并且您经常会发现，经过几次尝试后，您甚至可以弄清楚这些部分。

祝你好运！

回复收藏 0 原文

深海夜未眠 2024-07-14 03:56:07

您可能需要考虑查看源代码逆向工程工具。我知道有两个工具：

SWAG Kit（仅限 Linux）链接
Bauhaus 学术学术 axivion.com/index-en.html" rel="nofollow noreferrer">商业

两种工具都提供类似的功能集，其中包括生成软件中模块之间关系图的静态分析。

这主要由调用图和类型/类礼仪组成。查看此信息应该可以让您很好地了解代码各部分如何相互关联。使用此信息，您可以深入了解您最感兴趣且需要首先理解/修改的部分的实际来源。

回复收藏 0 原文

姜生凉生 2024-07-14 03:56:07

我发现仅仅跳入代码可能有点让人不知所措。尝试尽可能多地阅读有关设计的文档。这有望解释每个组件的目的和结构。如果现有的开发人员可以引导您完成它，那就最好了，但这并不总是可能的。

一旦您熟悉了代码的高级结构，请尝试修复一两个错误。这将帮助您掌握实际的代码。

回复收藏 0 原文

烟燃烟灭 2024-07-14 03:56:07

我喜欢所有的答案，这些答案说你应该使用像 Doxygen 这样的工具来获取类图，并首先尝试理解大局。我完全同意这种说法。

也就是说，这很大程度上取决于代码一开始的分解程度。如果它是一个巨大的混乱，它将很难学习。如果它干净并且组织得当，那么它应该不会那么糟糕。

回复收藏 0 原文

月依秋水 2024-07-14 03:56:07

请参阅这个答案关于如何使用测试覆盖率工具来定位感兴趣的功能的代码，而不知道该功能在哪里，或者它如何分布在许多模块中。

回复收藏 0 原文

江湖正好 2024-07-14 03:56:07

（前方无耻的营销）

您应该查看nWire。它是一个 Eclipse 插件，用于导航和可视化大型代码库。我们的许多客户使用它通过打印主要流程的可视化来吸引新开发人员。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

西西弗的石头怪

文章 0 评论 0

5397313

文章 0 评论 0

烟沫凡尘

文章 0 评论 0

一个破名字

文章 0 评论 0

萌︼了一个春

文章 0 评论 0

当爱已成负担

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文