允许系统适应人为错误的做法？

发布于 2024-11-25 12:14:17 字数 463 浏览 3 评论 0原文

系统有时必须适应现实世界中出现不良数据的可能性。考虑到某些数据源自纸质表格。表单本质上验证数据的手段有限。

示例 1：在一种表单中，用户需要在空白处输入整数距离（以英里为单位）。我们捕获以字符串形式写入的信息，因为我们并不总是最终获得整数值。

示例 2：在另一种形式上，我们捕获一个代码。该代码应该映射到我们系统中的代码之一。然而，有时表格上写的代码是不正确的。我们捕获代码并允许它以无效值存在，直到将来某个解决时间为止。也就是说，我们暂时允许不良数据，因为记录记录很重要，即使其中一些数据无效。

我有兴趣了解更多有关系统如何容纳不良数据（即人为错误）的信息。数据库应该是数据完整性的堡垒，但现实世界是混乱的，人们会犯错误。系统必须允许我们反思这些错误。

您开发的系统有哪些适应人为错误的方法？你用过哪些做法？你学到了什么教训？

还有关于该主题的进一步阅读吗？（我在谷歌上搜索时遇到了麻烦。）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

山色无中 2024-12-02 12:14:17

我同意你的观点，无论我们做什么，都不能保证我们能够消除错误或不正确的数据。特别是但不仅限于用户输入。根据我的经验，复杂的集成项目中也存在同样的问题，在这些项目中，您必须集成和合并从不同系统检索的数据（通常不一致）。

一个好的策略是将输入与操作系统本身分离。首先，将用户（或外部系统）提供的数据放置在单独的数据存储中（例如不同的模式）。第二步将此数据加载到您的操作数据存储中，但前提是它符合严格的规则（例如，使用地址验证软件来验证给定地址）。这种提取、转换、加载 (ETL) 方法在数据仓库 (DWH) 解决方案中相当常见，但也可以以编程方式应用在事务系统中（根据我的经验）。

上述方法通常会导致异步过程，其中输入首先被提交，并且（可能）稍后外部实体（用户或系统）检索反馈，无论其数据是否正确。

编辑：为了进一步阅读，我建议看看 DWH 概念。尽管如此，您可能不想构建这样的东西，您可以部分应用这些概念：

http: //en.wikipedia.org/wiki/Extract,_transform,_load

http://en.wikipedia.org/wiki/Data_warehouse

http: //en.wikipedia.org/wiki/Data_cleansing

回复收藏 0 原文

冷血 2024-12-02 12:14:17

我工作过的一个政府部门做了很多调查，其中大部分仍然是纸质的。

所有结果都被 OCR 到系统中。
作为 OCR 流程的一部分，会保留表格的数字扫描。
然后对数据进行验证，对无法破译或验证失败的数据进行标记。
当操作员检查数字数据时，如果他们确信自己能够正确解释代码无法解释的内容，他们就可以修改数据；他们（这是很酷的一点）还可以显示纸质原件的扫描件，并使用它来确定用户想要说什么。

在不同的线程上；在某些时候，您希望根据您希望其符合的任何预期数据范围来验证传入的数据；在进入时拒绝它，你给了用户纠正它的机会 - 权衡是，每次你拒绝它，你都会增加他们放弃整个过程的机会。

在系统中的某个时刻，您需要指定用于验证的规则。归根结底，系统的智能程度取决于这些规则。您可以自己将这些开发为代码（可能是业务逻辑），也可以使用第三方组件。

对验证进行灵活的控制非常重要，因为它们可能会随着时间的推移而改变。

回复收藏 0 原文

雨夜星沙 2024-12-02 12:14:17

老实说，从纸质系统迁移到 IT 的一个要点是消除这些错误并确保所有数据始终正确。我怀疑任何正确规划和开发的 IT 系统（尤其是商业财务系统）都会允许出现此类错误。反正不在我工作的公司...

回复收藏 0 原文

陌伤ぢ 2024-12-02 12:14:17

有很多软件工具可以解决您提到的各种问题。有些平台和工具可让您定义清理和转换数据以及处理验证错误的规则。这些技术广泛用于数据集成和商业智能应用程序。 Google 搜索“数据质量”或“数据集成”。

回复收藏 0 原文

蓝眸 2024-12-02 12:14:17

最简单的事情是（这并不总是可行）设计用户输入数据的界面，以尽可能限制他们需要输入的文本量。根据我的经验，这似乎是很多问题的根源。一个简单的例子是提供一个选择或自动完成选择字段，

您可以做的一件事是在进入数据库之前尽一切可能确定数据是否正确。我尝试为输入数据的用户提供尽可能多的反馈，以便他们（理想情况下）可以在数据持久化之前解决一些问题。例如，可以非常快速地检查以确定输入的数据类型是否正确。

回复收藏 0 原文

梦回旧景 2024-12-02 12:14:17

我在个人电脑时代之前就开始接触法律系统。诉讼支持数据库通常必须容纳事实上不正确、不完整和矛盾的信息。这需要不同的思维方式。

简短的版本。。。

您不是记录单个事实，而是记录有关一个事实的多个断言。归根结底就是设计一个数据库来存储来自此类断言的数据。

尼尔·莱姆斯 (Neil Rimes) 在 2011-01-03 08:13 接受采访时告诉凯恩警官
2011年1月2日20:00至2011年1月3日08:13期间他在家。
在2011-01-03 08:25接受采访时，丽莎·内韦尔斯告诉凯恩警官
尼尔·莱姆斯于 2011 年 1 月 2 日 23:45 回家。
在 2011 年 5 月 13 日 10:22 的证词中，科迪·麦克森 (Cody Maxon) 告诉律师库尔特 (Kurt)
施拉格尔说他在2011-01-03 03:00在克罗格见到了尼尔·莱姆斯