用于检查数据库列以确定其内容的工具
我正在使用一个不完整记录的 DBMS 系统,并且我正在寻找一个通用软件工具来检查列中的值并返回其中内容的描述。
我想我正在寻找 DESCRIBE
、SELECT DISTINCT col
、SELECT MIN(COL)、MAX(COL)
和其他之间的交叉汇总统计。
理想情况下,我希望它能够执行诸如检测文本列并宣布诸如“此列是 UTF-8 文本,5% NULL,15% 一个单词,30% 两个单词,35% 三个单词,其余的则是其他内容。
或者“此列是一个日期戳。值的范围为 2001-02-01 : 2024-01-01。没有 NULL”
这个工具是否存在于任何地方?有什么建议吗?谢谢。
I'm working with an incompletely documented DBMS system, and I am looking for a general purpose software tool that will examine the values in columns and return a description of what's in there.
I guess I'm looking for a cross between DESCRIBE
, SELECT DISTINCT col
, SELECT MIN(COL), MAX(COL)
, and other summary statistics.
Ideally I'd like it to be able to do such things as detect a text column and announce things like "This column is UTF-8 text, 5% NULL, 15% one word, 30% two words, 35% three words, and the rest something else.
Or "This column is a datestamp. Values lie in the range 2001-02-01 : 2024-01-01. with no NULLs"
Does this tool exist anywhere? Any suggestions? Thank you.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
听起来您正在寻找数据分析工具。
有一个名为 Talend Open Profilier 的开源产品,它可以用于分析数据。还有多种商业产品可用 - Informatica、微软。
It sounds like you're looking for a Data Profiling tool.
There's an open source product called Talend Open Profilier which can be used to profile data. There are also several commercial products available - Informatica, Microsoft.
数据库可视化工具
http://www.dbvis.com/
您可以免费获取社区版。
Db Visualizer
http://www.dbvis.com/
You can get a community edition for free.