是否可以在没有SSIS的情况下执行T-SQL模糊查找?
SSIS 2005/2008 进行模糊查找和分组。 T-SQL 中是否有具有相同功能的功能?
SSIS 2005/2008 does fuzzy lookups and groupings. Is there a feature that does the same in T-SQL?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
模糊查找使用 q-gram 方法,将字符串分解为微小的子字符串并对它们进行索引。 然后,您可以通过将输入分解为大小相等的字符串来搜索输入。 您可以检查其索引的格式并编写一个 CLR 函数来使用相同样式的索引,但您可能正在谈论相当大的工作量。
他们的做法实际上非常有趣,非常简单,但提供了非常强大的匹配,并且非常可配置。
由此,我回想起上次查看索引时的情况,每个 q-gram 或子字符串都存储在表中的一行中(索引)。 该行包含一个 nvarchar 列(以及其他值),该列用作二进制数据并包含对匹配行的引用。
Microsoft Connect 上还有针对此功能的公开反馈建议。
Fuzzy lookup uses a q-gram approach, by breaking strings up into tiny sub-strings and indexing them. You can then then search input by breaking it up into equally sized strings. You can inspect the format of their index and write a CLR function to use the same style of index but you might be talking about a fair chunk of work.
It is actually quite interesting how they did it, very simple yet provides very robust matching and is very configurable.
From that I recall of the index when I last looked at it, each q-gram or substring is stored in a row in an table (the index). That row contains an nvarchar column (among other values) that is used as binary data and contains references to the rows that match.
There is also an open feedback suggestion on Microsoft Connect for this feature.
SQL Server 有一个 SOUNDEX() 函数:
SQL Server has a SOUNDEX() function:
全文搜索是一个很棒的模糊工具。 此处简要介绍
Full Text Search is a great fuzzy tool. Brief primer here
2009 年 3 月 5 日,我将在 www.sqlservercentral.com 上发布一篇文章,其中包含 Jaro-Winkler TSQL 示例
On March 5 2009 I will have an article posted on www.sqlservercentral.com with a sample of Jaro-Winkler TSQL