如何在自定义Arangosearch Analyzer中删除空字符串

发布于 2025-02-10 17:52:45 字数 1386 浏览 2 评论 0原文

我有一个像text_en一样的自定义分析仪，但不包括连字符作为定界符：

{pipeline:[
 {type:"norm",properties:{
  locale: "en.utf-8", accent: false, case: "lower", stemming: false}},
 {type:"delimiter",properties:{delimiter:" "}},
 {type:"delimiter",properties:{delimiter:"!"}},
 {type:"delimiter",properties:{delimiter:"."}},
 {type:"delimiter",properties:{delimiter:","}},
 {type:"delimiter",properties:{delimiter:";"}},
 {type:"delimiter",properties:{delimiter:"?"}},
 {type:"delimiter",properties:{delimiter:"["}},
 {type:"delimiter",properties:{delimiter:"]"}},
 {type:"delimiter",properties:{delimiter:"{"}},
 {type:"delimiter",properties:{delimiter:"}"}},
 {type:"delimiter",properties:{delimiter:"("}},
 {type:"delimiter",properties:{delimiter:")"}},
 {type:"delimiter",properties:{delimiter:"<"}},
 {type:"delimiter",properties:{delimiter:">"}},
 {type:"delimiter",properties:{delimiter:"~"}},
 {type:"delimiter",properties:{delimiter:"@"}},
 {type:"delimiter",properties:{delimiter:"="}},
 {type:"delimiter",properties:{delimiter:"&"}},
 {type:"delimiter",properties:{delimiter:"|"}},
 {type:"delimiter",properties:{delimiter:"\n"}},
 {type:"stem",properties:{locale:"en.utf-8"}}]}'

问题是这样的链接将返回空字符串。字符串“ Hypnos2，Aphrodite和其他微控制器”的令牌。这是：

[
 "hypnos2",
 "",
 "aphrodit",
 "and",
 "other",
 "microcontrol",
 ""
]

我该怎么做才能在此分析仪中删除空字符串令牌？

原文

I've got a custom analyzer that is like text_en but doesn't include the hyphen as a delimiter:

{pipeline:[
 {type:"norm",properties:{
  locale: "en.utf-8", accent: false, case: "lower", stemming: false}},
 {type:"delimiter",properties:{delimiter:" "}},
 {type:"delimiter",properties:{delimiter:"!"}},
 {type:"delimiter",properties:{delimiter:"."}},
 {type:"delimiter",properties:{delimiter:","}},
 {type:"delimiter",properties:{delimiter:";"}},
 {type:"delimiter",properties:{delimiter:"?"}},
 {type:"delimiter",properties:{delimiter:"["}},
 {type:"delimiter",properties:{delimiter:"]"}},
 {type:"delimiter",properties:{delimiter:"{"}},
 {type:"delimiter",properties:{delimiter:"}"}},
 {type:"delimiter",properties:{delimiter:"("}},
 {type:"delimiter",properties:{delimiter:")"}},
 {type:"delimiter",properties:{delimiter:"<"}},
 {type:"delimiter",properties:{delimiter:">"}},
 {type:"delimiter",properties:{delimiter:"~"}},
 {type:"delimiter",properties:{delimiter:"@"}},
 {type:"delimiter",properties:{delimiter:"="}},
 {type:"delimiter",properties:{delimiter:"&"}},
 {type:"delimiter",properties:{delimiter:"|"}},
 {type:"delimiter",properties:{delimiter:"\n"}},
 {type:"stem",properties:{locale:"en.utf-8"}}]}'

The issue is that chaining like this will return empty strings. The tokens for the string "HYPNOS2, Aphrodite and other Microcontrollers." is this:

[
 "hypnos2",
 "",
 "aphrodit",
 "and",
 "other",
 "microcontrol",
 ""
]

What do I do to remove the empty string tokens in this analyzer?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

羁客 2025-02-17 17:52:45

定界符之后，我在管道中添加了另一个阶段。这是一个aql，带有keepnull = false和return @param ==“”“？null：@param的Querystring。如果有人有更简单的建议，我很感兴趣。

回复收藏 0 原文

~没有更多了~

关于作者

渔村楼浪

暂无简介

文章

27 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

如何在自定义Arangosearch Analyzer中删除空字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如何在自定义Arangosearch Analyzer中删除空字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。