MongoDB正则表达式查询查找unicode替换字符
我正在尝试手动修复 Mongo 数据库中的一些包含 Unicode 替换字符的文档(看起来像问号,请参阅 http://www.fileformat.info/info/unicode/char/fffd/index.htm)。我已经解决了为什么这些字符最终出现在那里的问题,但也想保留旧数据。所以我想要的只是一个简单的查询,它返回包含该字符的所有文档。
到目前为止,我想到的是
db.songs.find({artist: /\ufffd/});
找到所有艺术家姓名包含替换字符的歌曲。到目前为止还没有运气。
I am trying to manually fix some documents in my Mongo database which contain the Unicode replacement character (looks like a question mark, see http://www.fileformat.info/info/unicode/char/fffd/index.htm). I already fixed the issue why these characters ended up there but would like to keep the old data too. So all I want is a simple query which returns all documents containing this character.
What I came up with so far is
db.songs.find({artist: /\ufffd/});
to find all songs with an artist name containing the replacement character. No luck so far.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
似乎它不喜欢正则表达式中的
\uXXXX
。尝试:Seems it doesn't like
\uXXXX
in the regexp. Try:要为正则表达式碰撞旧线程 :D,您需要转义反斜杠,否则它将转义 u:
db.songs.find({artist: /\\ufffd/});
To bump an old thread :D for regex you need to escape the backslash otherwise it will escape the u instead:
db.songs.find({artist: /\\ufffd/});