用于检测不利于本地化的英文字符串的 SQL 查询

发布于 2024-11-27 15:54:36 字数 345 浏览 1 评论 0原文

我希望构建一个 SQL 查询来检测不利于本地化的字符串,例如用于连接的字符串、包含不良占位符或类似内容的字符串。

示例:

  • Go to - 尾随空格
  • Subscribe to - 到某物,它应该是占位符。
  • 任何不以大写或数字
  • 开头的内容...(请随意提出想法)

我完全意识到没有完美的解决方案,获得误报是绝对正常的强>。

尽管如此,在将这些字符串发送到翻译之前,编译应该进行调查的字符串列表还是非常有用的。

I am looking to build an SQL query that would detect strings that bad for localization, like strings that are used with concatenation, that contains bad placeholders or things like this.

Example:

  • Go to - has a trailing space
  • Subscribe to - to something, it should be a placeholder.
  • anything not starting with an uppercase or number
  • other... (feel free to come with ideas)

I am fully aware that there is no perfect solution and it's absolutely normal to get false positives.

Still, it is very useful to be compile a list of strings that should be investigated before sending these to translation.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

掀纱窥君容 2024-12-04 15:54:36

我已经具备了这样做的一些条件,如下:

SELECT text FROM strings WHERE
  text REGEXP '[[:<:]](of|per|as|with|to|from|at|with)\s*
 >= 1
  /* ending with a preposition*/

  OR (NOT text REGEXP '^[A-Z0-9{]') 
  /* starting with lowercase...?*/

  OR text LIKE '%{0}%'
  /* placeholders should be named not numbered */

  OR text REGEXP '\&(nbsp|gt|lt|amp|quot|tab|copy);'
  /* HTML entities should be escaped by the code, here we need only Unicode */

  OR text REGEXP '%[0-1\.\$\*][sdifFeEgGxXocpn)]'
  /* detect printf() placeholders */

I already have some conditions for doing this, here are:

SELECT text FROM strings WHERE
  text REGEXP '[[:<:]](of|per|as|with|to|from|at|with)\s*
 >= 1
  /* ending with a preposition*/

  OR (NOT text REGEXP '^[A-Z0-9{]') 
  /* starting with lowercase...?*/

  OR text LIKE '%{0}%'
  /* placeholders should be named not numbered */

  OR text REGEXP '\&(nbsp|gt|lt|amp|quot|tab|copy);'
  /* HTML entities should be escaped by the code, here we need only Unicode */

  OR text REGEXP '%[0-1\.\$\*][sdifFeEgGxXocpn)]'
  /* detect printf() placeholders */
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文