Mysql 保加利亚语、字符集

发布于 2025-01-07 13:07:43 字数 251 浏览 0 评论 0原文

我有一个包含多种语言的 Mysql 表，一种语言一个字段。

我的字符集是 utf_general_ci

当我使用 phpMyAdmin 查看表时，我有一个保加利亚语页面，如下所示：

Ð—Ð° Ð½Ð°Ñ

这是一个标题。同样的标题出现在网站上，如下所示：

За нас  (this is correct)

我做错了什么？

原文

I have a Mysql table with multiple languages, one language a field.

My character set is utf_general_ci

When I look into the table with phpMyAdmin I have a bulgarian page which looks like this:

Ð—Ð° Ð½Ð°Ñ

This is a title. This same title shows up in the website like this:

За нас  (this is correct)

What am I doing wrong?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

巨坚强 2025-01-14 13:07:43

好的，尝试在实际获取记录之前执行这些查询：

mysql_query("SET NAMES 'utf8'");
mysql_query("SET character_set_results = 'utf8', character_set_client = 'utf8', character_set_connection = 'utf8', character_set_database = 'utf8', character_set_server = 'utf8'");

然后继续执行查询。当然，上述查询必须在当前数据库连接的上下文中。

OK, try to execute these queries before your actual fetching of the records:

mysql_query("SET NAMES 'utf8'");
mysql_query("SET character_set_results = 'utf8', character_set_client = 'utf8', character_set_connection = 'utf8', character_set_database = 'utf8', character_set_server = 'utf8'");

Afterwards proceed with execution of your queries. The above queries, if course, must be in context of your current database connection.

回复收藏 0 原文

梦里南柯 2025-01-14 13:07:43

这看起来数据是 UTF-8 编码的，因此在声明为 UTF-8 编码的网页上运行良好，但当程序无法处理或尚未设置为应用 UTF-8 时则不然。

例如，出现两次的字符 °Ñ 是 U+00B0 U+00D1。字节0xB0和0xD1是西里尔小写字母a，U+0430的UTF-8形式，它出现在正确文本中的相应位置。因此，显然 UTF-8 数据根据 ISO-8859-1、Windows-1252 或某些类似的 8 位编码被误解。

回复收藏 0 原文

无尽的现实 2025-01-14 13:07:43

您表中的字段使用什么字符集？
您能否分享这些字段的 SHOW CREATE TABLE 命令的相关部分？

由于 ISO-8859-1 是 mysql 的默认数据库字符集，并且它大多数情况下不进行任何转换，因此人们将其用作 BINARY 并仅将 UTF-8 编码的西里尔字母存储到其中。这适用于 Web 开发工具，因为它们绑定到字段并以 UTF-8 编码的二进制字节形式接收数据，然后不进行转换，将其放入网页中，该网页显示其输出使用 utf-8 编码。因此数据只是通过而没有被正确编码以供数据库使用。当然，当您在数据库内执行操作时，这会导致各种问题（例如获取字符与字节长度并尝试正确排序）。但对于基本的存储/检索操作来说，它看起来很有效。
对于非本地化 Web 应用程序来说，这是一种非常典型的行为，这些应用程序假设它们最多使用 ASCII 或 ISO-8859-1。
解决方法是使用 UTF-8 编码创建一组新表，然后将错误编码的 utf-8 数据显式转码为宽字符，然后将它们放入 utf-8 表中，以便数据库知道正确的编码用过的。

回复收藏 0 原文

~没有更多了~