如何在Python中正确比较来自psycopg2的unicode字符串？

发布于 2024-10-13 04:17:08 字数 948 浏览 7 评论 0原文

我在比较从 PostgreSQL 数据库获取的 UTF-8 字符串时遇到问题：

>>> db_conn = psycopg2.connect("dbname='foo' user='foo' host='localhost' password='xxx'")
>>> db_cursor = db_conn.cursor()
>>> sql_com = ("""SELECT my_text FROM table WHERE id = 1""")
>>> db_cursor.execute(sql_com)
>>> sql_result = db_cursor.fetchone()
>>> db_conn.commit()
>>> db_conn.close()
>>> a = sql_result[0]
>>> a
u'M\xfcnchen'
>>> type(a)
<type 'unicode'>
>>> print a
München
>>> b = u'München'
>>> type(b)
<type 'unicode'>
>>> print b
MÃ¼nchen
>>> a == b
False

我真的很困惑为什么会这样，我可以有人告诉我应该如何将数据库中带有变音符号的字符串与另一个字符串进行比较，所以比较是真的？我的数据库是UTF8：

postgres@localhost:$ psql -l
        List of databases
   Name    |  Owner   | Encoding 
-----------+----------+----------
 foo       | foo      | UTF8

原文

I have a problem with comparing a UTF-8 string obtained from PostgreSQL database:

>>> db_conn = psycopg2.connect("dbname='foo' user='foo' host='localhost' password='xxx'")
>>> db_cursor = db_conn.cursor()
>>> sql_com = ("""SELECT my_text FROM table WHERE id = 1""")
>>> db_cursor.execute(sql_com)
>>> sql_result = db_cursor.fetchone()
>>> db_conn.commit()
>>> db_conn.close()
>>> a = sql_result[0]
>>> a
u'M\xfcnchen'
>>> type(a)
<type 'unicode'>
>>> print a
München
>>> b = u'München'
>>> type(b)
<type 'unicode'>
>>> print b
MÃ¼nchen
>>> a == b
False

I am really confused why is this so, I can someone tell me how should I compare a string with an Umlaut from the database to another string, so the comparison is true? My database is UTF8:

postgres@localhost:$ psql -l
        List of databases
   Name    |  Owner   | Encoding 
-----------+----------+----------
 foo       | foo      | UTF8

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

娜些时光，永不杰束 2024-10-20 04:17:08

这显然是控制台区域设置的问题。

u"München" 在 Unicode 中为 u'M\xfcnchen'，在 UTF-8 中为 'M\xc3\xbcnchen'。如果采用 ISO8859-1 或 CP1252，后者就是您的 München。

Psycopg2 似乎为您提供了正确的 Unicode 值，正如它应该的那样。

回复收藏 0 原文

晚风撩人 2024-10-20 04:17:08

如果你输入

b = 'München'

type(b) ?? 你会得到什么？

也许您不需要将字符串逐字转换为 unicode 文本，因为 Python 会自动记录这一点。

编辑：我从我的 python CLI 中得到这个：

>>> b = u'München'
>>> b
u'M\xfcnchen'
>>> print b
München

当您以不同的编码获取打印结果时

If you type

b = 'München'

What do you get from type(b) ??

Maybe you don't need to literally transform the string into unicode text as Python will automatically note this.

EDIT: I get this from my python CLI:

>>> b = u'München'
>>> b
u'M\xfcnchen'
>>> print b
München

While you are gettin' your print result in a different encoding

回复收藏 0 原文

~没有更多了~

关于作者

南巷近海

暂无简介

文章

28 人气

关注发私信

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

友情链接

文江博客

如何在Python中正确比较来自psycopg2的unicode字符串？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如何在Python中正确比较来自psycopg2的unicode字符串？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。