使用 Elizabeth 为应用生成随机样本数据

发布于 2024-12-08 09:13:46 字数 3144 浏览 8 评论 0

Lorem ipsum dolor sit amet, consectetuer adipiscing elit. Aenean commodo ligula eget dolor. Aenean massa. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nec, pellentesque eu, pretium quis, sem. Nulla consequat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu.

不，我的文章没有被 Lorem ipsum 生成器劫持（LCTT 译注：Lorem ipsum，中文又称乱数假文，只是一段用来测试排版效果的占位文字，没有实际的含义）。作为本月的 Nooks＆Crannies 专栏文章，我发现了一个有趣的小 Python 库，以帮助开发人员为其应用程序生成随机数据。它被称为 Elizabeth 。

它由 Líkið Geimfari 编写，并在 MIT 许可证下发行，Elizabeth 以 21 个不同本地化信息提供了 18 种数据提供器，可用于生成随机信息（LCTT 译注：不仅是随机数），包括姓名和个人特征、地址、文本数据、交通信息、网络和 Internet 社交媒体数据、数字等等。安装它需要 Python 3.2 或更高版本，您可以使用 pip 或从 git 仓库安装它。

在我的测试机上，我在一个全新安装的 Debian Jessie 上使用 pip 来安装它，要做的就是 apt-get install python3-pip ，它将安装 Python 和所需的依赖项。然后 pip install elizabeth ，之后就安装好了。

只是为好玩，让我们在 Python 的交互式解释器中为一个人生成一些随机数据：

>>> from elizabeth import Personal
>>> p=Personal('en')
>>> p.full_name(gender="male")
'Elvis Herring'
>>> p.blood_type()
'B+'
>>> p.credit_card_expiration_date()
'09/17'
>>> p.email(gender='male')
'jessie7517@gmail.com'
>>> p.favorite_music_genre()
'Ambient'
>>> p.identifier(mask='13064########')
'1306420450944'
>>> p.sexual_orientation()
'Heterosexual'
>>> p.work_experience()
39
>>> p.occupation()
'Senior System Designer'
>>>

在代码中使用它就像创建一个对象那样，然后调用要你需要填充数据的对应方法。

Elizabeth 内置了 18 种不同的生成工具，添加新的生成器并不困难；你只需要定义从 JSON 值集合中获取数据的例程。以下是一些随机文本字符串生成，再次打开解释器：

>>> from elizabeth import Text
>>> t=Text('en')
>>> t.swear_word()
'Rat-fink'
>>> t.quote()
'Let them eat cake.'
>>> t.words(quantity=20)
['securities', 'keeps', 'accessibility', 'barbara', 'represent', 'hentai', 'flower', 'keys', 'rpm', 'queen', 'kingdom', 'posted', 'wearing', 'attend', 'stack', 'interface', 'quite', 'elementary', 'broadcast', 'holland']
>>> t.sentence()
'She spent her earliest years reading classic literature, and writing poetry.'

使用 Elizabeth 填充 SQLite 或其它你可能需要用于开发或测试的数据库并不困难。其介绍文档给出了使用 Flask 这个轻量级 web 框架的一个医疗应用程序示例。

我对 Elizabeth 印象很深刻 - 它超快、轻量级、易于扩展，它的社区虽然小，但是很活跃。截至本文写作时，项目已有 25 名贡献者，并且提交的问题处理迅速。Elizabeth 的完整文档至少对于美国英语而言易于阅读和遵循，并提供了广泛的 API 参考。

我曾尝试通过修改链接来查找该文档是否有其他语言，但没有成功。因为其 API 在非英语区域中是不同的，所以记录这些变化将对用户非常有帮助。公平地说，通过阅读其代码并找出可用的方法并不难，即使你的 Python 功力并不深厚。对我来说，另一个明显的缺陷是缺乏阿拉伯语或希伯来语区域测试数据。这些是著名的从右到左的语言，对于试图使其应用程序国际化的开发者来说，适当地处理这些语言是一个主要的障碍。像 Elizabeth 这种在此方面可以协助的工具是值得拥有的。

对于那些在应用中需要随机样本数据的开发员而言，Elizabeth 是一个有价值的工具，而对于那些试图创建真正多语言、本地化应用程序的开发者来说，它可能是一个宝藏。

分享到QQ

分享到微博