Puppet 简介
每个 IT 专家都遭受过代码在生产环境上不能正常运行的困境。有经验的开发者耗费几个小时、几天、乃至几个星期的时间进行应用程序开发,但在应用发布之后就不得不持续不断地为它打各种补丁。质量保证工程师能够确保应用达到了高性能和低磁盘占用的各种指标……但只限于他们的测试系统环境。运维工程师在进行每次部署操作都得逐字逐句地仔细对照检查表,结果发现他们还是得整日整夜地加班工作,才能够让应用能够在生产环境上正常运行(或者说苟延残喘)。
与此同时,公司的执行长官们则是暴跳如雷。因为他们认为自己已经花了这么多钱,却依然得不到满意的结果。“为什么新的特性要这么长时间才能发布,连改一个 bug 都要这么久?”客户们在远离我们的产品,竞争者的技术已经远远领先我们,就连华尔街也留意到了我们的颓势。
陷入以上这种困境的 IT 组织通常极度缺乏组织纪律。开发、运维和测试人员的管理各行其是,各自遵循不同的衡量标准和工作目标,他们或许在不同的大楼里工作,有些人甚至从来没有见过面。这些团队很可能使用不同的技术栈进行工作,各自使用不同的配置。应用程序的代码或许还算稳健,但除此之外就是一团散沙了。能够在开发者的笔记本、或是在 QA 环境下正常工作的代码,往往在部署到生产环境后就会出现问题。最糟糕的是:没人知道问题的根源在哪里。
Puppet 的创始人 Luke Kanies 曾经也是那些在数据中心中彻夜加班的运维人员之一。正是出于对现状的不满,促使他编写了这套如今被称为 Puppet 的软件。
等一下——我们刚才谈论的不是组织的问题吗?一套软件怎么能够解决组织文化的问题,并促进团队的协作呢?答案是,软件确实做不到这一点,至少它本身是做不到的。Puppet 是一个优秀的基础设施管理平台,可以让每个系统管理员更高效地完成工作,哪怕是一个封闭的运维团队也能够掌握。而对于那些准备提高团队的协作能力的组织来说,Puppet 能够为 共享的代码库 提供一种强力的粘合剂,以统一不同团队的工作。请耐心地听我介绍 Puppet 的工作原理,以及它是如何帮助处于各种不同状况的团队增强协作能力,以进行软件开发和发布的——这种工作方式的演变通常被称做 DevOps。
Puppet 是什么?
Puppet 这个词实际上包括了两层含义:它既代表编写这种代码的语言,也代表对基础设施进行管理的平台。
Puppet 语言
Puppet 是一种简单的建模语言,使用它编写的代码能够对基础设施的管理实现自动化。Puppet 允许对整个系统(我们称之为节点)所希望达到的最终状态进行简单地描述。这与过程式的脚本有明显的不同:编写过程式的脚本需要你清楚地知道如何将某个特定的系统转变至某种特定的状态,并且正确地编写所有这些步骤。而使用 Puppet 时,你不需要了解或指定达到最终状态的步骤,你也无需担心因为错误的步骤顺序,或是细微的脚本错误而造成错误的结果。
与过程式的脚本的另一点不同在于,Puppet 的语言能够跨平台运行。Puppet 将状态进行了抽象,而不依赖于具体实现,因此你就可以专注在你所关心的那一部分系统,而将实现的细节,例如命令的名称、参数及文件格式等等交给 Puppet 自己负责。举例来说,你可以通过 Puppet 对所有的用户以相同的方式进行管理,无论该用户是用 NetInfo 或是/etc/passwd 方式进行存储的。
这种抽象的概念正是 Puppet 功能的关键所在,它允许使用者自由选择最适合他本人的代码对系统进行管理。这意味着团队之间能够更好地进行协作,团队成员也能够对他们所不了解的资源进行管理,这种方式促进了团队共同承担责任的意识。
Puppet 这门建模语言的另一个优势在于:它是可重复的。通常来说,要继续执行脚本文件,必须对系统进行变更。但 Puppet 可以被不断地重复执行,如果系统已经达到了目标状态,Puppet 就会确保停留在该状态上。
资源
Puppet 语言的基础在于对资源的声明。每个资源都定义了系统的一个组件,例如某个必须运行的服务,或是某个必须被安装的包。以下是一些其它类型资源的示例:
- 某个用户帐号
- 某个特定的文件
- 某个文件夹
- 某个软件包
- 某个运行中的服务
可以将资源想象为构建块,他们将结合在一起,对你所管理的系统的目标状态进行建模。
接下来,我们将接触到 Puppet 中更深入核心的定义,这些定义允许你以一种经济的方式将资源进行结合,而经济正是 Puppet 的关键特色之一。
类型与提供者
Puppet 将类似的资源以 类型 的方式进行组织。举例来说,用户是一种类型,文件是另一种类型,而服务又是一种类型。当你正确地对某个资源的类型进行描述之后,接下来只需描述该资源所期望的状态即可。比起传统的写法:“运行这个命令,以启动 XYZ 服务”,你只需简单地表示:“保证 XYZ 处于运行状态”就可以了。
提供者 则在一种特定的系统中,使用该系统本身的工具实现各种资源类型。由于类型与提供者的定义被区分开来,因此某个单一的资源类型(例如“包”)就能够管理多种不同的系统中所定义的包。举例来说,你的“包”资源能够管理 Red Hat 系统下的 yum、基于 Debian 的系统下的 dpkg 和 apt,以及 BSD 系统中的端口。
管理员通常来说不大有机会对提供者进行定义,除非管理员打算改变系统的默认值。Puppet 中已经精确的写入了提供者,因此你无需了解如何对运行在基础设施中的各种操作系统或平台进行管理。再次声明,由于 Puppet 将细节进行了抽象,因此你无需担心各种细节问题。如果你确实需要编写提供者,那也通常能够找到一些简单的 Ruby 代码,其中封装了各种 shell 命令,因此通常非常简短,同时也便于创建。
类型和提供者使得 Puppet 能够运行在各种主流平台上,并且允许 Puppet 不断成长与进化,以支持运算服务器之外的各种平台,例如网络与存储设备。
下面的一个示例将为你展现 Puppet 语言的便捷性,它首先演示了如何用 shell 脚本添加一个新用户以及一个新的组,这与 Puppet 中始终一致的操作形成鲜明对比。而在使用 Puppet 的示例中,“用户”和“组”都是类型,Puppet 能够自动找到适用于你的平台的提供者。相比之下,特定于平台的过程式脚本无论是编写还是理解都要困难得多。
类、清单与模块
Puppet 语言中的其它元素的主要作用是为资源的声明提供更多的灵活性和便捷性。 类 在 Puppet 中的作用是切分代码块,将资源组织成较大的配置单元。举例来说,一个类能够包括所有安装和配置 NTP 时必须的 Puppet 代码。类的创建与调用可以在不同的地方完成。
不同的类集合可以应用在扮演不同角色的节点上。我们将其称之为“节点分类”,这是一项非常强大的能力,它允许你根据节点的能力,而不是根据节点的名称对他们进行管理。这种“别把家畜当宠物”的机器管理方式,得到了许多快速发展的组织的偏爱。
Puppet 语言文件被称为 清单 ,最简单的 Puppet 部署方式就是一个单独的清单文件加上一些资源。如果我们为以上示例中的基础 Puppet 代码命名为“user-present.pp”文件,那它就成为了一个清单。
模块 是一系列类、资源类型、文件和模板的结合,他们以一某个特定的目的,并按照某种特定的、可预测的结构组织在一起。模块可以为了各种目的而创建,可以是对 Apache 实例进行完整的配置以搭建一套 Rails 应用程序,也可以为各种其它目的进行创建。通过将各种复杂特性的实现封装在模块中,管理员就能够使用更小、可读性更好的清单文件对模块进行调用。
Puppet 模块的一个巨大优势在于模块的重用性。你可以自由使用他人编写的模块,并且 Puppet 有一个参与者数量巨大的活跃社区,除了 Puppet Labs 的员工所提编写的模块之外,社区成员们也会免费地分享他们所编写的模块。你能够在 Puppet Forge 上找到超过 3000 个可以免费下载的模块,其中有许多模块是系统管理员的工作中最常见的一些任务,因此这些模块能够节约你大量的时间。比方说,你可以使用模块进行各种管理任务,包括简单的服务器构建块(NTP、SSH)管理,乃至复杂方案(SQL Server 或 F5)的管理。
类、清单和模块都是纯粹的代码,与组织中所需要的其它任何在代码一样,它们能够、也应该被签入到版本控制系统当中,稍后我们将对这一点展开讨论。
Puppet 平台
完整的 Puppet 解决方案不仅仅是指这门语言。使用者需要在不同的基础设施中部署 Puppet 代码、时不时地对代码及配置进行更新、纠正不恰当的变更、并且时时对系统进行检查,以保证每个环节的正常运行。为了满足这些需求,大多数使用者会在某个主机-代理结构中运行 Puppet 解决方案,由一系列组件所组成。根据不同的需求,使用者可以选择运行一个或多个主机。每个节点上都会安装一个代理,通过一个经过签名的安全连接与主机进行通信。
采取主机-代理这一结构的目的是为了将 Puppet 代码部署在节点上,并长期维护这些节点的配置信息。在对节点进行配置之前,Puppet 会将清单编译为一个 目录 (catalog),目录是一种静态文档,在其中对系统资源及资源间的关系进行定义。根据节点的工作任务,以及任务的上下文不同,每个目录将对应一个单独的节点。目录定义了节点将如何工作,Puppet 将根据目录的内容对节点进行检查,判断该节点的配置是否正确,并且在需要时应用新的配置。
在常规 Puppet 运行期间,每个基于节点的代理会定期与某个主机进行检查工作,Puppet 会根据不同结果进行以下各种操作:
- 对于产生了偏差的配置进行纠正
- 仅报告节点的状态,而不进行任何改动
- 使用 Puppet 的操作工具进行必需的配置改动
- 收集节点与事件的相关数据,并加以保存,以便重试
Puppet Lab 还提供了一个商用版本的解决方案,名为 Puppet Enterprise,其中包括了客户支持服务,并提供了一系列高级且重要的功能:
- 节点管理高级功能
- 基于角色的访问控制
- 运维性指标,以及一个报表控制台
结合语言与平台
现在,你对 Puppet 的工作原理有一个基本的了解了,但你可能仍然会感到疑惑:Puppet 怎样帮助你的组织解决深层次的问题,并简化人们的协作方式呢?
一切重点在于:在你使用 Puppet 时,你是在对你的基础设施进行建模,正如对代码建模一样。你能够像对待代码一样的方式处理 Puppet,或者从更广的意义上说,是对基础设施的配置进行同样的处理。Puppet 代码能够方便地进行保存和重用,能够与运维团队的其他成员,以及其他任何需要对机器进行管理的团队成员进行分享。无论是在笔记本上的开发环境,还是在生产环境上,开发人员和运维人员都能够使用相同的清单对系统进行管理。因此当代码发布到生产环境时,各种令人不快的打击就会少很多。 这将大大改善部署的质量,尤其是在我们所见到的组织中更是如此。
将配置作为代码处理,系统管理员就能够为开发人员提供独占的测试环境,开发人员也不再将系统管理员视为碍事的人了。你甚至可以将 Puppet 代码交付给审记,如今有许多审记都接收 Puppet 清单,以进行一致性验证。这些都能够提升组织的效率,并点燃员工的热情。
最重要的一点或许在于,你能够将 Puppet 代码签入到某个共享的版本控制工具中,这将为你的基础设施提供一个可控的历史记录。你可以实行在软件开发者中十分常见的结对审查实践,让运维团队也能够不断地对配置代码进行改善、变更和测试,直到你有信心将配置提交至生产环境。
由于 Puppet 支持在模拟环境或 noop 模式下运行,你就可以在应用改动之前预先检查改动会造成的影响。这将大大缓解部署的压力,因为你可以随时选择回滚。
通过在 Puppet 使用中结合版本控制,以及之前我们所提到的各种优秀实践,许多客户实现了持续集成方面的最高境界,能够更频繁地将代码提交至生产环境,并且产生的错误更少。如果你能够以更小的增量部署应用,你就能够更早、更频繁地获得用户的反馈,它将告诉你你是否正处在正确的前进方向上。这样就可以避免在经过 6 到 12 个月开发工作,提交了大量代码之后,却发现它并不符合客户的需要,或是对客户没有吸引力这种悲惨情形的发生了。
我们的客户会选择与开发人员的应用程序代码同步对开发、测试以及生产环境上的配置进行变更,这就让开发者能够在一个非常接近于真实环境,甚至与生产环境完全相同的环境中进行工作。再也不会发生由于在开发与测试环境中的配置的不同,导致应用程序在生产环境上崩溃的情况出现了。开发者和 QA 能够部署更优秀的软件、运维人员不再需要整夜无眠、而执行官们……好吧,就算他们谈不上有多高兴,至少也能够对结果感到满意,从而将关注点转移到 IT 团队的效率以外的事情上了!
迈出第一步
不可否认,我们所见过的多数组织在持续协作方面都远远没有达到一个高水准,更不用说持续交付了。而 Puppet 的一个优点在于,随着你的团队的成长和基础设施的规模增加,Puppet 也能够随之成长。或许你还没有准备好在整个公司范围内推行 DevOps 的实践,这不要紧。许多客户都在保守的、循规蹈矩的行业,例如银行业与政府项目中成功地将 Puppet 作为配置管理工具进行应用。这些组织或许对持续交付方面的需求很低,但不管怎样,能够将基础设施作为代码进行保存与版本化,这就极大地改善了这些组织的变更控制,以及安全实践了。
我们建议你首先对某个能够简化你工作的任务开始实现自动化。举例来说,许多管理员首先会对 NTP、DNS、SSH、防火墙、用户和组等实现自动化管理,这些都是日常工作,但又经常会产生各种问题的任务。
当人们逐渐熟悉了 Puppet 之后,他们就会更进一步,开始编写更复杂的模块对服务进行管理,例如 Tomcat 的监控服务,或 JBoss 的应用服务器管理,还有一些人会开始采用 Forge 模块。当你做好进一步探索的准备,你就能够确保数据中心、乃至云端的所有机器都正确配置了各种任务、并确保这些任务运行正常,而且整个系统也处于正常运行状态中,以保证你的核心业务的应用程序正常运转。
你要记住的一点是,并非所有基础设施的代码都要你来编写,这一点非常重要。在你之前已经有人解决了这些问题,因此你只需对这些工作成果善加利用!我们之前提到了 Puppet Forge 上提供了几千个模块,你也可以在 Puppet 社区中寻求帮助,其中的模块更达到几万个之多。你也可以订阅 Google 上的 Puppet 用户组 ,或是查看 ask.puppetlabs.com 论坛上的内容,并与论坛中的活跃人士混熟。你也可以参加当地的 Puppet Camp 或 Puppet 用户小组 ,与小组成员进行面对面的交流。你还可以利用 Puppet Labs 上的学习资源 ,包括免费和付费的版本。在 YouTube 频道 上和我们的 官方文档 中也可以学到各种知识。
当你进入了 Puppet 的生态系统后,以上这些只是全部学习资源的一小部分。我们期待与你相会,帮助你学习如何使用 Puppet 改善你的基础设施、业务和工作生活。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论