- 架构 秒杀系统优化思路
- 架构 细聊分布式 ID 生成方法
- 互联网架构,如何进行容量设计?
- 线程数究竟设多少合理
- 单点系统架构的可用性与性能优化
- 一分钟了解负载均衡的一切
- lvs 为何不能完全替代 DNS 轮询
- 如何实施异构服务器的负载均衡及过载保护?
- 究竟啥才是互联网架构 高并发
- 究竟啥才是互联网架构 高可用
- 100 亿数据 1 万属性数据架构设计
- TCP 接入层的负载均衡、高可用、扩展性架构
- 架构师 数据库与缓存
- 数据库软件架构设计些什么
- 细聊冗余表数据一致性
- 缓存架构设计细节二三事
- 缓存与数据库一致性优化
- 主从 DB 与 cache 一致性优化
- DB 主从一致性架构优化 4 种方法
- 多库多事务降低数据不一致概率
- mysql 并行复制降低主从同步延时的思路与启示
- 互联网公司为啥不使用 mysql 分区表?
- 即使删了全库,保证半小时恢复
- 啥,又要为表增加一列属性?
- 这才是真正的表扩展方案
- 一分钟掌握数据库垂直拆分
- 数据库秒级平滑扩容架构方案
- 100 亿数据平滑数据迁移,不影响服务
- 58 到家数据库 30 条军规解读
- 再议 58 到家数据库军规
- 业界难题 跨库分页 的四种方案
- 架构师 服务化与微服务
- 互联网架构为什么要做服务化?
- 微服务架构多 微 才合适?
- 为什么说要搞定微服务架构,先搞定 RPC 框架?
- 微服务架构之 RPC-client 序列化细节
- RPC-client 异步收发核心细节
- 架构师 消息系统
- http 如何像 tcp 一样实时的收消息?
- 微信为什么不丢消息?
- 微信为啥不丢 离线消息?
- 群消息这么复杂,怎么能做到不丢不重?
- QQ 状态同步究竟是推还是拉?
- 微信多点登录与 QQ 消息漫游架构随想
- 消息 时序 与 一致性 为何这么难?
- 58 到家通用实时消息平台架构细节(Qcon2016)
- 微信为啥这么省流量?
- 应用层/安全层/传输层如何进行协议选型?
- 架构师 消息总线架构
- 10w 定时任务,如何高效触发超时
- 1 分钟实现 延迟消息 功能
- 消息总线能否实现消息必达?
- 架构师 搜索架构
- 深入浅出搜索架构引擎、方案与细节(上)
- 如何迅猛的实现搜索需求
- 百度如何能实时检索到 15 分钟前新生成的网页?
- 架构师 架构实践
- 好架构是进化来的,不是设计来的(58 架构演进)
- 58 同城推荐系统架构设计与实现
- 从 0 开始做互联网推荐-以 58 转转为例
- 从 0 开始做垂直 O2O 个性化推荐-以 58 到家美甲为例
- 58 到家入驻微信钱包的技术优化
- 创业公司快速搭建立体化监控之路(WOT2016)
- 巧用 CAS 解决数据一致性问题
- 百度咋做长文本去重
- 如何快速实现高并发短文检索
- 如何实现超高并发的无锁缓存?
- id 串行化 到底是怎么实现的?
- 从 IDC 到云端架构迁移之路(GITC2016)
- 架构师 一分钟系列
- 一张 神图 看懂单机/集群/热备/磁盘阵列(RAID)
- 一分钟学 awk 够用(产品经理都懂了)
- 十分钟学 perl 够用(客服 MM 都懂了)
- 一分钟 sed 入门(一分钟系列)
- 一分钟了解两阶段提交 2PC(运营 MM 也懂了)
- 30 秒懂 SQL 中的 join(2 幅图+30 秒)
- 连接池原来这么简单(一分钟系列)
- 一分钟实现分布式锁
- 这才是真正的分布式锁
- 一分钟一幅图 TCP/IP 搞定
- 一分钟理解负载 LoadAverage
- 1 分钟了解 Leader-Follower 线程模型
- 架构师 通用素质
- 心态:晋升的为什么不是你
- 你的收入取决于你的努力程度
- 老公,我穿这衣服好看吗 终于破解了
- 一分钟经理人
- 架构师到底该不该写代码
- 如何做一场 B 格满满的技术大会演讲
lvs 为何不能完全替代 DNS 轮询
之前的文章“ 一分钟了解负载均衡的一切 ”引起了不少同学的关注,评论中大家争论的比较多的一个技术点是 接入层负载均衡技术 ,部分同学持这样的观点:
1)nginx 前端加入 lvs 和 keepalived 可以替代“DNS 轮询”
2)F5 能搞定接入层高可用、扩展性、负载均衡,可以替代“DNS 轮询”
“DNS 轮询”究竟是不是过时的技术,是不是可以被其他方案替代,接入层架构技术演进,是本文将要细致讨论的内容。
一、问题域
nginx、lvs、keepalived、f5、DNS 轮询,每每提到这些技术,往往讨论的是接入层的这样几个问题:
1) 可用性 :任何一台机器挂了,服务受不受影响
2) 扩展性 :能否通过增加机器,扩充系统的性能
3) 反向代理+负载均衡 :请求是否均匀分摊到后端的操作单元执行
二、上面那些名词都是干嘛的
由于每个技术人的背景和知识域不同,上面那些名词缩写(运维的同学再熟悉不过了),还是花 1 分钟简单说明一下(详细请自行“百度”):
1) nginx :一个高性能的 web-server 和实施反向代理的软件
2) lvs :Linux Virtual Server,使用集群技术,实现在 linux 操作系统层面的一个高性能、高可用、负载均衡服务器
3) keepalived :一款用来检测服务状态存活性的软件,常用来做高可用
4) f5 :一个高性能、高可用、负载均衡的硬件设备(听上去和 lvs 功能差不多?)
5) DNS 轮询 :通过在 DNS-server 上对一个域名设置多个 ip 解析,来扩充 web-server 性能及实施负载均衡的技术
三、接入层技术演进
【裸奔时代(0)单机架构】
裸奔时代的架构图如上:
1)浏览器通过 DNS-server,域名解析到 ip
2)浏览器通过 ip 访问 web-server
缺点 :
1)非高可用,web-server 挂了整个系统就挂了
2)扩展性差,当吞吐量达到 web-server 上限时,无法扩容
注:单机不涉及负载均衡的问题
【简易扩容方案(1)DNS 轮询】
假设 tomcat 的吞吐量是 1000 次每秒,当系统总吞吐量达到 3000 时,如何扩容是首先要解决的问题,DNS 轮询是一个很容易想到的方案:
此时的架构图如上:
1)多部署几份 web-server,1 个 tomcat 抗 1000,部署 3 个 tomcat 就能抗 3000
2)在 DNS-server 层面,域名每次解析到不同的 ip
优点 :
1)零成本:在 DNS-server 上多配几个 ip 即可,功能也不收费
2)部署简单:多部署几个 web-server 即可,原系统架构不需要做任何改造
3)负载均衡:变成了多机,但负载基本是均衡的
缺点 :
1)非高可用: DNS-server 只负责域名解析 ip,这个 ip 对应的服务是否可用,DNS-server 是不保证的 ,假设有一个 web-server 挂了,部分服务会受到影响
2)扩容非实时:DNS 解析有一个生效周期
3)暴露了太多的外网 ip
【简易扩容方案(2)nginx】
tomcat 的性能较差,但 nginx 作为反向代理的性能就强多了,假设线上跑到 1w,就比 tomcat 高了 10 倍,可以利用这个特性来做扩容:
此时的架构图如上:
1)站点层与浏览器层之间加入了一个反向代理层,利用高性能的 nginx 来做反向代理
2)nginx 将 http 请求分发给后端多个 web-server
优点 :
1)DNS-server 不需要动
2)负载均衡:通过 nginx 来保证
3)只暴露一个外网 ip,nginx->tomcat 之间使用内网访问
4)扩容实时:nginx 内部可控,随时增加 web-server 随时实时扩容
5)能够保证站点层的可用性:任何一台 tomcat 挂了,nginx 可以将流量迁移到其他 tomcat
缺点:
1)时延增加+架构更复杂了:中间多加了一个反向代理层
2)反向代理层成了单点,非高可用:tomcat 挂了不影响服务, nginx 挂了怎么办?
【高可用方案(3)keepalived】
为了解决高可用的问题,keepalived 出场了(之前的文章“ 使用 shadow-master 保证系统可用性 ”详细介绍过):
此时:
1)做两台 nginx 组成一个集群,分别部署上 keepalived,设置成相同的虚 IP,保证 nginx 的高可用
2)当一台 nginx 挂了,keepalived 能够探测到,并将流量自动迁移到另一台 nginx 上,整个过程对调用方透明
优点 :
1)解决了高可用的问题
缺点 :
1)资源利用率只有 50%
2)nginx 仍然是接入单点, 如果接入吞吐量超过的 nginx 的性能上限怎么办,例如 qps 达到了 50000 咧?
【scale up 扩容方案(4)lvs/f5】
nginx 毕竟是软件,性能比 tomcat 好,但总有个上限,超出了上限,还是扛不住。
lvs 就不一样了,它实施在操作系统层面;f5 的性能又更好了,它实施在硬件层面;它们性能比 nginx 好很多,例如每秒可以抗 10w,这样可以利用他们来扩容,常见的架构图如下:
此时:
1)如果通过 nginx 可以扩展多个 tomcat 一样,可以通过 lvs 来扩展多个 nginx
2)通过 keepalived+VIP 的方案可以保证可用性
99.9999%的公司到这一步基本就能解决接入层高可用、扩展性、负载均衡的问题。
这就完美了嘛?还有潜在问题么?
好吧,不管是使用 lvs 还是 f5,这些都是 scale up 的方案,根本上,lvs/f5 还是会有性能上限,假设每秒能处理 10w 的请求,一天也只能处理 80 亿的请求(10w 秒吞吐量*8w 秒),那万一 系统的日 PV 超过 80 亿怎么办呢? (好吧,没几个公司要考虑这个问题)
【scale out 扩容方案(5)DNS 轮询】
如之前文章所述,水平扩展,才是解决性能问题的根本方案,能够通过加机器扩充性能的方案才具备最好的扩展性。
facebook,google,baidu 的 PV 是不是超过 80 亿呢,它们的域名只对应一个 ip 么, 终点又是起点,还是得通过 DNS 轮询来进行扩容 :
此时:
1)通过 DNS 轮询来线性扩展入口 lvs 层的性能
2)通过 keepalived 来保证高可用
3)通过 lvs 来扩展多个 nginx
4)通过 nginx 来做负载均衡,业务七层路由
四、结论
聊了这么多,稍微做一个简要的总结:
1) 接入层架构要考虑的问题域为 :高可用、扩展性、反向代理+扩展均衡
2)nginx、keepalived、lvs、f5 可以很好的解决 高可用、扩展性、反向代理+扩展均衡 的问题
3)水平扩展 scale out 是解决扩展性问题的根本方案, DNS 轮询是不能完全被 nginx/lvs/f5 所替代的
末了,上一篇文章有同学留言问 58 到家采用什么方案 ,58 到家目前部署在阿里云上,前端购买了 SLB 服务(可以先粗暴的认为是一个 lvs+keepalived 的高可用负载均衡服务),后端是 nginx+tomcat。
五、挖坑
接入层讲了这么多,下一章,准备讲讲服务层“异构服务的负载均”(牛逼的机器应该分配更多的流量,如何做到?)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论