阿里旗下蚂蚁集团运维着可能是全球最大的 k8s 集群:k8s 官方以 5k node 作为 k8s 规模化的顶峰,而蚂蚁集团事实上运维着规模达到 10k node 规模的 k8s 集群。一个形象的比喻就是,如果官方以及跟着官方的 k8s 使用者能想象到的k8s的集群规模是泰山,那么蚂蚁集团在官方的解决方案之上已经实现了一个珠穆朗玛峰,引领了 k8s 规模化技术的提升。

这个量级的差异,不仅仅是量的差异,更是 k8s 管理维护的质的提升。能维护有如此巨大挑战巨量规模的 k8s 集群,其背后原因是蚂蚁集团付出了远大于 k8s 官方的优化努力。

所谓万丈高楼平地起,说到这里,我给大家整理了一份:阿里内部从零开始学K8S核心笔记这份资料分为理论和实践两个部分进行讲解,让我们来看看文档内容具体如下:

理论模块

理解集群控制器


集群网络详解


集群伸缩原理


认证与调度


实践


镜像拉取


实践

读懂这一篇,集群节点不下线


节点下线姊妹篇


我们为什么会删除不了集群的命名空间?


阿里云ACK产品安全组配置管理


二分之一活的微服务


半夜两点Ca证书过期问题处理惨况总结


以上就是这份文档的概况,一次搞懂6个核心原理吃透基础理论,学会6个典型问题的华丽操作,不管是架构师还是开发者,又或是运维,都能够从中学到不少。

上面的文档已整理成册,感兴趣的朋友可以戳戳领