TMD，K8S这堆YAML，老子今天非得给你扒层皮——深挖Containerd CRI的Socket死锁

早上开会，又听那帮产品经理在那儿吹逼，什么云原生、微服务，叨逼叨个没完，真想把他们的脑浆子抠出来看看是不是浆糊。一个个连DockerFile都不会写，还他妈云原生架构，原生个JB！
行，既然他们这么喜欢K8S，那我就来好好聊聊这玩意儿，特别是Containerd这块儿。别以为写几个YAML就能上天了，底层的东西，你们这帮小年轻根本没概念。
今天就说说Containerd CRI的Socket死锁。这玩意儿，说白了，就是Containerd在处理CRI请求的时候，Socket卡住了，导致Pod起不来，应用挂逼。别跟我说重启Containerd，重启能解决问题，还要我这老家伙干嘛？
这事儿的根源往往在于Containerd处理CRI请求的逻辑不够健壮，特别是在并发高，或者网络环境复杂的情况下，容易出现Socket资源竞争，最终导致死锁。具体现象就是`ctr task exec`、`kubectl exec`之类的命令卡住，Pod状态一直是`ContainerCreating`或者`CrashLoopBackOff`。
要排查这玩意儿，首先得看Containerd的日志。`/var/log/containerd/containerd.log`，瞪大你的狗眼，看看里面有没有类似下面的错误信息：
“`
ERRO[2024-10-27T10:00:00.000000000+08:00] failed to serve request error=”rpc error: code = Unavailable desc = connection error: desc = \”transport: Error while dialing: dial unix /run/containerd/containerd.sock: connect: connection refused\””
“`
这玩意儿，就是Containerd的Socket通信出了问题。要么是Containerd进程挂了，要么就是Socket连接被占满了。
接下来，得祭出神器`strace`。这玩意儿能追踪进程的系统调用，是排查底层问题的利器。
“`bash
strace -p $(pidof containerd) -s 2048 -f -o containerd.strace
“`
这条命令会跟踪Containerd进程的所有系统调用，并将结果输出到`containerd.strace`文件中。然后，用你那可怜的脑子分析这个文件。重点关注`accept`、`send`、`recv`、`close`等Socket相关的系统调用。看看有没有长时间阻塞在某个调用上的情况。
比如，你可能会发现大量的线程都阻塞在`accept`调用上，这意味着Containerd没有足够的线程来处理新的连接请求。这可能是由于线程池配置不合理，或者某些请求处理时间过长导致的。
解决这个问题，可以尝试以下几种方法：
1. **调整Containerd的配置**。在`/etc/containerd/config.toml`中，可以调整`grpc.max_concurrent_streams`参数，增加并发处理能力。
“`toml
[grpc]
max_concurrent_streams = 1000 # 默认是500，可以适当增加
“`
重启Containerd生效。
2. **检查网络环境**。确保Containerd和kubelet之间的网络通信正常。如果使用了网络插件，也要检查网络插件的配置是否正确。
3. **优化应用代码**。如果某些请求处理时间过长，可能是由于应用代码存在性能问题。需要对应用代码进行优化，减少请求处理时间。
还有一种情况，就是Socket文件被其他进程占用了。可以用`lsof`命令来查看：
“`bash
lsof /run/containerd/containerd.sock
“`
如果发现有其他进程占用了这个Socket文件，那就把那个进程干掉。
最后，如果以上方法都无效，那就只能祭出终极大法：**升级Containerd版本**。新版本通常会修复一些已知的Bug，并优化性能。
总之，解决Containerd CRI的Socket死锁问题，需要深入理解Containerd的底层原理，熟练掌握各种排查工具，以及具备丰富的实战经验。别指望百度一下就能解决问题，真正的技术，是靠积累和思考得来的。
TMD，写完这篇文章，感觉又老了十岁。这帮小年轻，啥时候才能真正理解底层技术的重要性？天天只会玩YAML，迟早要出大事！

TMD，K8S这堆YAML，老子今天非得给你扒层皮——深挖Containerd CRI的Socket死锁

更多文章

记一次令人窒息的“性能优化”：别把无知当极客

深度剖析：K8s环境下CFS Bandwidth Control引发的P99延时毛刺与内核级调优

记一次早高峰的TCP黑洞：当“安全合规”遇上网络文盲

运维事故：消失的Pod，和那个错得离谱的YAML