这两天搞出一个线上事故,还好定级比较轻微。然后今天开会复盘,发现前辈的思路和逻辑确实比较好,把各个点都想到了。

  首先这个问题为什么发生,误操作,因为本来是只读的操作,变成了写操作,动了机器,后边也去恢复了。至于脚本存在的问题什么的,都不是什么主要原因。

  其次是后续的改进,可写操作的命令,需要通过机器防火墙验证,这个不是我们组可以完成的,所以可以和运维的去商量,最后能不能落地,这个没法保证。

  最后给脚本的写操作加上了一些double confirm的验证。然后这种流程的完善,大家是否认可,以免后边不认可又说现在没有沟通好。

 

感觉确实非常非常好说的,需要学习这种对问题的理解。

 

  又听李志的几首歌,听到沙哑的声音就掉鸡皮疙瘩,https://www.youtube.com/watch?v=725WGspTJqI这个义乌里唱的梵高先生,让我思考一件事情。里面有几个人总在破坏氛围一样,在大家认真听的时候吹口哨,大喊。这让我去想什么时候应该认真。

  为什么会想到这个呢,因为发现对很多事情感觉到不在意,对许多苦难嗤之以鼻,许多荒谬的事情习以为常,以一种玩笑的心态去对待,我在嘲笑他的时候突然就明白这是个界限的问题,视频里大叫的几个人可能也一直这个心态。我觉得这个事情的关键在于能不能感受到认真,感受到认真后自己表现的行动是怎样就是自己选择的了。比如一件事感觉到严肃,但是自己选择去笑置它。如果单纯没有感受,快速略过了感觉,可能就有些问题。

  个人的应对机制对待负面感受会本能逃避,那么如果强迫自己不再逃避这种感受只是观察它,我认为虽然最终结果和直接略过一样,可以做到笑置,但是会复杂地更多,会共情更多。我觉得应该先去感受,先去认真,去看能否感受到情绪的复杂性,当感受地足够多,我相信会吧这种复杂性给简化。人的行为就是简化后的结果,个人的感受基本是不外溢的,这有助于我们通过简单的行为推理复杂的感受,可以更了解自己,认识社会。

 

 

技术:

  看了下ovs热升级那一块的流程,热升级关键点在于老进程把所有信息发给新进程,然后老进程暂停,新进程接手,然后老进程退出。如果中间有问题,那么新进程就退出,老进程继续跑。只是到老进程暂停那一步,才是停止首发包,但是这是通过ovsDB实现的,流程就是加一个暂停的配置,主循环跑到更新配置的时候读配置,然后知会dpif-netdev,应用配置,这个流程比较慢。还有就是整个热升级流程,pmd暂停太长。

  发现之前的两个严重的bug,写代码总是漏掉什么东西,因为之前规划好了怎么写,导致写的时候都没怎么看,没怎么想。还总眼瓢,明明就在屏幕里,还没注意,应该更注意一些。

  配环境的时候还出现了个问题,自己好蠢,花了很久才解决,就是函数找不到,我去vscode一搜发现有啊,怎么试都不行,最后发现机器上的代码没有,vscode里有是因为我搜索的路径变大了,搜到其他文件夹了。