V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
oldboy627
V2EX  ›  程序员

有应用混沌工程的朋友吗?

  •  
  •   oldboy627 · 2021-10-28 12:02:54 +08:00 · 3176 次点击
    这是一个创建于 1127 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有在企业内应用了混沌工程的朋友吗?软件选型有什么推荐吗?
    目前看 CNCF 上有三款 Chaos Mesh ,Chaosblade(阿里巴巴出品的)和 Litmus 三款软件。要选用哪一款,有什么坑吗?
    16 条回复    2021-11-08 17:32:21 +08:00
    libook
        1
    libook  
       2021-10-28 12:20:43 +08:00
    没有应用过,这方面做得最好的貌似是 Netflix ,你可以看看他们有什么最佳实践。
    sggggy
        2
    sggggy  
       2021-10-28 14:00:46 +08:00
    找个测试环境先测吧,chaosblade 用过,后来和团队说了,想试试看要不要搞这个,大家都很慌,我们也久按住没动了。要做混沌工程,全链路监控要先做好才行。
    QAO
        3
    QAO  
       2021-10-28 14:07:51 +08:00
    如果应用已经运行在 k8s 毫无疑问用 chaos mesh,如果还是裸跑在机器上的话就用 chaosblade 吧。

    另外搞混沌工程,对这些工具的使用只是一部分,如何做好观测、恢复、自动化等都是需要考虑的
    SmiteChow
        4
    SmiteChow  
       2021-10-28 14:11:30 +08:00
    名字够玄乎
    yzbythesea
        5
    yzbythesea  
       2021-10-28 14:15:31 +08:00
    @QAO

    chaos mesh 感觉是给 service mesh 准备的?
    oldboy627
        6
    oldboy627  
    OP
       2021-10-28 14:27:42 +08:00
    @sggggy chaosblade 阿里巴巴出品的,不知道以后会不会突然就...看文档没有做国际化,感觉只是国内用户用的多
    oldboy627
        7
    oldboy627  
    OP
       2021-10-28 14:32:59 +08:00
    @QAO 我们应用已经全部都跑在 k8s 上了,没有裸机的应用。你说的自动化我们已经完善了。 相比于 blade ,我也倾向于 chaos mesh ,但是 Litmus 似乎也还不错,有 redhat 等大厂的评价。 就想看看大家都怎么选型,生产中 /测试中有什么产品的实践方案。
    oldboy627
        8
    oldboy627  
    OP
       2021-10-28 14:34:09 +08:00
    @yzbythesea 名字就是叫 ChaosMesh
    STRRL
        9
    STRRL  
       2021-10-28 15:24:40 +08:00   ❤️ 4
    还是看应用的场景吧,如果需要做 JVM 相关的 Chaos 那肯定首选 chaosblade; 如果是应用已经在 kubernetes 上, 而且更多的是做 Pod 那层的故障注入, 网络啦, IO 啦, CPU 内存压力啦等等, 那更推荐 Chaos Mesh 或 Litmus;

    个人认为,Chaos Mesh 和 Litmus 最主要的区别还是在如何定义一个故障上,二者的风格不同;至于谁好那见仁见智了,建议可以都试试;

    另外这几个项目都还处于比较初期的发展阶段,都在比较快速的迭代中,未来的要走的路还有很长;

    > 另外搞混沌工程,对这些工具的使用只是一部分,如何做好观测、恢复、自动化等都是需要考虑的

    另外这个说的很对,基建比较好,混沌工程做起来也比较方便; 当然也可以先看看混沌工程,再去反观下自己的基建哪里做的不够;

    (利益相关: 俺是 Chaos Mesh Committer
    andj4cn
        10
    andj4cn  
       2021-10-28 23:42:04 +08:00
    猴子军团整起来
    lei2j
        11
    lei2j  
       2021-10-29 09:46:54 +08:00
    这名词感觉挺新颖
    superhack
        12
    superhack  
       2021-10-29 11:55:19 +08:00
    Litmus 相对完善,不过也是各种坑
    oldboy627
        13
    oldboy627  
    OP
       2021-10-29 18:21:31 +08:00
    @superhack 扫了一眼,Litmus 好像每一个 experiments 都要部署 rbac ,好像挺麻烦的
    superhack
        14
    superhack  
       2021-10-29 21:13:30 +08:00
    @oldboy627 不用
    leeraya
        15
    leeraya  
       2021-10-30 10:46:49 +08:00
    k8s 就上 chaos mesh 吧。 之前用 chaos mesh 构建过数据库日报系统。定时跑 podkill, podfail 任务,抓日志,画图,每天生成数据库运行报告。用起来还可以的,文档也全。
    yorelog
        16
    yorelog  
       2021-11-08 17:32:21 +08:00
    最近也在调研准备内部应用混沌工程。初步想法是 chaos mesh ,chaosblade 两个结合使用。
    chaos mesh 本身也结合一部分 chaosblad 的功能进去了 如 jvm 注入
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1026 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 21:33 · PVG 05:33 · LAX 13:33 · JFK 16:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.