V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
zhuifeng1017
V2EX  ›  云计算

运行了 3 年的阿里云 ECS 突然宕机

  •  
  •   zhuifeng1017 · 2022-04-25 13:57:24 +08:00 · 7318 次点击
    这是一个创建于 950 天前的主题,其中的信息可能已经有所发展或是发生改变。

    突然阿里云短信告知服务器宕机重启,这算阿里云故障吗?

    30 条回复    2022-04-27 00:22:03 +08:00
    singerll
        1
    singerll  
       2022-04-25 14:13:24 +08:00 via Android   ❤️ 2
    不管是服务器日志,还是阿里云日志,最起码贴个日志吧。
    Mac
        2
    Mac  
       2022-04-25 14:16:50 +08:00
    阿里云前天做快照,40GB 的硬盘,做了 2 个半小时。我纯 COPY 都用不了这么久。。。
    fuyufjh
        3
    fuyufjh  
       2022-04-25 14:23:53 +08:00   ❤️ 1
    单个宕机是 by design 的,不然还要高可用干啥
    visonnn
        4
    visonnn  
       2022-04-25 14:26:29 +08:00   ❤️ 1
    算阿里云故障。

    如 3L 老哥所说,通常都是在你这个 ECS 规格簇的 SLA 之内的。
    liprais
        5
    liprais  
       2022-04-25 14:28:51 +08:00
    不宕机叫阿里云?
    eason1874
        6
    eason1874  
       2022-04-25 14:30:24 +08:00   ❤️ 1
    算故障,但是三年才宕机一次,已经达到三个 9 可用性承诺了
    zhuifeng1017
        7
    zhuifeng1017  
    OP
       2022-04-25 14:40:25 +08:00
    阿里云回复了,是因为底层物理机突然出现问题导致的服务器宕机,可以申请赔偿。
    算了吧,服务器包月才几百块钱,能赔偿一顿早饭钱么?
    abcde51111
        8
    abcde51111  
       2022-04-25 14:45:09 +08:00
    @zhuifeng1017 #7 赔偿的话,看能不能给你续日期?不行就算了。。反正一年没多少钱?
    shuxhan
        9
    shuxhan  
       2022-04-25 14:50:48 +08:00
    套路云我之前买过一年的学生机,不知道是配置低还是活动机器的缘故,感觉 cpu 不太稳定,动不动彪 100%,直接卡死,就挂了一个博客,也没跑脚本啥的,还没到期就转到腾讯云了
    eason1874
        10
    eason1874  
       2022-04-25 14:56:31 +08:00
    @zhuifeng1017 宕机多久?以前是百倍时间赔偿,现在估计也是
    opengps
        11
    opengps  
       2022-04-25 15:08:41 +08:00 via Android
    后台有个 sla 数据可以直接点申请赔偿,赔偿算法早就是明确制订过了的
    zhuifeng1017
        12
    zhuifeng1017  
    OP
       2022-04-25 15:15:32 +08:00
    宕机 1 分 28 秒
    Dlin
        13
    Dlin  
       2022-04-25 16:26:08 +08:00
    如果给你照成了实质性的经济损失了,申请的赔偿应该会很多吧。
    zhuifeng1017
        14
    zhuifeng1017  
    OP
       2022-04-25 16:33:17 +08:00
    人家只保证 99.999%可用,剩下的 0.001%需要自己想办法了。这 0.001%导致的经济损失也得自己担
    rekulas
        15
    rekulas  
       2022-04-25 16:50:07 +08:00
    现在的云服务商标称 3 个 9 的服务,实际远不止应该有 5-6 个 9 ,3 个 9 可用性是很差的没人敢用差不多相当于每 1 、2 天都要故障一次
    eason1874
        16
    eason1874  
       2022-04-25 16:56:37 +08:00
    @zhuifeng1017 没有这么高,三个 9 是 99.9%,具体到小数点后三位数是 99.975%,周期是一个自然月

    也就是说,一个月按 30 天算,可用性条款允许每月累计宕机 10 分 48 秒
    zhuifeng1017
        17
    zhuifeng1017  
    OP
       2022-04-25 17:15:39 +08:00
    @eason1874 你说的很对,一自然月的可用性承诺不低于 99.975%
    Cmdhelp
        18
    Cmdhelp  
       2022-04-25 17:38:59 +08:00
    稳定三年了 也是阿里云
    matthewzhong
        19
    matthewzhong  
       2022-04-25 17:41:23 +08:00
    我买了一台 2G 内存的机器,经常宕机
    markgor
        20
    markgor  
       2022-04-25 18:07:41 +08:00
    腾讯云也一样的....
    上次试过底层故障自动迁移,触发了 CVM 的重启。
    那时候上面的程序没设定自启动,导致后来发现异常上去看才知道。
    Alexliu
        21
    Alexliu  
       2022-04-25 18:27:37 +08:00
    3 年不宕机,已经很 999 了,很阿里云
    tobeagoodfather
        22
    tobeagoodfather  
       2022-04-25 21:46:42 +08:00 via Android
    三年才宕一次,运气够好了
    caotian
        23
    caotian  
       2022-04-25 23:15:22 +08:00
    腾讯云 2c4g 的云服务器, 跑个 ci runner 编译 springboot 项目, 也不复杂的项目, 100%死机, 因为 cpu 会持续占用 100%几分钟, 然后就死掉了, 感觉像是故意的, 编译其它 node, go 都不会死机. 昨天另一台 2c4g 的云服务器, 就跑了一个 springboot 项目, 都没连数据库, 就做了一些字符串解析的服务, 跑了几个月, 突然就一样死的静悄悄的, 连通知都没有. 看监控死机前 cpu 才个位数, 内存 25%, 都占用很少, 死的莫名其妙. 稳定性跟套路云相比还是差不少.
    wizzer
        24
    wizzer  
       2022-04-25 23:46:03 +08:00
    @caotian 这个可能是你的框架代码问题,可以试试使用 budwk.com 我的框架哈哈
    goodryb
        25
    goodryb  
       2022-04-26 09:53:36 +08:00
    3 年故障时间 1 分 28 秒,这可用性已经非常厉害了。
    salmon5
        26
    salmon5  
       2022-04-26 11:34:18 +08:00
    这不是很正常吗?所有云都这样
    salmon5
        27
    salmon5  
       2022-04-26 11:35:05 +08:00
    分 2 类,有预期的和无预期的宕机,都是正常的
    hanlin85
        28
    hanlin85  
       2022-04-26 16:48:31 +08:00
    阿里云还是稳定
    我的老虎云香港服务器,每隔 3 个月左右就宕机一次,而且没有任何说法,很烦
    findex
        29
    findex  
       2022-04-26 17:46:24 +08:00
    换 VMware 的技术的杜甫吧,8 年无缝升级相当稳定
    shuang
        30
    shuang  
       2022-04-27 00:22:03 +08:00   ❤️ 1
    我司几十台 ECS ,平均两到三个月会故障宕机一次,
    每次宕机阿里云都是很快自动重启完毕了,留下运维手忙脚乱的处理
    然而并没有达到赔偿标准
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2514 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 02:42 · PVG 10:42 · LAX 18:42 · JFK 21:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.