V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
VANHOR
V2EX  ›  问与答

关于日志统计过滤的问题

  •  
  •   VANHOR · 2019-10-18 13:00:50 +08:00 · 886 次点击
    这是一个创建于 1871 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在有一个 3 个多 G 的日志文件在 linux 中,现在想统计某个字段出现的次数

    大概格式是这样的

    uri[/abc/def/ghi?giftno=1004&no=core&transid=483]

    想统计的是问号?之前的内容出现过多少次,最后想得到这样一个结果

    100 次 /abc/def/ghi
    50 次 /photo/ab/cd
    10 次 /aaa/bbb

    谢谢..我知道很简单,但是真的不会
    5 条回复    2019-10-18 14:28:07 +08:00
    lululau
        1
    lululau  
       2019-10-18 13:11:43 +08:00
    gawk -F'?' '{a[$1]++}END{for(k in a){print k": "a[k]}}'
    VANHOR
        2
    VANHOR  
    OP
       2019-10-18 13:27:26 +08:00
    @lululau 好像不行... 日志中的其他内容也出来了
    lululau
        3
    lululau  
       2019-10-18 13:42:44 +08:00
    @VANHOR 发个样本
    pkookp8
        4
    pkookp8  
       2019-10-18 14:26:40 +08:00 via Android
    awk -F"?" 'BEGIN{abc=0}{if(index{$0, "abc/def") != 0){abc++}}END{printf("%d times abc\n", abc)}'
    pkookp8
        5
    pkookp8  
       2019-10-18 14:28:07 +08:00 via Android
    @pkookp8 $0 改成$1
    手写的,不知道还有没有其他错😂
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2778 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 11:31 · PVG 19:31 · LAX 03:31 · JFK 06:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.