logstash 输入中文无法解析

发布于 2021-12-01 23:24:46 字数 710 浏览 942 评论 1

配置文件如下

input{
        stdin{}
}
filter {
    grok {
        match => { "message" => "%{DATA:tranId}|%{WORD:compsnyId}|%{WORD:merNo}|%{DATA:merName}"}
    }
        urldecode {
        all_fields => true
    }
}
output{
        elasticsearch {
                hosts => "192.168.137.132:9200"
        }
        stdout{codec => rubydebug}
}

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

能否归途做我良人 2021-12-02 09:57:13

 input{

        stdin{codec =>plain{charset=>"GBK"}

        }

}

filter {

    grok {

      #  match => { "message" => "%{DATA:tranId}|%{WORD:compsnyId}|%{WORD:merNo}|(?<merName>[u4e00-u9fa5.]+)"}

match => { "message" => "%{DATA:tranId}|(?<compsnyId>[u0000-u9999]+)|(?<merNamde>[u4e00-u9fa5]+)|(?<merName>[u0000-u9999]+)"}

    }

        urldecode {

        all_fields => true

    }

}

output{

        elasticsearch {

                hosts => "127.0.0.1:9200"

        }

        stdout{codec => rubydebug}

}

[u4e00-u9fa5]+  :指的是多个汉字。

[u0000-uffff]+  :代表的是多个字符(任意种)

huhu|hi|胡|中也可以输出

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文