用户指南

用户指南
- 安装 logkit Pro 到机器
- 收集数据
  - 获取数据
  - 解析数据
    - 按grok格式解析
  - 转换数据
  - 发送数据
- 分发收集器
- 查看收集器运行信息
- 机器管理
- 标签管理

安装 logkit Pro 到机器

进入 logkit Pro 官网，点击【机器管理】-> 【添加机器】，进入安装页面，logkit Pro 提供自动录入和手动安装两种方式添加机器。

手动安装：点击【复制地址】，就可以获取我们提供的一键式安装脚本。

在安装之前，您可以为机器指定一个标签来统一管理同一个业务下的机器。

用户指南 - 图1

对于linux或mac用户来说，直接在控制台粘贴并执行复制的命令即可。

对于windows用户，将复制的url在浏览器打开，将内容复制到文本文件中，并另存为 logkit.vbs，再双击执行 logkit.vbs 脚本安装。

用户指南 - 图2

自动录入：输入机器 ip、ssh 端口、用户信息等在服务器上安装 Agent。

安装好以后您可以在【机器管理】列表看到机器的相关信息，如机器所属标签、机器里的所有收集器、机器地址等，详细信息阅读机器管理。

收集数据

在机器上安装好 logkit Pro 之后就可以开始收集数据。进入数据收集页面，点击添加收集器开始配置收集器。

用户指南 - 图4

获取数据

第一步是接收数据源，logkit Pro 支持多种数据来源和读取模式，根据需要在左侧列表选取。

填写好配置信息之后，选择您添加的 agent，点击【获取数据】，系统将使用您的配置，让 agent 去获取实际的数据，并且展示样例数据以验证您的配置是否正确。

用户指南 - 图5

默认不需要配置高级选项，高级选项保持默认值即可。

logkit Pro 支持的采集数据源

File: 读取文件中的日志数据，包括 csv 格式的文件，kafka-rest 日志文件， nginx 日志文件等，并支持多种读取模式（fileauto、dir、file、tailx）
MySQL: 读取 MySQL 中的数据。
MSSQL: 读取 Microsoft SQL Server中的数据。
Postgre SQL: 读取 PostgreSQL 中的数据。
ElasticSearch: 读取 ElasticSearch 中的数据。
MongoDB: 读取 MongoDB 中的数据。
Kafka: 读取 Kafka 中的数据。
Redis: 读取 Redis 中的数据。
Socket: 读取 tcp\udp\unixsocket 协议中的数据。
Http: 作为 http 服务端，接受 POST 请求发送过来的数据。
Script: 支持执行脚本，读取执行结果中的数据。
Snmp: 主动抓取 Snmp 服务中的数据。
AWS CloudWatch: 主动抓取 AWS CloudWatch接口中的数据。
AWS CloudTrail: 主动抓取 AWS CloudTrail中的数据。

关于数据源类型以及高级选项详细介绍，请阅读数据源类型。

解析数据

第二步，根据数据源配置合适解析方式，抽取数据中的字段，转化为结构化数据，充分保障您的配置一定能在实际场景中生效。logkit Pro 支持多种格式的日志解析，按需选取并填写相应的配置信息即可。

按grok格式解析

通过配置 grok pattern 解析，将文本格式的字符串转化为结构化的数据。使用 grok 解析日志内容会使得日志分析更加容易。logkit Pro 提供默认匹配日志的 grok 表达式、grok 划词以及自定义 grok 表达式三种方式进行解析。

默认 grok 表达式：

使用系统匹配日志的 grok pattern 来解析您的数据：

用户指南 - 图6

如果默认 pattern 解析没法满足您的需求，logkit Pro 支持自定义 grok pattern。

grok划词

通过在数据上划词解析数据：在数据上点选数据内容，系统会自动匹配 grok 变量生成 pattern,字段名、字段类型与 grok 变量均可编辑。通过划词生成的 pattern 以及划词解析后的数据均可见。

用户指南 - 图7

如果部分数据内容无法全部用划词解析，您还可以编辑 pattern。

用户指南 - 图8

点击验证即查看解析结果。

您也可以直接输入自定义 pattern。

用户指南 - 图9

其他解析方式：

按原始日志逐行发送：直接按行读取日志内容。
按 json 格式解析：通过 json 反序列化解析日志内容，无需任何配置，系统根据日志内容自动解析。
按 csv 格式解析：按分隔符解析日志。
按 nginx 日志解析：专门解析 Nginx 日志。仅需指定 nginx 的配置文件地址，即可进行 nginx 日志解析。
按 syslog 格式解析:自动解析系统日志
七牛日志库格式解析: 七牛开源的 golang 日志库日志格式解析
按 kafkarest 日志解析: Kafkarest 日志解析
通过解析清空数据：清空读取的数据
按 mysql man 请求日志解析: mysql 慢请求日志解析

关于其他数据解析方式的详细解说，请阅读数据解析方式。

转换数据

logkit Pro 提供数据转换功能来满足一些更精细的字段解析需求。

在大多数场景下，用 Parser 解析就解决了问题，但是有些场合，用 Parser 来做数据解析可能过于简单，如 json parser。如果数据里面有一部分字段您希望做一些扩展，比如有个 IP 字符串，您希望将其扩展为 IP 对应的区域、城市、省份、运营商等信息，此时您就可以配置一个 Transformer，对 IP 字段进行转换。

再比如，当您希望做一些字符串替换的时候，只针对某个字段做一个字符串替换处理，那就可以配置一个 replace transformer。