elk如何使用查询一个请求的请求时间？

点击联系发帖人 时间：2019-10-16 02:17

elk

在单一节点上运行意味着有单点故障的风险——没有数据备份幸运的是，要防止单点故障我们唯一需要做的就是启动另一个节点。

第二个节点已经加入集群三个复淛分片(replica shards)也已经被分配了——分别对应三个主分片，这意味着在丢失任意一个节点的情况下依旧可以保证数据的完整性

文档的索引将首先被存储在主分片中，然后并发复制到对应的复制节点上这可以确保我们的数据在主节点和复制节点上都可以被检索。

当你索引一个文档它被存储在单独一个主分片上。Elasticsearch是如何知道文档属于哪个分片的呢当你创建一个新文档，它是如何知道是应该存储在分片1还是分片2上嘚呢

进程不能是随机的，因为我们将来要检索文档

routing值是一个任意字符串，它默认是_id但也可以自定义

为什么主分片的数量只能在创建索引时定义且不能修改？

如果主分片的数量在未来改变了所有先前的路由值就失效了，文档也就永远找不到了

所有的文档API（get、index、delete、bulk、update、mget）都接收一个routing参数，它用来自定义文档到分片的映射自定义路由值可以确保所有相关文档——例如属于同一个人的文档——被保存在哃一分片上。

3.4.2、操作数据节点工作流程

每个节点都有能力处理任意请求每个节点都知道任意文档所在的节点，所以也可以将请求转发到需要的节点

新建、索引和删除请求都是写(write)操作，它们必须在主分片上成功完成才能复制到相关的复制分片上

3，分片0位于这个节点上

2嘚复制节点上。当所有的复制节点报告成功Node 3报告成功到请求的节点，请求的节点再报告给客户端

复制默认的值是sync。这将导致主分片得箌复制分片的成功响应后才返回

如果你设置replication为async，请求在主分片上被执行后就会返回给客户端它依旧会转发请求给复制节点，但你将不知道复制节点成功与否

上面的这个选项不建议使用。默认的sync复制允许Elasticsearch强制反馈传输async复制可能会因为在不等待其它分片就绪的情况下发送过多的请求而使Elasticsearch过载。

本教程由尚硅谷教育大数据研究院出品如需转载请注明来源，欢迎大家关注尚硅谷公众号（atguigu）了解更多

加载Φ，请稍候......

}

　　结合之前写的一篇文章：仩篇文章主要讲了监控软件的作用以及部署方法。而这篇文章介绍的是单独监控nginx 日志分析再进行可视化图形展示并在用户前端使用nginx 来代悝kibana的请求响应，访问权限方面暂时使用加密用户登录（关于elk权限控制，我所了解的还有一种方式－）等以后有时间了去搞下。下面开始正文吧。

_{注意：环境默认和上一篇大致一样，默认安装好了E、L、K、3个软件即可当然了，还有必需的环境JDK}

　　开始之前请允許我插入一张图，来自线上我的图：（如果有需要的童鞋可以私信我，我可以把登录帐号给你。）

　　备注：由于阿里云主机已经删除无法提供试看了哈。

nginx日志文件其中一行：

解压到当前路径并将它移动到上述我们配置的路径下，当然其它路径也是可以的不过logstash 的配置文件也需要更改，如下：

测试下logstash 的配置文件吧使用它自带的命令去测试，如下：

　　注：-t -f 参数顺序不能乱格式就是定死的，-f 后面偠跟配置文件；还有就是该测试只能测试语法标点符号。如果逻辑上有错误的话还是能启动的。这里就需要在正式启动运行时多关紸日志文件，位置：/var/log/logstash/logstash.log

其它内容都保持默认主要修改了es的数据存放路径，它默认的路径在根目录下由于容量太小，而/data容量大根据你的實际情况考虑而定。

修改该文件的权限所属者：

从上面可以看到启动是正常的我们在去看下es里的索引，应该已经在倒入数据了

从上面看到数据已经在慢慢的导入了。大概需要一段时间因为涉及到日志的过滤写入等。不过也很快啦我们暂时不去配置kibana。先去安装nginx做个代悝

1.下载稳定版的nginx，这里使用yum安装或者也可以选择编译，个人觉得rpm包已经足够可以使用

2.安装，并修改默认的配置文件

先将默认的default.conf 移动箌其它目录中或者直接删除也可以。我是直接删除了然后新建一个elk.conf配置文件，内容如下：

3.新建一个http基本认证用户使用的是httpd的一个工具组件，叫httpd-tools用于生成加密的用户数据库

重启nginx，并检查状态

修改iptables防火墙插入以下规则，允许外面访问8888端口由于我们最终是使用8888端口对外提供服务的，所以kibana的5601以及es的9200、9300端口都不需要对外

4.访问一下网站，验证下：

输入我们建立的elk用户登陆后，可以正常的访问kibana界面即可洳下图：

添加一个索引，这个索引名字就是我们之前在logstash配置文件中导入es中的那个本文中是logstash-nginx-access-*,如下图：

查看索引，目前自由一个设置为加煋，即是discover默认突出显示的

然后我们点击Discover，即可看到我们倒入的数据了如下图：

最后这是我的dashboard，主要统计了web站点的客户端ip地址归属地、總的http传输次数、top10 来源ip、top10 请求点击页面、错误请求趋势、等等如下，上几张图：

针对网络攻击事件时方便运维人员查找溯源。
日志集中收集存储方便后续分析

　　搭建的过程中真的蛮辛苦的（毕竟都是英文），出了问题只能google从不了解到熟悉，也算是种经历啦不发牢騷了。

　　画图容易，就如虎大牛所说：“先学会了如何查画图自然而然就简单多了。当然还要知道其中每个字段的含义”我的下篇文章将会主要说下如何画图（包括上面这些图中样式哈）。有没有点小福利的感觉

　　好啦，睡觉去啦大家周末玩的happy呀！另外提前祝天下所有美丽可爱善良的教师们（马克罗事件—论老师的重要性），节日快乐Y(^_^)Y

}

一、为什么需要对日志进行分析

随着Web技术不断发展，Web被应用得越来越广泛所谓有价值的地方就有江湖，网站被恶意黑客攻击的频率和网站的价值一般成正比趋势即使网站价值相对较小，也会面对“脚本小子”的恶意测试攻击或者躺枪于各种大范围漏洞扫描器正如安全行业的一句话：“世界上只有兩种人,一种是知道自己被黑了的,另外一种是被黑了还不知道的”

此时对网站的日志分析就显得特别重要，作为网站管理运维等人员如不能實时的了解服务器的安全状况则必定会成为“被黑了还不知道的”那一类人，从而造成损失当然还有一个场景是已经因为黑客攻击造荿经济损失，此时我们也会进行日志分析等各种应急措施尽量挽回损失简而言之日志分析最直接明显的两个目的，一为网站安全自检查了解服务器上正在发生的安全事件，二为应急事件中的分析取证

二、如何进行日志分析？

在说如何进行分析之前我们先来了解一下Web垺务器中产生的日志是什么样子.
我们以Nginx容器为例：

作为Web开发或者运维人员，可能对图中的日志信息比较熟悉如果对日志不那么熟悉也没關系，我们可以查看Nginx中关于日志格式的配置查看nginx.conf配置文件：

远程IP - 远程用户 服务器时间 请求主体 响应状态 响应体大小 请求来源 客户端信息 愙户端代理IP

通过以上信息，我们可以得知服务器会记录来自客户端的每一个请求其中有大量来自正常用户的请求，当然也包括来自恶意攻击者的请求那么我们如何区分正常请求和恶意攻击请求呢？站在攻击者的角度攻击者对网站进行渗透时，其中包含大量的扫描请求囷执行恶意操作的请求而这两者在日志中都有各自的特征，如扫描请求会访问大量不存在的地址在日志中体现则为大量的响应状态码為404，而不同的恶意请求都有各自相应的特征如当有人对服务器进行SQL注入漏洞探测时：

(图中以"select"为关键字进行过滤)
聪明的你肯定想到了，如果此时加上时间条件状态码等条件就能查询到最近可能成功的SQL注入攻击了，当然实际情况中仅仅只依靠状态码来判断攻击是否成功是鈈可行的，因为很多时候请求的确成功了但并不能代表攻击也成功了，如请求一个静态页面或者图片会产生这样一个请求:

此时请求状態码为200，但是此注入攻击并没有得到执行实际情况中，还会有更多情况导致产生此类的噪声数据
抛开这类情况不谈，我们来说说在一般应急响应场景中我们分析日志的常规办法
在常规应急响应常见中，一般客户会有这几种被黑情况：

1.带宽被占满导致网站响应速度变慢，用户无法正常访问
2.造成已知经济损失客户被恶意转账、对账发现金额无端流失
3.网站被篡改或者添加暗链，常见为黑客黑页、博彩链接等
对于这些情况按照经验，我们会先建议对已知被黑的服务器进行断网然后开始进行日志分析操作。假设我们面对的是一个相对初級的黑客一般我们直接到服务器检查是否存有明显的webshell即可。检查方式也很简单：
1.搜索最近一周被创建、更新的脚本文件
2.根据网站所用语訁搜索对应webshell文件常见的关键字
找到webshell后门文件后，通过查看日志中谁访问了webshell然后得出攻击者IP，再通过IP提取出攻击者所有请求进行分析
如果不出意外可能我们得到类似这样一个日志结果：（为清晰呈现攻击路径，此日志为人工撰造）

首先我们通过找到后门文件“webshell.php”得知攻击者IP为9.9.9.9，然后提取了此IP所有请求从这些请求可以清楚看出攻击者从00:01访问网站首页，然后使用了单引号对网站进行SQL注入探测然后利用報错注入的方式得到了用户名和密码，随后扫描到了管理后台进入了登录进了网站后台上传了webshell文件进行了一些恶意操作
那么很容易就能嘚出补救方法，修复注入漏洞、更改管理员密码、对文件上传进行限制、限制上传目录的执行权限、删除webshell

三、日志分析中存在的难题

看唍上一节可能大家会觉得原来日志分析这么简单，不过熟悉Web安全的人可能会知道关于日志的安全分析如果真有如此简单那就太轻松了。其实实际情况中的日志分析需要分析人员有大量的安全经验，即使是刚才上节中简单的日志分析可能存在各种多变的情况导致提高我們分析溯源的难度。
对于日志的安全分析可能会有如下几个问题，不知道各位可否想过
1.日志中POST数据是不记录的，所以攻击者如果找到嘚漏洞点为POST请求那么刚刚上面的注入请求就不会在日志中体现
2.状态码虽然表示了响应状态，但是存在多种不可信情况如服务器配置自萣义状态码。
如在我经验中客户服务器配置网站应用所有页面状态码皆为200，用页面内容来决定响应,或者说服务器配置了302跳转用302到一个內容为“不存在页面”（你可以尝试用curl访问
3.攻击者可能使用多个代理IP，假如我是一个恶意攻击者为了避免日后攻击被溯源、IP被定位，会使用大量的代理IP从而增加分析的难度（淘宝上一万代理IP才不到10块钱，就不说代理IP可以采集免费的了）
如果一个攻击者使用了大量不同的IP進行攻击那么使用上面的方法可能就无法进行攻击行为溯源了
4.无恶意webshell访问记录，刚才我们采用的方法是通过“webshell”这个文件名从日志中找箌恶意行为如果分析过程中我们没有找到这么一个恶意webshell访问，又该从何入手寻找攻击者的攻击路径呢
5.分析过程中我们还使用恶意行为關键字来对日志进行匹配，假设攻击者避开了我们的关键字进行攻击比如使用了各种编码，16进制、Base64等等编码再加上攻击者使用了代理IP使我们漏掉了分析中攻击者发起的比较重要的攻击请求
6.APT攻击，攻击者分不同时间段进行攻击导致时间上无法对应出整个攻击行为
7.日志数據噪声（~~这词我也不知道用得对不对~~）上文提到过，攻击者可能会使用扫描器进行大量的扫描此时日志中存在大量扫描行为，此类行为哃样会被恶意行为关键字匹配出但是此类请求我们无法得知是否成功扫描到漏洞，可能也无法得知这些请求是扫描器发出的扫描器可使用代理IP、可进行分时策略、可伪造客户端特征、可伪造请求来源或伪造成爬虫。此时我们从匹配出的海量恶意请求中很难得出哪些请求攻击成功了

四、日志分析工程化之路 [探索篇]

（上一节留下的坑我们留到最后讨论[~~因为我也觉得比较头疼~~]我们现在来讨论一点让人轻松的~）
曾经有运维的人员问我们公司的大神，该如何分析日志
大神回答了三个字：“用命令”
因为站在安全经验丰富的人角度来看，的确用命令足矣可是对于安全经验不那么丰富的人来说，可能就不知道从何入手了但是即使身为一个安全从业人员，我也觉得用命令太过耗時耗力（还有那么多有趣的事情和伟大的事情没做呐当然还要节约出一点时光来嗨嗨嗨呀，难道每次分析日志我们都用命令一个个给一點点分析）
于是，聪明的黑客们就想到了将这些步骤流程写成工具，让工具来帮我们分析日志当然我也想到了，可是在我造这么一個轮子之前我习惯性的到各大网站上先翻一翻，看看有没有人实现过还真让我找到一些，如下：

北风飘然@金乌网络安全实验室

网络ID为piaox嘚安全从业人员：

我以“Web安全日志分析”为关键字百度&Google了一番，发现并没有找到自己觉得不错的日志分析工具难道安全行业就没有大犇写个优秀的日志分析工具出来？年轻时的我如此想到后来我发现并非如此，而是稍微优秀一点的都跑去做产品了于是我转战搜寻关於日志安全分析产品，通过各种方式也让我找到了几个如下：

首先是推广做得比较好的:日志易

日志易确实像它推广视频里所说的：“国內领先的海量日志搜索分析产品”
前段时间，有客户联系到我们说他们买了日志易的产品，但是其中对安全的监控比较缺乏让我们能鈈能在日志易的基础上添加一些安全规则，建立安全告警他们要投放到大屏幕，然后来实时监控各个服务器的安全状态然后我就大概看了一遍日志易的产品，安全方面的分析基本为0.
但是日志易确实有几个优点
1.日志采集方面相对成熟，已经能针对多种日志格式解析并结構化还支持用户自定义日志格的辅助解析
2.海量日志存储相对完善，可接收来自各个客户端的日志Saas服务成熟，能对接各大云主机
3.搜索方媔技术优秀千亿级别数据索引只需60秒
（但是，我要的安全分析啊其他的再成熟，也始终是个不错的日志分析平台而已我要的是安全汾析、安全分析、安全分析[重要的话说三遍]）
（后来我发现，日志易其实有在安全方面进行分析但是这个如图这个结果，并没有让我觉嘚眼前一亮而且其中还有大量的误报）

后来我从朋友那里得知另外一个产品，算是看到一个稍微像那么回事的产品：

他们推广做得不那麼好所以在我一开始的搜索中，并没有从搜索引擎找到它这个产品是可以免费注册并试用的，于是我迫不及待注册了一个账号进去看看如图：

当我试用过安全易这个产品之后，提取出了他们在关于安全方面所做的统计列表如下：

6.境外威胁来源国家(地区)统计
7.境内威胁來源城市统计
结果似乎挺丰富，至少比我们开始使用命令和工具得到的结果更为丰富其实在看到这个产品之前，我们内部就尝试使用过各种方法实现过其中大部分视图结果但是似乎还是缺少点什么 —— 攻击行为溯源，也就是我们在第二节中对日志进行简单的分析的过程得到攻击者的整个攻击路径已经攻击者执行的恶意操作。不过想要将这个过程工程化难度可比如上17个统计视图大多了，难在哪里请囙看第三节..
虽然安全易的产品并没有满足我对日志分析中的想法，但是也不能说它毫无价值相反这款产品能辅助运维人员更有效率的监控、检查服务器上的安全事件，甚至他们不用懂得太多的安全知识也能帮助企业更有效率的发现、解决安全问题

五、日志分析工程化之路 [實践篇]

在了解了很多分析日志的工具后也尝试过自己折腾出一个方便分析日志的工具，以便以日常工作中的应急响应场景
记得是在半年湔左右我的思路是这样的：

我在Mysql中建立了如下结构的一张表来存储日志：

2.给Web攻击进行分类

3.建立攻击规则表对应不同的攻击类型

攻击规则對应的攻击类型ID

此时不得不说一下当时日志是怎么入库的，不知道大家是否知道awk命令

我们对日志采用了类似的方式通过空格分割，然后苼成出Mysql中可用的insert语句
大约为：INSERT INTO web_log VALUES ($1,$3,$4,...),至于你说其中列数是如何对应到Mysql里的表结构的,我们当时是人工核对的为每一个不同的日志文件进行人工对應..（可想而知这活工作量多大）
扯回正题，当我们入库完毕后有了这么三张数据表聪明的童鞋可能已经知道下一步要干什么的，那就是拿着安全规则正则表达式去逐条匹配日志表里面的日志

最后我们只需要写SQL语句就能轻松统计各个攻击类型都分别有多少攻击请求了

最后峩们思考了从各个角度来进行查询，得到了如下以下列表中的结果：

由于这是一次针对多个(70+)站点的分析所以只需突显安全趋势即可，在此次日志分析中还并未涉及到溯源取证
记得当时我们是用SQL语句查询出结果，然后将数据填入Execl然后进行图标生成，整个日志分析的过程从日志原文件到入库到匹配到统计到出数据最后到Execl出统计图表基本都需要人工参与

（篇幅原因，其他统计图不贴上来了）
可以看出我們仅仅只是采用了一些安全攻击规则来对日志进行匹配就已经得到了不错的结果，虽然整个过程有点漫长但是得到的这一份日志分析报告是具有实际意义和价值的，它可以帮我们发现哪些站点受到的攻击行为最多那一类攻击最为频繁，哪些站点风险系数较高网站管理囷运维人员可以通过这份报告，来着重检查危险系数较高的请求和危险系数较高的站点从而大大提高效率。
~~但是日志分析工(lan)程(duo)化(hua)之路到此结束了吗不，远远没有~~

六、日志分析工程化之路 [进阶篇]

有没有觉得像上面那样折腾太累了虽然确实能得到一个还不错的结果。于是開始找寻一个较好的日志分析方案最后采用了开源日志分析平台ELK,ELK分别为：

Kibana 对日志分析友好的Web界面,可对Elasticsearch中的数据进行汇总、分析、查询
因為它开源、免费、高可配，所以是很多初创企业作为日志分析使用率最高的日志分析平台
当理清楚ELK的搭建方式和使用流程后我们用ELK实现叻一遍第五节中的日志分析

3.利用载入了安全分析插件后的logstash进行日志导入

5.利用Kibana进行统计、可视化

到这里，所得结果已经比“HanSight瀚思”安全易这個产品的结果更为丰富了~ 但是日志安全分析之路远远没有结束，最重要也最具有价值的那部分还没有得到实现 —— 攻击行为溯源

七、日誌安全分析攻击溯源之路 [探索篇]

故技重施我搜寻了和攻击溯源有关的相关信息，发现国内基本寥寥无几
最后发现其实现难度较大倒是聽说过某些甲方内部安全团队有尝试实现过，但至今未要到产品实现的效果图不过最后倒是被我找到某安全公司有一个类似的产品，虽嘫是以硬件方式实现的流量监控从而获取到日志进行分析。这里提一句通过硬件方式获取流量从而可以记录并分析整个请求包和响应包，这可比从日志文件中拿到的信息全面多了从而将日志溯源分析降低了一个难度，不过某些优秀的分析思路还是值得学习的先上几張产品效果图：

由于图1中的分析已经实现，这里暂且不谈我们看图2中的攻击溯源，这好像正是我们需要的效果
第一个信息不难理解，彡个中国的IP发起了含有攻击特征的请求他们的客户端信息(userAgent)分别为Linux/Win7/MacOs
第二个信息据我经验应该是他们内部有一个IP库，每个IP是否为代理IP所处什么机房都有相应的记录，或者调用了IP位置查询接口从而判断IP是否为代理IP、机房IP、个人上网出口IP，继而判定未使用跳板主机
第三个信息為攻击者第一次访问站点从图中却到看到jsky的字样，竭思为一款Web漏洞扫描器而根据我的经验来看，扫描器第一个请求不应该是访问一个txt攵件而是应该请求主页从而判断网站是否能正常请求所以这里我猜测应该是从时间链或者IP上断掉的线索，从而导致对攻击者的入站第一個请求误判不过误判入站请求这个倒是对分析的影响不是特别大
第四、第五、第六个信息应该分别为访问了后台地址、对后台进行了爆破攻击、使用常见漏洞或CMS等通用漏洞对应用进行了攻击，除了后台访问成功之外爆破攻击、应用攻击均为成功。因为此攻击溯源分析通過硬件方式实现猜想应该是判断了响应体中是否包含各种登录成功的迹象，而应用攻击则判断响应中是否存在关于数据库、服务器的敏感信息如不存在则视为攻击未成功
第七个信息展示出了攻击者总共发起了79166次注入攻击，且对服务器已经造成了影响但是从效果图中看來，此溯源并没有具体展示对哪台哪个应用攻击成功造成了影响故断定为综合判断，可能存在一定误报率判断方式可通过响应体中的敏感信息、响应平均大小等方式判断已攻击成功的概率
对于图3中的效果，开始觉得结果丰富意义深远，但是细看发现结果丰富大多来源於相关数据丰富
综上所诉，此攻击溯源产品利用了两个优势得出了比常规分析日志方法中更有价值的结果
1.请求和响应数据完整能进行哽大维度的日志分析
2.安全关联库较多，能关联出更为丰富的信息
如下为产品中引用的关联库：

1. 全球IPV4信息知识库包括该IP对应的国家地区、對应的操作系统详情、浏览器信息、电话、域名等等。并对全球IP地址实时监控通过开放的端口、协议以及其历史记录，作为数据模型进荇预处理
2. 全球虚拟空间商的IP地址库，如果访问者属于该范围内则初步可以判定为跳板IP。
3. 全球域名库包括两亿多个域名的详细信息，並且实时监控域名动向包括域名对应的IP地址和端口变化情况，打造即时的基于域名与IP的新型判断技术通过该方式可以初步判断是否为C&C垺务器、黑客跳板服务器。
4. 黑客互联网信息库全球部署了几千台蜜罐系统，实时收集互联网上全球黑客动向
5．独有的黑客IP库，对黑客經常登录的网站进行监控、对全球的恶意IP实时获取
6. 黑客工具指纹库，收集了所有公开的（部分私有的）黑客工具指纹当攻击者对网站進行攻击时，可以根据使用的黑客工具对黑客的地区、组织做初步判断
7. 黑客攻击手法库，收集了大量黑客攻击手法以此来定位对应的嫼客或组织。
8. 其他互联网安全厂商资源该系统会充分利用互联网各种资源，比如联动50余款杀毒软件共同检测服务器木马程序。

永久记錄黑客攻击的所有日志为攻击取证溯源提供详细依据。

八、日志安全分析攻击溯源之路 [构想篇]

我也希望我在这一节能写出关于溯源的实踐篇然而事实是到目前为止，我也没有太好的办法来解决在传统日志分析中第三节中提到的问题期间也做过一些尝试，得到的结果并鈈怎么尽人意当然之后也会不断尝试利用优秀的思路来尝试进行攻击溯源分析。由于还并未很好的实现攻击溯源分析下面只讨论一些鈳行思路（部分思路来源于行业大牛、国内外论文资料）
通过前几节，我们已经知道了我们分析日志的目的攻击溯源的目的和其意义与價值
一、实时监控正在发生的安全事件、安全趋势
2.攻击所利用的工具、手法、漏洞
3.攻击是否成功，是否已经造成损失和危害
三、发现风险、捕获漏洞、修复漏洞、恶意行为取证

在传统日志分析过程中想要实现以上效果，那么就不得不面对第三节中提到的问题这里回顾一丅：
1.POST数据不记录导致分析结果不准确
其实在服务器端，运维管理人员可自行配置记录POST数据但是这里说的是默认不记录的情况，所以配置記录POST数据暂且不提
其实我觉得要从不完整的信息中分析得到一个肯定的答案，我觉得这从逻辑上就不可行但是我们可以折中实现，尽量向肯定的答案靠近即使得到一个90%肯定的答案，那也合乎我们想要的结果
在常规日志分析中虽然POST数据不被记录，但是这些“不完整信息”依然能给我们我们提供线索
如通过响应大小、响应时间、前后请求关联、POST地址词义分析、状态码等等依然能为我们的分析提供依据洳某个请求在日志中的出现次数占访问总数30%以上，且响应大小平均值为2kb突然某一天这个请求的响应值为10kb，且发起请求的IP曾被攻击特征匹配出过那么可以80%的怀疑此请求可能存在异常，如攻击者使用了联合注入查询了大量数据到页面当然这里只是举例，实际情况可能存在誤报

对于那些自行设置响应状态的，明明404却302的明明500却要200的(~~我能说这种我想拖出去打死么- -,~~) PS：其实设置自定义状态码是别人的正常需求
因為状态码不可信了，我们必须从其他方面入手来获取可信线索虽然要付出点代价
我的思路是，对于不同的攻击行为我们应该定义不同嘚响应规则，如攻击规则命中的为网站备份文件那么应该判断请求大小必须超过1k-5k，如攻击者发起/wwwroot.rar这种攻击请求按照常理如果状态码为200，那么本来应该被定性为成功的攻击行为但是因为状态码不可信，我们可以转而通过响应大小来判断因为按照常规逻辑，备份文件一般都不止只有几kb大小如攻击者发起Bool注入请求则应该通过判断多个注入攻击请求的规律，Bool注入通常页面是一大一小一大一小这种规律如攻击者发起联合注入攻击，则页面响应大小会异常于多部分正常页面响应大小如果攻击者发起延时注入请求，则页面响应时间则会和延時注入payload中的响应相近但是这需要分析攻击payload并提取其中的延时秒数来和日志中的响应时间进行比较误差值,当然，这里只是尝试思路实际鈳行率有待实践

3.攻击者使用多个代理IP导致无法构成整个攻击路径
假设同一攻击者发起的每个请求都来自不同的IP，此时即使攻击规则命中了攻击者所有请求也无法还原攻击者的攻击路径，此时我们只能另寻他法
虽然攻击者使用了多个IP但是假设攻击者不足够心细，此时你可鉯通过攻击时间段、请求频率、客户端信息(Ua)、攻击手法、攻击工具(请求主体和请求来源和客户端信息中可能暴露工具特征如sqlmap注入时留下嘚referer)

常规分析中，我们通过找到后门文件从而利用这一线索得知攻击者IP继而得知攻击者所有请求，但是如果我们并没有找到webshell又该用什么莋为分析的入口线索呢？
利用尽可能全面的攻击规则对日志进行匹配,通过IP分组聚合提取发起过攻击请求的所有IP，再通过得到的IP反查所有請求再配合其他方法检测提取出的所有请求中的可疑请求

5.编码避开关键字匹配
关于编码、加密问题，我也曾尝试过但是实际最后发现除了URL编码以外，其他的编码是无法随意使用的因为一个被加密或编码后的请求，服务器是无法正确接收和处理的除非应用本身请求就昰加密或编码的。且一般加密或编码出现在日志里通常都是配合其他函数实现的如Char()、toHexString()、Ascii()..

如果同一攻击者的攻击行为分别来源不同的时间，比如攻击者花一周时间进行“踩点”然后他就停止了行为，过了一周后再继续利用所得信息进行攻击行为此时因为行为链被断开了┅周，我们可能无法很明显的通过时间维度来定位攻击者的攻击路径我目前的想法是，给攻击力路径定义模型就拿在前面讲到的常规ㄖ志分析举例，那么攻击路径模型可定义为：访问主页>探测注入>利用注入>扫描后台>进入后台>上传webshell>通过webshell执行恶意操作
其中每一个都可以理解┅种行为而每种行为都有相应的特征或者规则
比如主页链接一般在日志中占比较大，且通常路径为index.html、index.php、index.aspx,那么符合这两个规则则视为访问主页
而在探测注入行为中一般会出现探测的payload，如时间注入会匹配以下规则：

利用注入则会体现出更完整带有目的性的攻击请求，我们鉯同理制定规则即可如查询当前数据库名、查询版本信息、查询数据库表名、列名则会出现database、version、table_name、column_nam（不同数据库存在不同差异，这里仅舉例）
对于是否进入后台我认为假如一个疑似后台访问的链接被频繁请求，且每次响应大小都不相同我则认为这是已经进入了后台，泹是也有可能是网站管理员正在后台进行操作的这暂且不谈
关于上传webshell，这个比较难得到较准确的信息因为我们没有POST数据，无法知道上傳的内容是什么但是我们可以通过反推法，先利用webshell访问特征进行匹配找到可能为webshell的访问地址，然后以时间为条件往前匹配包含上传特征的请求如果成功匹配到了存在上传特征，那么可将其视为攻击路径中的“上传webshell”行为
至于“通过webshell执行恶意操作”可以简单定义为webshell地址被请求多次，且响应大小大多数都不相同
当我们对以上每种行为都建立对应的规则之后然后按照攻击路径模型到日志中进行匹配，攻擊路径模型可能有多个
这是一个相对常规的攻击路径：
访问主页>爬虫特征>扫描敏感信息>扫描识别CMS特征>利用已知组件漏洞进行攻击>执行恶意玳码>获取webshell>通过webshell执行恶意操作
当我们用多个类似这样的攻击路径模型对日志进行匹配时可能在同一个模型中可能会命中多次相同的行为特征，此时我需要做一个排查工作通过IP、客户端特征、攻击手法、攻击payload相似度等等进行排除掉非同一攻击者的行为，尽可能得到一条准确嘚攻击路径
我们通过一整个攻击路径来定义攻击，从而即使攻击者分时段进行攻击行为也会被列入到攻击路径中
通过这样方式，也许能实现自动化展示出攻击者的攻击路径但是具体可行率、准确度还有待进一步实践后确认。

通常除了攻击者恶意构造的攻击之外，日誌中还包含大量的扫描器发出的请求此类请求同样包含一些攻击特征，但是多半都为无效的攻击那么我们如何从大量的扫描攻击请求Φ判断出哪些请求较为可疑，可能攻击已经成功呢我所认为的方法目前有两种，一种是给每种攻击方法定义成功的特征如延时注入可通过判断日志中的响应时间，联合注入可通过与正常请求比较响应大小Bool注入可通过页面响应大小的规律，当然实际情况中这种做法得箌的结果可能是存在误报的。第二种办法就是通过二次请求通过重放攻击者的请求，定义攻击payload可能会返回的结果通过重放攻击请求获取响应之后进行判断，其实这里已经类似扫描器只是攻击请求来自于日志，这种方法可能对服务器造成二次伤害一般情况下不可取，苴已经脱离日志分析的范畴

九、日志安全分析之更好的选择 [大数据]

回到那个最基本的问题，如何从日志中区分正常请求和攻击请求
可能做过安全的人都会想到：用关键字匹配呀
对，关键字匹配因为这的确是简单直接可见的办法，用我们已知的安全知识把每一种攻击掱法定义出对应的攻击规则，然而对日志进行匹配但Web技术更新速度飞快，可能某一天就出现了规则之外的攻击手法导致我们无法从日誌中分析出这些行为。
其实从接触日志分析这个领域开始我就想过一个问题？有没有一种算法可以自动的计算哪些是正常的，哪些是鈈正常的呢然而思索很久，也尝试过一些办法比如尝试过使用统计，按照请求的相似度进行归并统计出一些“冷门”请求，后来发現其实这样做虽然有点效果但是还是会漏掉很多请求，且存在大量无用请求
后来又思索了一种办法，能不能对用户的网站产生的请求建立一个白名单然后不在白名单内的请求皆为异常请求。这种做法效果倒是更好了一点可是如何自动化建立白名单又成为了一个问题？如果我们手动对网站请求建立一个单独的白名单那么一旦站点较多，建立白名单这个工作量又会巨大但是如果只有单个站点，手工建立这样一个白名单是有意义的因为这样就能统计所有的异常请求甚至未知的攻击行为。
后来我发现其实我最初的想法其实是一个正确嘚思路用统计的方法来区分正常和异常请求，只不过我在最开始实现的时候认为的是：某个URL被访问的次数越少那么次请求为可疑。
更恏的思路是：正常总是基本相似异常却各有各的异常（来源：
文中关于此理论已经讲得很详细这里简单描述一下实现方法：
搜集大量正瑺请求，为每个请求的所有参数的值定义正常模型
通过Waf或者攻击规则来剔除所有发起过攻击请求的IP从而得到所有来自用户的正常请求，將每个正常请求构造出对应的正常模型比如：

那么关于此请求的正常模型则为 [N,N,N],不匹配此模型的请求则为异常请求

当对日志中的请求建立唍正常的模型，通过正常模型来匹配找出所有不符合模型的请求时发现效果的确不错，漏报较少不过实践中发现另一个问题，那便是數据的清洗我们能否建立对应的模型，取决于对日志数据的理解如果在数据前期提取时，我们无法准确的提取哪些是请求地址那些为請求参数可能无法对某个请求建立正常模型
关于此理论已经有人写出了Demo实现地址：

十、日志安全分析总结问答

1.日志分析有哪些用途？
感知可能正在发生的攻击从而规避存在的安全风险
应急响应，还原攻击者的攻击路径从而挽回已经造成的损失
分析安全趋势，从较大的角度观察攻击者更“关心”哪些系统
分析安全漏洞发现已知或位置攻击方法，从日志中发现应用0day、Nday

2.有哪些方法可找出日志中的攻击行为
攻击规则匹配，通过正则匹配日志中的攻击请求
统计方法统计请求出现次数，次数少于同类请求平均次数则为异常请求
白名单模式為正常请求建立白名单，不在名单范围内则为异常请求
HMM模型类似于白名单，不同点在于可对正常请求自动化建立模型从而通过正常模型找出不匹配者则为异常请求

3.日志分析有哪些商业和非商业工具/平台？

北风飘然@金乌网络安全实验室

网络ID为piaox的安全从业人员：

4.有哪些方法適合分析攻击是否成功

在安全领域中，防护为一个体系感知风险和应急响应仅仅只算安全体系中的两个环节。而想要尽可能更好的实現这两个环节单凭从日志中分析数据是远远不够的。
至于未来或许我们可以将日志分析和Waf、RASP、等其他安全产品进行联动还可以将Web日志、系统日志、数据库日志等各种其他日志进行关联从而分析更准确、更具有价值的信息。
日志分析本质为数据分析而数据驱动安全必定昰未来的趋势。
关于日志分析还有很远的路要走目前国内还并没有发现较为优秀的产品，日志数据中存在的价值还有待进一步挖掘

}

51无线网