百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Web 访问日志分析(web访问日志包含哪些信息信)

nanshan 2024-10-26 11:14 8 浏览 0 评论

用途

1.记录访问服务器的远程主机 IP 地址,可以得知浏览者来自何处

2.记录浏览者访问 web 资源,可以了解网站哪些部分最受欢迎

3.记录浏览者使用浏览器,可以根据大多数浏览者使用浏览器对站点进行优化

4.记录浏览者访问时间

访问日志位置

1.Apache

在 httpd.conf 和引用的*.conf文件中查找 CustomLog "logs/access.log" combined

说明:

 a.CustomLog 访问日志配置指令
 b.logs/access.log 访问日志记录文件
 c.combined 日志格式

2. Nginx

在 nginx.conf 或引用的 *.conf 文件中查找 access_log logs/access.log main

说明:

 a.access_log 访问日志配置指令
 b.logs/access.log 访问日志记录文件
 c.main 日志格式

访问日志格式

1、Apache

 LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
 LogFormat "%h %l %u %t \"%r\" %>s %b" common

配置说明:http://httpd.apache.org/docs/2.4/mod/mod_log_config.html

2、nginx

log_format main '$remote_addr - $remote_user [$time_local] "$request" '
 '$status $body_bytes_sent "$http_referer" '
 '"$http_user_agent" "$http_x_forwarded_for"';

配置说明:http://nginx.org/en/docs/http/ngx_http_log_module.html

变量说明:http://nginx.org/en/docs/varindex.htm%22

3、通用日志格式 common

127.0.0.1 - - [14/May/2017:12:45:29 +0800] "GET /index.html HTTP/1.1" 200 4286
远程主机IP 请求时间 时区 方法 资源 协议 状态码 发送字节

4、组合日志格式 combined

127.0.0.1 - - [14/May/2017:12:51:13 +0800] "GET /index.html HTTP/1.1" 200 4286 "http://127.0.0.1/" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36"
远程主机IP 请求时间 时区 方法 资源 协议 状态码 发送字节 referer字符 浏览器信息

5、日志状态码

2XX:

200: 请求成功
201: 创建成功
202: 接受请求
204: 无内容

3XX:

301: 永远重定向
302: 临时重定向
303: 临时重定向(HTTP1.1 同302)
307: 临时重定向(HTTP1.1 POST方法)

4XX:

400: 错误请求
401: 访问拒绝
403: 访问禁止
404: 未找到
405: 请求方法错误

5XX:

500: 服务器内部错误
503: 服务不可用
505: 网关超时

日志统计

1、查看访问 IP 地址

cat access.log|awk '{print $1}'
cat access.log|awk '{print $1}'|sort

2、查看每个 IP 地址访问次数

cat access.log|awk '{print $1}'|sort|uniq -c
cat access.log|awk '{print $1}'|sort|uniq -c|sort -nr
cat access.log|awk '{print $1}'|sort|uniq -c|sort -nr|head -10

3、统计总访问 IP 数量

cat access.log|awk '{print $1}'|sort|uniq -c|wc -l

4、访问指定时间后的日志

cat access.log|awk '$4>"[23/Aug/2014:23:58:00"'
cat access.log|awk '($4>"[23/Aug/2014:23:58:00"){print $1}'
cat access.log|awk '($4>"[23/Aug/2014:23:58:00"){print $1}'|sort|uniq -c|sort -nr

5、访问指定资源的日志

cat access.log|awk '$7 ~/.html$/'
cat access.log|awk '($7 ~/.html$/){print $1 " " $7 " " $9}'
cat access.log|awk '($7 ~/.js$/){print $10 " " $7}'|sort|uniq -c|sort -nr|head -10
cat access.log|awk '($10 > 10000 && $7 ~/.js$/){print $10 " " $7}'|sort|uniq -c|sort -nr|head -10

6、统计总流量

cat access.log|awk '{sum+=$10}END{print sum}'
cat access.log|awk '($7 ~/.css$/){sum+=$10}END{print sum}'
grep "04/May/2017" access.log|awk '($7 ~/.css$/){sum+=$10}END{print sum}'

7、状态码统计

cat access.log|awk '{print $9}' |sort|uniq -c|sort -nr
cat access.log|awk '($9 ~/^400$/)' | wc -l
cat access.log | awk '($4 ~/^\[04\/May\/2017/){print $9}'|sort|uniq -c|sort -nr
cat access.log | awk '$9 ~/400/ && $4 ~/^\[04\/May\/2017/'|wc -l
grep "04/May/2017" access.log | awk '{print $9}'|sort|uniq -c|sort -nr

作者:KK

首发链接:https://www.jianshu.com/p/01aa4785f915

相关推荐

python获取阿里云云解析dns的域名解析记录

最近由于工作原因接触到阿里云的服务,我需要实时获取所有的域名信息,用于对其进行扫描,因此写了一个自动化爬取脚本给需要的人分享。(阿里云有官方的demo,有兴趣的可以自己看一下,后面也会放链接,我只能...

前端性能优化系列——DNS预解析和优化

简单来说,DNS的作用是将域名解析为IP地址,解析的过程是耗时的,转化后会做本地缓存,我们的优化的目标主要是针对用户第一次访问站点的时候陷入长时间白屏的问题。DNS解析可以分为两类,第一类是页...

dns错误修复方法

  最近用户反馈在同一网络的其他电脑可以正常上网,但自己的电脑却提示页面找不到且无法解析服务器的dns地址,接下来给大家带来dns错误修复方法。  1、点击网络图标,选择打开网络共享中心,如图所示: ...

技术分享 | 浅谈DNS递归解析和迭代解析之间的区别

DNS解析是互联网中的重要环节,承担着将域名翻译为可由计算机直接读取的IP地址的基础功能。根据查询对象不同DNS解析可分为递归解析和迭代解析两种方式,接下来,中科三方将简单介绍下两种查询方式的流程以及...

一文读懂DNS解析故障常见情况(中科三方)

DNS解析将人们习惯使用的域名翻译成计算机识别的IP地址,是确保人们正常访问网站的重要功能。而在实际域名管理过程中,经常会因为种种原因导致DNS解析故障。DNS解析故障主要表现在人们通过IP地址可以直...

DNS分离解析实验

如果本文对你有帮助,欢迎关注、点赞、收藏、转发给朋友,让我有持续创作的动力目录一、分离解析概述二、实验需求三、实验步骤3.1双网卡服务器配置3.1.1添加两张网卡(内外网)3.1.2对两个网卡进...

#净网2019# 浏览网页被“劫持”,有问题!

明明自己没有设置过,打开网页浏览器却直接到了一个陌生网站,想改回原来的主页设置颇费周折、甚至无能为力。很多网民有过类似经历:在安装了一些软件后,自己的浏览器主页就被修改和锁定。本来打算访问A网站却被强...

解决浏览器劫持,360和腾讯安全不敌火绒专杀

上午win7莫名其妙显示未激活,并要求当日必须激活,没办法,上网找激活工具,先试了“小马”没起作用,又下载了“WIN7ActivationV2.3绿色版”,就是这个:激活是激活了,顺便给我安了一堆垃...

【净网2019】 浏览网页被“劫持”,有问题!

明明自己没有设置过,打开网页浏览器却直接到了一个陌生网站,想改回原来的主页设置颇费周折、甚至无能为力。很多网民有过类似经历:在安装了一些软件后,自己的浏览器主页就被修改和锁定。本来打算访问A网站却被...

浏览器打开网页被绑架?这里有办法

最近小A遇到了一个小问题:在240g上网冲浪的时候,搜索到的网页,点进去却“李逵变李鬼”???在使用浏览器时,点击搜寻结果却导向与搜寻内容不符合的网站,表示您的浏览器可能已遭受恶意软件劫持。例如您在搜...

处理浏览器主页被劫持的最新方法

给大家说个处理浏览器主页被劫持的最新方法:刚遇件让人哭笑不得的事,这两天发现浏览器的主页打开后不是自己原来设置的,而是hao123,一百度,好家伙,原来这个流氓许多人都遇到过,照着大家分享的方法一一尝...

软件性能测试详解

性能测试的基本概念性能测试是一种非功能性测试,通过自动化工具模拟多种负载条件(正常、峰值、异常),对系统的各项性能指标进行测试和评估,以验证其是否满足预期的性能需求。以下是核心概念的详细解析:一、性能...

国内粉色图标视频网站偷用带宽风波,WebRTC Control 插件来救场

最近,B站陷入了一场舆论风波,被指偷偷使用用户上传带宽。有网友在浙江大学论坛投稿称,B崭新版App疑似未经许可大量上传数据致网络卡顿,查看路由器统计信息后,发现B站手机客户端开启大量端口,...

服务器知识

问:机架式和非机架式是什么意思?服务器中“U”是什么单位?答:机架式、非机架式指的是服务器的类型。机架式是指可以直接插入机柜的标准服务器。非机架式是其他类型的服务器。譬如说我们普通的pc机的主机。大小...

Vue3 性能拉胯?5 个实战技巧让项目响应速度飙升 60%!

作为前端工程师,在开发Vue3项目时,你是否经常遇到页面卡顿、数据更新缓慢,导致用户体验直线下降的情况?看着自己精心搭建的应用,因为性能问题被吐槽,真是既无奈又焦虑。别担心,今天就分享5个超级...

取消回复欢迎 发表评论: