百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

tcpdumpwireshark抓包及分析

toyiye 2024-06-21 11:57 9 浏览 0 评论

本文将展示如何使用tcpdump抓包,以及如何用tcpdump和wireshark分析网络流量。 文中的例子比较简单,适合作为入门参考。

1 基础环境准备

为方便大家跟着上手练习,本文将搭建一个容器环境。

1.1 Pull Docker镜像

$ sudo docker pull alpine:3.8

1.2 运行容器

$ sudo docker run -d --name ctn-1 alpine:3.8 sleep 3600d
$ sudo docker ps
CONTAINER ID    IMAGE        COMMAND         CREATED        STATUS          PORTS  NAMES
233bc36bde4b    alpine:3.8   "sleep 3600d"   1 minutes ago  Up 14 minutes           ctn-1

进入容器:

$ sudo docker exec -it ctn-1 sh

登录到容器里面,查看容器网络信息:

/ # ifconfig
eth0      Link encap:Ethernet  HWaddr 02:42:AC:11:00:09
          inet addr:172.17.0.9  Bcast:0.0.0.0  Mask:255.255.0.0

1.3 安装tcpdump

/ # apk update
/ # apk add tcpdump

2 HTTP/TCP抓包

接下来我们用wget获取一个网站的首页文件(index.html),同时tcpdump抓包,对抓到的 网络流量进行分析。

2.1 HTTP请求:下载测试页面

example.com是一个测试网站,wget是一个linux下面的命令行工具, 可以下载网络文件。

如下命令可以下载一个example.com网站的首页文件index.html:

/ # wget http://example.com
Connecting to example.com (93.184.216.34:80)
index.html           100% |*****************************|  1270   0:00:00 ETA

虽然这看起来极其简单,但背后却涵盖了很多复杂的过程,例如:

  1. 域名查找 :通过访问DNS服务查找 example.com 服务器对应的IP地址
  2. TCP连接参数初始化 :临时端口、初始序列号的选择等等
  3. 客户端(容器)通过 TCP三次握手协议 和服务器IP建立TCP连接
  4. 客户端发起HTTP GET请求
  5. 服务器返回HTTP响应,包含页面数据传输
  6. 如果页面超过一个MTU,会分为多个packet进行传输(后面会看到,确实超过MTU了)
  7. TCP断开连接的 四次挥手

2.2 抓包:打到标准输出

用下面的tcpdump命令抓包,另一窗口执行 wget http://example.com ,能看到如下类似 的输出。为了方便后面的讨论,这里将一些字段去掉了,并做了适当的对齐:

/ # tcpdump -n -S -i eth0 host example.com
1  02:52:44.513700 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [S] , seq 3310420140,                            length 0
2  02:52:44.692890 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [S.], seq 1353235534,            ack 3310420141, length 0
3  02:52:44.692953 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353235535, length 0
4  02:52:44.693009 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [P.], seq 3310420141:3310420215, ack 1353235535, length 74: HTTP: GET / HTTP/1.1
5  02:52:44.872266 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                            ack 3310420215, length 0
6  02:52:44.873342 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] , seq 1353235535:1353236983, ack 3310420215, length 1448: HTTP: HTTP/1.1 200 OK
7  02:52:44.873405 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353236983, length 0
8  02:52:44.874533 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [P.], seq 1353236983:1353237162, ack 3310420215, length 179: HTTP
9  02:52:44.874560 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353237162, length 0
10 02:52:44.874705 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [F.], seq 3310420215,            ack 1353237162, length 0
11 02:52:45.053732 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                            ack 3310420216, length 0
12 02:52:45.607825 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [F.], seq 1353237162,            ack 3310420216, length 0
13 02:52:45.607869 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353237163, length 0

参数说明:

  • -n :打印IP而不是hostname,打印端口号而不是协议(例如打印80而不是http)
  • -S :打印绝对时间戳
  • -i eth0 :指定从eth0网卡抓包
  • host example.com :抓和 example.com 通信的包(双向)

更多tcpdump的常用命令,可以参考 tcpdump: An Incomplete Guide

2.3 抓包:存文件

-w 命令可以将抓到的包写到文件,注意这和用重定向方式将输出写到文件是不同的。 后者写的只是标准输出打印的LOG,而 -w 写的是原始包。

/ # tcpdump -i eth0 host example.com -w example.pcap
^C
13 packets captured
13 packets received by filter
0 packets dropped by kernel

生成的pcap文件可以用 tcpdump 或者 wireshark 之类的网络流量分析工具打开。

3 流量分析: tcpdump

如果不指定输出的话,tcpdump会直接将信息打到标准输出,就是我们上面看到的那样。从 这些输出里,我们看到很多信息。

3.1 每列说明

第1列是为了讨论方便而加的行号,实际的tcpdump输出并没有这一列。接下来将用 # 号加 数字表示第几个包,例如 #3 表示第3个包。

接下来依次为:

  • packet 时间戳 ,例如 02:52:44.513700 表示抓到这个包的时间是 02时52分44秒513毫秒
  • packet 类型 ,这里是 IP 包
  • 源(SRC) IP和端口,目的(DST) IP和端口
  • packet TCP flags,其中S 表示 syn 包. 表示 ack 包F 表示 fin 包P 表示 push 包(发送正常数据)
  • 序列号(seq)
  • 应答号(ack)
  • 包的payload长度
  • 包的部分内容(ASCII)

3.2 三次握手(1~3)

wget是基于HTTP协议,因此它在下载文件之前,必定要和服务端建立一个连接。

而TCP建立连接的过程就是著名的 三次握手 [4]:

  1. client -> server: SYN
  2. server -> client: SYN+ACK
  3. client -> server: ACK

我们可以看到,这刚好对应于前三个包:

1  02:52:44.513700 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [S] , seq 3310420140,                 length 0
2  02:52:44.692890 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [S.], seq 1353235534, ack 3310420141, length 0
3  02:52:44.692953 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                 ack 1353235535, length 0

第一次握手: SYN

#1 包含以下信息:

  1. 02:52:44.513700 时刻,客户端主动向server(93.184.216.34)发起一个SYN请求,请求建立连接
  2. 客户端请求的 服务端端口是80 (HTTP服务默认80端口),客户端使用的是 临时端口 (大于1024)41038
  3. #1 序列号是 3310420140 ,这是客户端的初始序列号(客户端和服务端分别维护自己的序列号,两者没有关系;另外,初始序列号是系统选择的,一般不是0)
  4. #1 length为0,因为SYN包不带TCP payload,所有信息都在TCP header

第二次握手: SYN+ACK

#2 的ack是 3310420140 ,等于 #1 的seq加1,这就说明, #2 是 #1 的应答包。

这个应答包的特点:

  1. TCP flags为 S. ,即SYN+ACK
  2. length也是0,说明没有payload
  3. seq为 1353235534 ,这是 服务端的初始序列号
  4. 到达eth0的时间为 02:52:44.692890 ,说明时间过了 18ms

第三次握手: ACK

同理, #3 的ack等于 #2 的seq加1,说明 #3 是 #2 的应答包。

这个包的特点:

.

至此,三次握手完成。

3.3 正常数据传输

三次握手完成后,client和server开始HTTP通信,客户端通过HTTP GET方法下载index.html。

4  02:52:44.693009 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [P.], seq 3310420141:3310420215, ack 1353235535, length 74: HTTP: GET / HTTP/1.1
5  02:52:44.872266 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                            ack 3310420215, length 0
6  02:52:44.873342 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] , seq 1353235535:1353236983, ack 3310420215, length 1448: HTTP: HTTP/1.1 200 OK
7  02:52:44.873405 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353236983, length 0
8  02:52:44.874533 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [P.], seq 1353236983:1353237162, ack 3310420215, length 179: HTTP
9  02:52:44.874560 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353237162, length 0

这里可以看到:

  1. #4 : client向server发起HTTP GET请求,请求路径为根路径( / ),这个packet长度为74字节
  2. #5 : 发送了ACK包,对 #4 进行确认
  3. #6 : 发送了1448字节的数据给client
  4. #7 : client对server的 #6 进行应答
  5. #8 : server向client端继续发送179字节数据
  6. #9 : client对server的 #8 进行应答

3.4 四次挥手

最后是四次挥手 [5]:

  1. client -> server: FIN (我们看到的是FIN+ACK,这是因为这个FIN包除了正常的关闭连接功能之外,还被用于应答client发过来的前一个包)
  2. server -> client: ACK
  3. client -> server: FIN+ACK
  4. server -> client: ACK
10 02:52:44.874705 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [F.], seq 3310420215, ack 1353237162, length 0
11 02:52:45.053732 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                 ack 3310420216, length 0
12 02:52:45.607825 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [F.], seq 1353237162, ack 3310420216, length 0
13 02:52:45.607869 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                 ack 1353237163, length 0

4 流量分析: wireshark

tcpdump可以指定 -r 读取pcap文件,并以指定的格式输出包的信息,最后输出的内容和上 面看到的类似。我们上面的流量非常简单,所以看tcpdump的输出就够了。

对于复杂的pcap,例如,其中包含了上百个IP地址、上千个端口、上万个连接的pcap,只通 过看tcpdump输出就非常低效了。

这时, wireshark 这样带图形用户界面,且功能强大的网 络流分析工具就派上了用场。

wireshark支持强大的过滤功能,支持按IP、端口、协议、连接、TCP flag以及它们的各种 组合进行过滤,然后进行分析,大大节省网络排障的时间。

wireshark官方维护了一个sample pcap 列表 ,我们拿 iperf-mptcp-0-0.pcap 作为例子来展示如何使用wireshark。

4.1 追踪TCP流

下载后双击就可以用wireshark打开。看到有重传(TCP Retransmition)的包:

在重传的包上, 右键 -> Follow -> TCP Stream ,会过滤出 只属于这个连接的包

我们看到,这个连接只有3个包:

  1. #1 在 08:00:05.125 发送出去,请求建立连接
  2. 大约 1s 后,客户端仍然没有收到服务端的ACK包,触发客户端 TCP超时重传
  3. 又过了大约 2s ,仍然没有收到ACK包, 再次触发超时重传
  4. 这里其实还可以看出TCP重传的机制: 指数后退 ,比如第一次等待1s,第二次等待2s ,第三次等待4s,第四次8s

因此,从这个抓包文件看,这次连接没有建立起来,而直接原因就是client没有收到server 的应答包。要跟进这个问题,就需要在server端一起抓包,看应答包是否有发出来。本文不 对此展开。

4.2 过滤流

上面的截图我们看到wireshark里有 tcp.stream eq 1 ,这其实就是其强大的过滤表达式。

我们可以直接手写表达式,然后回车,符合条件的包就会显示出来。而且,在编辑表达式的 时候,wireshark有自动提示,还是比较方便的。这些表达式和tcpdump的filter表达式很类 似,如果熟悉tcpdump,那这里不会有太大困难。

下面举一些例子:

  1. ip.addr == 192.168.1.1 过滤SRC IP DST IP是 192.168.1.1 的包
  2. ip.src_host == 192.168.1.1 and ip.dst_host == 192.168.1.2 过滤SRC IP是 192.168.1.1 ,并且DST IP是 192.168.1.2 的包
  3. tcp.port == 80 源端口或目的端口是80的包
  4. tcp.flags.reset == 1 过滤TCP RST包。先找到RST包,然后右键Follow -> TCP Stream是常用的排障方式
  5. tcp.analysis.retransmission 过滤所有的重传包

4.3 导出符合条件的包

有时pcap文件太大,导致wireshark非常慢,而大部分数据包可能是不需要的。在这种情况 下,可以先用过滤条件筛选出感兴趣的包,然后 File -> Export Specified Packets ... ,弹出的对话框里,可以选择当前显示的包,或者某个指定区间的包另存为新pcap。

然后就可以关闭原来的pcap,打开新的pcap进行分析。

5 总结

tcpdump和wireshark功能非常强大,组合起来更是网络排障的首选利器。这里介绍的内容只 是九牛一毛,更多的时候,你需要 tcpdump+wireshark+google

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码