为什么要有计算机网络?
在同一台设备上进行通信时,我们可以直接使用进程间通信的方式:管道,消息队列,共享内存,信号。但是,当我们需要在不同的设备上进行进程间通信时,就需要使用计算机网络进行通信了。不同设备之间的差异很大,为了兼容各种各样的设备,协商出了一套通用的网络协议,这就是TCP/IP协议。
1.1 TCP/IP网络模型
TCP/IP网络模型通常分为四层或者五层,其中最常用的协议是HTTP协议(应用层),TCP协议(传输层)和IP协议(网络层)。
应用层
最上层的,也是我们能直接接触到的是应用层,我们的手机电脑等设备使用的应用软件都是在应用层实现的。当两个不同设备的应用需要进行通信时,应用将数据传给应用层的下一层,也就是传输层。
应用层只需要专注于为用户提供应用功能。比如HTTP,FTP,SMTP等。
应用层工作在操作系统中的用户态,而传输层及以下工作在操作系统的内核态。
传输层
应用层的数据包会传给传输层,传输层是为应用层提供网络支持的。
传输层有两个传输协议,分别是TCP和UDP。
TCP的全称是传输控制协议(Transmission Control Protocol),大部分应用使用的都是TCP传输层协议,比如HTTP应用层协议。TCP相比于UDP多了很多特性,比如流量控制超时重传,拥塞控制等,这些都是为了保证数据包可靠安全的传输给对方。
UDP的全称是用户数据报协议(User Datagram Protocol),相对于TCP来说简单很多,只负责发送数据包,并不保证对方是否真正收到,但是他的传输效率更高,实时性相对来说也更好。
应用需要传输的数据可能会非常大,如果直接传输就不好控制,因此当传输层的数据包大小超过 MSS(TCP 最大报文段长度) ,就要将数据包分块,这样即使中途有一个分块丢失或损坏了,只需要重新发送这一个分块,而不用重新发送整个数据包。在 TCP 协议中,我们把每个分块称为一个 TCP 段(TCP Segment)。
当设备作为接收方时,传输层则要负责把数据包传给应用,但是一台设备上可能会有很多应用在接收或者传输数据,因此需要用一个编号将应用区分开来,这个编号就是端口。
比如 80 端口通常是 Web 服务器用的,22 端口通常是远程登录服务器用的。而对于浏览器(客户端)中的每个标签栏都是一个独立的进程,操作系统会为这些进程分配临时的端口号。
由于传输层的报文中会携带端口号,因此接收方可以识别出该报文是发送给哪个应用。
网络层
在TCP/IP模型中,传输层负责应用之间数据传输,帮助实现从应用到应用的通信,实际上,传输层并不负责传输功能,真正实现传输功能是在网络层。
网络层中最常使用的协议是IP(Internet Protocol)协议,IP协议将传输层的报文作为数据部分,加上IP包头组装成IP报文,如果 IP 报文大小超过 MTU(以太网中一般为 1500 字节)就会再次进行分片,得到一个即将发送到网络的 IP 报文。
为了不同设备之间互相寻找,我们将每个设备都进行编号,这个编号就是所谓的IP地址。对于IPv4协议,IP地址一共有32位,分为四段,每段8位($2^8=256$)。这样已经可以区分设备,但是,为了便于寻址,将IP地址分成两种意义。
- 网络号:标识该IP地址属于哪个子网
- 主机号:表示同一子网下的不同主机
为了便于计算一个IP地址的网络号和主机号,我们通常会使用子网掩码。
在寻址的过程中,先匹配到相同的网络号(表示要找到同一个子网),才会去找对应的主机。
除了寻址能力, IP 协议还有另一个重要的能力就是路由。实际场景中,两台设备并不是用一条网线连接起来的,而是通过很多网关、路由器、交换机等众多网络设备连接起来的,那么就会形成很多条网络的路径,因此当数据包到达一个网络节点,就需要通过路由算法决定下一步走哪条路径。
路由器寻址工作中,就是要找到目标地址的子网,找到后进而把数据包转发给对应的网络内。
网络接口层
生成了 IP 头部之后,接下来要交给网络接口层(Link Layer)在 IP 头部的前面加上 MAC 头部,并封装成数据帧(Data frame)发送到网络上。
IP 头部中的接收方 IP 地址表示网络包的目的地,通过这个地址我们就可以判断要将包发到哪里,但在以太网的世界中,这个思路是行不通的。
什么是以太网呢?电脑上的以太网接口,Wi-Fi接口,以太网交换机、路由器上的千兆,万兆以太网口,还有网线,它们都是以太网的组成部分。以太网就是一种在「局域网」内,把附近的设备连接起来,使它们之间可以进行通讯的技术。
以太网在判断网络包目的地时和 IP 的方式不同,因此必须采用相匹配的方式才能在以太网中将包发往目的地,而 MAC 头部就是干这个用的,所以,在以太网进行通讯要用到 MAC 地址。
MAC 头部是以太网使用的头部,它包含了接收方和发送方的 MAC 地址等信息,我们可以通过 ARP 协议获取对方的 MAC 地址。
所以说,网络接口层主要为网络层提供「链路级别」传输的服务,负责在以太网、WiFi 这样的底层网络上发送原始数据包,工作在网卡这个层次,使用 MAC 地址来标识网络上的设备。
网络接口层的传输单位使帧,网络层传输的基本单位是数据包,而传输层传输的基本单位是报文段。