操作系统对外部硬件的设备管理
# I/O 设备的基本概念与分类
# 什么是 I/O 设备
“I/O” 就是 “输入 / 输出”(Input/Output)
I/O
设备就是可以将数据输入到计算机,或者可以接收计算机输出数据的外部设备,属于计算机中的硬件部件。
UNIX
系统将外部设备抽象为一种特殊的文件,用户可以使用与文件操作相同的方式对外部设备进行操作。
# 按使用特性分类
# 按传输速率分类
# 按信息交换的单元分类
# 整体框架
# I/O 控制器
# I/O 设备的机械部件
I/O
设备的主要用来执行具体 l/O
操作。
- 如我们看得见摸得着的鼠标 / 键盘的按钮;显示器的 LED 屏;移动硬盘的磁臂、磁盘盘面。
I/O
设备的通常是一块插入主板扩充槽的印刷电路板。
# I/O 设备的电子部件(I/O 控制器)
CPU
无法直接控制 I/O
设备的机械部件,因此 I/O
设备还要有一个电子部件作为 CPU
和 I/O
设备机械部件之间的 “中介”,用于实现 CPU
对设备的控制。
这个电子部件就是 ,又称。
CPU
可控制 I/O
控制器,又由 I/O
控制器来控制设备的机械部件。
# I/O 控制器的功能
① 接受和识别 CPU
发出的命令
如 CPU
发来的 read/write 命令, I/O
控制器中会有相应的存放命令和参数
② 向 CPU
报告设备的状态
I/O
控制器中会有相应的。用于记录 I/O
设备的当前状态。
- 如:1 表示空闲, 0 表示忙碌
③ 数据交换
I/O
控制器中会设置相应的。
- 输出时,数据寄存器用于暂存
CPU
发来的数据,之后再由控制器传送设备。 - 输入时,数据寄存器用于暂存设备发来的数据,之后
CPU
从数据寄存器中取走数据。
④ 地址识别
类似于内存的地址,为了区分设备控制器中的各个寄存器,也需要给各个寄存器设置一个特定的 “地址”。
I/O
控制器通过 CPU
提供的 “地址” 来判断 CPU
要读 / 写的是哪个寄存器
# I/O 控制器的组成
小细节:
① 一个 I/O 可能会对应多个设备;
② 数据寄存器、控制寄存器、状态寄存器可能有多个(如:每个控制 / 状态寄存器对应一个具体的设备),且这些寄存器都要有相应的地址,才能方便 CPU
操作。
- 有的计算机会让这些寄存器占用内存地址的一部分,称为;
- 另一些计算机则采用
I/O
专用地址,即。
# 内存映像 I/O 与 寄存器独立编址
# 整体框架
# I/O 控制方式
即:用什么样的方式来控制 I/O
设备的数据读 / 写
需要注意的问题:
- 完成一次读 / 写操作的流程;
CPU
干预的频率;- 数据传送的单位;
- 数据的流向;
- 主要缺点和主要优点。
# 程序直接控制方式
① 完成一次读 / 写操作的流程(以为例)
② CPU
干预的频率
很频繁, I/O
操作开始之前、完成之后需要 CPU
介入,并且
③ 数据传送的单位
④ 数据的流向
读操作(数据输入):I/O 设备 -> CPU(指的是 CPU 的寄存器) -> 内存
写操作(数据输出):内存 -> CPU -> I/O 设备
每个字的读 / 写都需要 CPU 的帮助
⑤ 主要缺点和主要优点
优点:实现简单。在读 / 写指令之后,加上实现循环检查的一系列指令即可
- 因此才称为 “程序直接控制方式”
, CPU
利用率低。
# 中断驱动方式
引入。由于 I/O
设备速度很慢,因此在 CPU
发出读 / 写命令后,可,先切换到别的进程执行。当 I/O
完成后,控制器会向 CPU
发出一个中断信号, CPU
,会保存当前进程的运行环境信息,转去执行中断处理程序处理该中断。处理中断的过程中, CPU
从 I/O
控制器读一个字的数据传送到 CPU
寄存器,再写入主存。接着,。
- 也可以选择不回复它,让它在就绪队列中继续等待,先执行别的进程
- 若存储字长 32 位的话,1 个字等于 4 字节
注意:
① CPU
会在每个指令周期的末尾检查中断;
② 中断处理过程中需要保存、恢复进程的运行环境,这个过程是需要一定时间开销的。可见,如果中断发生的频率太高,也会降低系统性能。
② CPU
干预的频率
每次 I/O
操作开始之前、完成之后需要 CPU
介入。
等待 I/O
完成的过程中 CPU
可以切换到别的进程执行。
③ 数据传送的单位
每次读 / 写一个字
④ 数据的流向
读操作(数据输入):I/O 设备 -> CPU(指的是 CPU 的寄存器) -> 内存
写操作(数据输出):内存 -> CPU -> I/O 设备
⑤ 主要缺点和主要优点
优点:与 “程序直接控制方式” 相比,在 “中断驱动方式” 中, I/O
控制器会通过中断信号主动报告 I/O
已完成, CPU
不再需要不停地轮询。
, CPU
利用率得到明显提升。
:每个字在 I/O
设备与内存之间的传输,都需要经过 CPU
。而。
# DMA 方式
与 “中断驱动方式” 相比,(Direct Memory Access,。主要用于块设备的 I/O
控制)有这样几个改进:
① 。不再是一个字、一个字的传送;
② 数据的流向是从设备直接放入内存,或者从内存直接到设备。不再需要 CPU
作为 “快递小哥”。
③ 仅在传送一个或多个数据块的开始和结束时,才需要 CPU
干预。
DR
(Data Register,数据寄存器)∶暂存从设备到内存,或从内存到设备的数据。
MAR
(Memory Address Register,内存地址寄存器)∶
- 在输入时,
MAR
表示数据应放到内存中的什么位置; - 输出时
MAR
表示要输出的数据放在内存中的什么位置。
DC
(Data Counter,数据计数器):表示剩余要读 / 写的字节数。
CR
(Command Register,命令 / 状态寄存器)∶用于存放 CPU
发来的 I/O
命令,或设备的状态信息。
其实 DMA
控制器在读入数据的过程中,也是一个字一个字读入的,每次读入的一个字放在 DR
中,再从 DR
写入到内存当中
② CPU
干预的频率
仅在传送一个或多个数据块的开始和结束时,才需要 CPU 千预。
③ 数据传送的单位
每次读 / 写
- 若采用离散的方式的话,同样需要
CPU
发送多条I/O
指令
④ 数据的流向(不再需要经过 CPU)
读操作(数据输入): l/O
设备 -> 内存
写操作(数据输出):内存 -> I/O
设备
⑤ 主要缺点和主要优点
优点:数据传输以 “块” 为单位, CPU
介入频率进一步降低。数据的传输不再需要先经过 CPU
再写入内存,数据传输效率进一步增加。 CPU
和 I/O
设备的并行性得到提升。
: CPU
每发出一条 I/O
指令,只能读 / 写一个或多个连续的数据块。
如果要读 / 写多个离散存储的数据块,或者要将数据分别写到不同的内存区域时, CPU
要分别发出多条 I/O
指令,进行多次中断处理才能完成。
# 通道控制方式
:一种,可以理解为是 “”。通道可以识别并执行一系列
与 CPU
相比,通道可以执行的指令很单一,并且通道程序是放在主机内存中的,也就是说通道与 CPU
共享内存
-
通道 = 弱鸡版
CPU
-
通道程序 = 任务清单
② CPU
干预的频率
极低,通道会根据 CPU
的指示执行相应的通道程序,只有完成一组数据块的读 / 写后才需要发出中断信号,请求 CPU
干预。
③ 数据传送的单位
每次读 / 写
④ 数据的流向()
读操作(数据输入): l/O
设备 -> 内存
写操作(数据输出):内存 -> I/O
设备
⑤ 主要缺点和主要优点
缺点:实现复杂,需要专门的通道硬件支持
。
# 整体框架
# I-0 软件层次结构
# 用户层软件
用户层软件,用户可直接使用该层提供的、与 I/O
操作相关的库函数对设备进行操作
# 设备独立性软件,逻辑设备表(LUT)
,又称。与设备的硬件特性无关的功能几乎都在这一层实现。
主要实现的功能:
① 向上层提供统一的调用接口(如 read/write
系统调用)
② 设备的保护
原理类似与文件保护。设备被看做是一种特殊的文件,不同用户对各个文件的访问权限是不一样的,同理,对设备的访问权限也不一样。
③ 差错处理
设备独立性软件需要对一些设备的错误进行处理
④ 设备的分配与回收
⑤ 数据缓冲区管理
可以通过缓冲技术屏蔽设备之间数据交换单位大小和传输速度的差异
⑥ 建立逻辑设备名到物理设备名的映射关系;根据设备类型选择调用相应的驱动程序
用户或用户层软件发出 I/O
操作相关系统调用的系统调用时,需要指明此次要操作的 I/O
设备的逻辑设备名
- eg:去学校打印店打印时,需要选择打印机 1 / 打印机 2 / 打印机 3 ,其实这些都是
需要通过 “” 来确定逻辑设备对应的,并找到该设备对应的
操作系统系统可以采用两种方式管理 $\color {red} 逻辑设备表(LUT) $:
第一种方式,,这就意味着所有用户不能使用相同的逻辑设备名,因此这种方式只适用于单用户操作系统。
第二种方式,,各个用户使用的逻辑设备名可以重复,适用于多用户操作系统。
- 系统会在用户登录时为其建立一个用户管理进程,而
LUT
就存放在用户管理进程的PCB
中。
类似于单级目录和两级目录
# 不同类型的 I/O 设备需要有不同的驱动程序处理?(设备驱动程序)
各式各样的设备,外形不同,其内部的电子部件( I/O
控制器)也有可能不同
就是 I/O
控制器可能不相同
不同设备的内部硬件特性也不同,这些特性只有厂家才知道,因此厂家须提供与设备相对应的驱动程序, CPU
执行驱动程序的指令序列,来完成设置设备寄存器,检查设备状态等工作
- 例如:鼠标或者键盘,当
usb
插入到电脑的时候,右下角会有正在安装驱动程序的提示
# 设备驱动程序
注:驱动程序一般会以一个独立进程的方式存在
# 中断处理程序
当 I/O
任务完成时, l/O
控制器会发送一个,系统会找到相应的并执行。中断处理程序的处理流程如下:
# 总结
理解并记住 I/O
软件,要能够推理判断某个处理应该是在哪个层次完成的
最常考的是设备独立性软件、设备驱动程序这两层。
只需理解一个特点即可:
# I-O 核心子系统
注:假脱机技术( SPOOLing
技术)需要请求 “磁盘设备” 的设备独立性软件的服务,因此一般来说假脱机技术是在用户层软件实现的。但是 408 大纲又将假脱机技术归为 “I/O 核心子系统” 的功能,因此考试时还是以大纲为准。
# I/O 调度
如:磁盘调度(先来先服务算法、最短寻道优先算法、SCAN 算法、C-SCAN 算法、LOOK 算法 C-LOOK 算法)。当多个磁盘 I/O
请求到来时,用某种调度算法确定满足 l/O
请求的顺序。
同理,打印机等设备也可以用先来先服务算法、优先级算法、短作业优先等算法来确定 l/O
调度顺序。
# 设备保护
操作系统需要实现,不同的用户对各个文件有不同的访问权限(如:只读、读和写等)。
在 UNIX
系统中,,每个设备也会有对应的 FCB
。
- 当用户请求访问某个设备时,系统根据
FCB
中记录的信息来判断该用户是否有相应的访问权限,以此实现 “设备保护” 的功能。(参考 “4.8、文件保护 ” 小节)
# 假脱机技术(SPOOLing 技术)
# 什么是脱机技术
手工操作阶段:主机直接从 l/O
设备获得数据,由于设备速度慢,主机速度很快。人机速度矛盾明显,主机要浪费很多时间来等待设备
批处理阶段引入了(用磁带完成):
Tips:为什么称为 “脱机”―― 进行的输入 / 输出操作。
引入脱机技术后,缓解了 CPU
与慢速 I/O
设备的速度矛盾。
- 另一方面,即使
CPU
在忙碌,也可以提前将数据输入到磁带; - 即使慢速的输出设备正在忙碌,也可以提前将数据输出到磁带。
# 假脱机技术
“假脱机技术”,又称 “SPOOLing 技术” 是用软件的方式模拟脱机技术。 SPOOLing
系统的组成如下:
# 输入井和输出井
# 输入进程与输出进程
要实现 SPOOLing
技术,。系统会建立 “输入进程” 和 “输出进程”。
# 输入 / 输出缓冲区
# 共享打印机原理分析
独占式设备――。一段时间内只能满足一个进程的请求。
共享设备――(宏观上同时使用,微观上可能是交替使用)。可以同时满足多个进程的使用请求。
独占式设备的例子:若进程 1 正在使用打印机,则进程 2 请求使用打印机时必然阻塞等待
当多个用户进程提出输出打印的请求时,系统会答应它们的请求,但是并不是真正把打印机分配给他们,而是由假脱机管理进程为每个进程做两件事:
(1)在磁盘输出井中为进程申请一个空闲缓冲区(也就是说,这个缓冲区是在磁盘上的),并将要打印的数据送入其中;
(2)为用户进程申请一张空白的打印请求表,并将用户的打印请求填入表中(其实就是用来说明用户的打印数据存放位置等信息的),再将该表挂到假脱机文件队列上(打印任务队列)。
当打印机空闲时,输出进程会从文件队列的队头取出一张打印请求表,并根据表中的要求将要打印的数据从输出井传送到输出缓冲区,再输出到打印机进行打印。用这种方式可依次处理完全部的打印任务
虽然系统中只有一个台打印机,但每个进程提出打印请求时,系统都会为在输出井中为其分配一个存储区(相当于分配了一个逻辑设备),使每个用户进程都觉得自己在独占一台打印机,从而实现对打印机的共享。
SPOOLing
技术可以把一台物理设备成逻辑上的多台设备,。
# 整体框架
# 设备的分配与回收
# 设备分配时应考虑的因素
设备的固有属性可分为三种:独占设备、共享设备、虚拟设备。
设备的固有属性
―― 一个时段只能分配给一个进程(如打印机)
―― 可同时分配给多个进程使用(如磁盘),各进程往往是宏观上同时共享使用设备,而微观上交替使用。
―― 采用 SPOOLing
技术将独占设备改造成虚拟的共享设备,可同时分配给多个进程使用
- 如采用
SPOOLing
技术实现的共享打印机
设备的分配算法
先来先服务
优先级高者优先
短任务优先
设备分配中的安全性
从进程运行的安全性上考虑,设备分配有两种方式:
:为进程分配一个设备后就将进程阻塞,本次 I/O
完成后才将进程唤醒。
- eg:考虑进程请求打印机打印输出的例子
一个时段内每个进程只能使用一个设备
优点:破坏了 “请求和保持” 条件,不会死锁
缺点:对于一个进程来说, CPU
和 I/O
设备只能串行工作
:进程发出 I/O
请求后,系统为其分配 I/O
设备,进程可继续执行,之后还可以发出新的 l/O
请求。只有某个 l/O
请求得不到满足时才将进程阻塞。
一个进程可以同时使用多个设备
优点:进程的计算任务和 I/O
任务可以并行处理,使进程迅速推进
缺点:有可能发生死锁(死锁避免、死锁的检测和解除)
# 静态分配和动态分配
静态分配:进程运行前为其分配全部所需资源,运行结束后归还资源
- 破坏了 “请求和保持” 条件,不会死锁
动态分配:进程运行过程中动态申请设备资源
- 可用银行家算法或者结合资源分配图对死锁的检测和解除
# 设备分配管理中的数据结构
“设备、控制器、通道” 之间的关系:
一个通道可控制多个设备控制器,每个设备控制器可控制多个设备。
# 设备控制表(DCT)
:系统为每个设备配置一张 DCT
,用于记录设备情况
注:“进程管理” 章节中曾经提到过 “系统会根据阻塞原因不同,将进程 PCB
挂到不同的阻塞队列中”
- 若某进程需要等待
I/O
设备的分配,但是这个I/O
设备没法给该进程分配资源,会将该进程就会挂到这个I/O
设备的设备控制表所指向的设备队列的队尾
# 控制器控制表(COCT)
:每个设备控制器都会对应一张 COCT
。操作系统根据 COCT
的信息对控制器进行操作和管理。
# 通道控制表(CHCT)
:每个通道都会对应一张 CHCT
。操作系统根据 CHCT
的信息对通道进行操作和管理。
# 系统设备表(SDT)
:记录了的情况,每个设备对应一个表目。
# 设备分配的步骤
① 根据进程请求的查找 SDT
(注:物理设备名是进程请求分配设备时提供的参数)
② 根据 SDT
找到 DCT
,若忙碌则将进程 PCB
挂到中,不忙碌则将分配给进程。
③ 根据 DCT
找到 COCT
,若忙碌则将进程 PCB
挂到中,不忙碌则将分配给进程。
④ 根据 COCT
找到 CHCT
,若忙碌则将进程 PCB
挂到中,不忙碌则将分配给进程。
缺点:
① 用户编程时必须使用 “物理设备名”,底层细节对用户不透明,不方便编程
② 若换了一个物理设备,则程序无法运行
③ 若进程请求的物理设备正在忙碌,则即使系统中还有同类型的设备,进程也必须阻塞等待
- 若有 3 台打印机,若此时进程请求的是第 1 台打印机,虽然其他 2 台打印机是空闲的,但是只要第 1 台打印机是忙碌的,进程依然是要阻塞等待
# 设备分配步骤的改进(逻辑设备表)
改进方法:建立逻辑设备名与物理设备名的映射机制,用户编程时只需提供逻辑设备名
① 根据进程请求的查找 SDT
( )
② 查找 SDT
,找到用户进程的设备,将其分配给该进程。操作系统。
② 根据 SDT
找到 DCT
,若忙碌则将进程 PCB
挂到中,不忙碌则将分配给进程。
③ 根据 DCT
找到 COCT
,若忙碌则将进程 PCB
挂到中,不忙碌则将分配给进程。
④ 根据 COCT
找到 CHCT
,若忙碌则将进程 PCB
挂到中,不忙碌则将分配给进程。
某用户进程第一次使用设备时使用逻辑设备名向操作系统发出请求,操作系统根据用户进程指定的设备类型(逻辑设备名)查找系统设备表,找到一个空闲设备分配给进程,并在 LUT
中增加相应表项。
- 类似于缓存
逻辑设备表的设置问题:
整个系统只有一张 LUT
:各用户所用的,适用于单用户操作系统
每个用户一张 LUT
:,适用于多用户操作系统
# 整体框架
# 缓冲区管理
# 什么是缓冲区?有什么作用?
缓冲区是一个存储区域,可以由专门的硬件寄存器组成,也可利用内存作为缓冲区。
使用的,,一般仅用在对速度要求非常高的场合
- 如存储器管理中所用的联想寄存器,由于对页表的访问频率极高,因此使用速度很快的联想寄存器来存放页表项的副本
一般情况下,更多的是利用,“设备独立性软件” 的缓冲区管理就是要组织管理好这些缓冲区
如下所示:只有缓冲区中的数据充满了或者被取走为空后, CPU
才会介入来处理中断
# 单缓冲
假设某用户进程请求某种块设备读入若干块的数据。若采用的策略,操作系统会(若题目中没有特别说明,一个缓冲区的大小就是一个块)。
常考题型:计算每处理一块数据平均需要多久?
技巧:假定一个初始状态,分析下次到达相同状态需要多少时间,这就是处理一块数据平均所需时间。
在 “单缓冲” 题型中,可以假设初始状态为工作区满,缓冲区空。
# 双缓冲
假设某用户进程请求某种块设备读入若干块的数据。若采用的策略,操作系统会(若题目中没有特别说明,一个缓冲区的大小就是一个块)
双缓冲题目中,假设初始状态为:
# 使用单 / 双缓冲在通信时的区别
两台机器之间通信时,可以配置缓冲区用于数据的发送和接受。
显然,若两个相互通信的机器只设置单缓冲区,在任一时刻只能实现数据的单向传输。
- 类似于半双工
若两个相互通信的机器设置双缓冲区,则同一时刻可以实现双向的数据传输。
- 类似于全双工
# 循环缓冲区
将多个的缓冲区链接成一个。
注:以下图示中,橙色表示已充满数据的缓冲区,绿色表示空缓冲区。
# 缓冲池
由系统中共用的缓冲区组成。这些缓冲区按使用状况可以分为:空缓冲队列、装满输入数据的缓冲队列(输入队列)、装满输出数据的缓冲队列(输出队列)。
另外,根据一个缓冲区在实际运算中扮演的功能不同,又设置了四种工作缓冲区:
- 用于收容输入数据的工作缓冲区(hin)
- 用于提取输入数据的工作缓冲区(sin)
- 用于收容输出数据的工作缓冲区(hout)
- 用于提取输出数据的工作缓冲区(sout)