【鸟叔的Linux私房菜】2-主机规划与磁盘分区

   日期:2024-12-26    作者:rqdafengmj 移动:http://ljhr2012.riyuangf.com/mobile/quote/38172.html

各个组件和设备在Linux下都是一个文件。

  • 磁盘:如果是一般小型的服务器,重点在容量,大于20G就够用了。如果是服务器,就要考虑使用高级的磁盘阵列RAID模式。
  • 几乎所有的硬件设备文件都在/dev文件夹中
  • SATA接口的硬件文件名为/dev/sd[a-d],即有sda sdb sdc sdd四个文件
  • 形式的表示法会使用的很频繁

:Linux可执行程序及相关的文件存放的目录

常见设备及其在Linux系统中对应文件名

设备类型文件名示例SCSI、SATA、USB硬盘驱动器 (例如:, U盘同上,也使用 Virtio接口硬盘(虚拟机环境
用于虚拟机内软盘驱动器IDE硬盘(较旧系统中,现代系统较少见
由于IDE接口的磁盘驱动器几乎已经被淘汰,现在文件名也用打印机(并口 (25针打印机)
(USB接口)鼠标 (通用
(PS/2鼠标)
(当前使用的鼠标)CD-ROM/DVD-ROM (通用)
(通用,CentOS常见)
(当前CD-ROM磁带机(IDE接口
(SATA/SCSI接口
(当前磁带)USB字符设备(如鼠标、键盘, USB块设备(如U盘 或 , 模拟器如果机器是跟互联网服务提供商ISP申请的云端机器,这时得到的可能是虚拟机,为了加速,虚拟机内的磁盘是使用模拟器产生的,模拟器的磁盘文件名可能是

windows系统:推荐VirtualBox
linux系统:大多使用KVM虚拟化软件

磁盘通常有多个磁片,所有磁片的同一磁道称为柱面,通常是文件系统的最小单位,也就是分区的最小单位。GPT可以使用扇区号码来作为分区单位。

设备文件名根据Linux内核检测到的磁盘顺序来命名。

磁盘的第一个扇区存放磁盘的重要信息。
早期磁盘第一个扇区里存放的磁盘的重要信息,称为格式(master boot record)。
但是由于磁盘的容量不断扩大,造成读写的困难。
后来出现新的磁盘分区格式,称为(GUID partition table)。

必须对硬盘进行分区,才可以使用。

MBR(MS-DOS)

早期的Linux系统为了兼容Windows磁盘,使用支持Windows的的方式来处理启动引导程序与分区表。启动引导程序与分区表放在磁盘的第一个扇区。这个扇区通常是512字节的大小。

第一个扇区的512字节主要包含这两部分

  • 主引导记录(Master Boot Record,MBR:可以安装自引导程序的地方,有446字节
  • 分区表(partition table:记录完整分区表的状态,有64个字节

由于分区表所在区块仅有64字节容量,因此最多只能有四组记录,每组记录了该区段起始与结束的柱面号码。若将硬盘以长条形来看,则会将柱面以柱形图看,那么那64字节的记录就会如下图所示

假设硬盘文件设备名称为/dev/sda时,这四个分区在Linux系统中的设备文件名如下所示:重点在于文件名后面还会再加一个数字,这个数字与分区所在的位置有关。

  • P1:/dev/sda1
  • P2:/dev/sda2
  • P3:/dev/sda3
  • P4:/dev/sda4

上图中我们假设硬盘只有400个柱面,共划分为四个分区。第四个分区所在的柱面号码为301~400号 柱面的范围。
当你的操作系统为Windows时,那么第一到第四分区的代表符号就是C、D、E、F。
当你有数据要写入F分区时,你的数据会被写入整个硬盘的301~400号柱面之间的意思。

由于分区表就只有64 字节而已,最多只能容纳四组分区记录,这四个分区的记录被称为(Primary)或扩展(Extended)分区。
根据上面的图与说明,我们可以得到几个重要的信息

  • 所谓的分区只是针对那个64 字节的分区表进行设置而已。

  • 硬盘默认的分区表只能记入四组分区信息。

  • 这四组划分信息我们称为主要(Primary)或扩展(Extended)分区。

  • 分区的最小单位通常为柱面(Cylinder)。

  • 当系统要写入磁盘时,一定会参考磁盘分区表,才能针对某个分区进行数据处理。

你会不会突然想到,为啥要分区?基本上你可以这样思考分区的意义

  1. 数据的安全性
    因为每个分区的数据是分开的。所以,当你需要将某个分区的数据重新整理时,例如你要计算计算机 Windows 的 C 盘重新安装一次系统时,可以将其他重要数据移动到其分区,例如将程序、桌面、邮件 数据移动到 D 盘,那么 C 盘重新安装系统并不会影响到 D 盘。所以善用分区,可以让你的数据更安全。

  2. 系统的性能考虑
    由于分区将数据集中在某个柱面区间中,例如图2.2.2 中当第一个分区位于柱面号码1~100号, 如此一来当数据读取到该分区时,硬盘只要查寻前面1~100的柱面范围,由于数据集中,将有助于 数据读取的速度与性能,所以说,分区是很重要的。

既然分区表只记得四组数组的信息,那我是不是代表一块硬盘最多只能划分出四个分区呢?当然 不是。有经验的朋友都知道,你可以将一块硬盘划分成十个以上的分区。那又是如何做到的

实际上扩展分区并不是只有一个区域,而是会分布在每个分区的最前面几个扇区来记录分区信息,鸟哥在上图就将其简化了。有兴趣的读者可以到下面的实际扩展分区的记录方式:
https://en.wikipedia.org/wiki/extended_boot_record

在上图中,我们知道硬盘的四个分区记录仅使用到两个,P1为主分区,而P2则为扩展分区。请注意扩展分区的目的 是使用额外的扇区来记录分区信息,扩展分区本身并不能被拿来格式化

右下角那个区块继续划分出五个分区,这五个由扩展分区继续切出来的分区,就被称 为。同时注意一下,由于逻辑分区是由扩展分区继续划分出来的,所以它 可以使用的柱面范围就是扩展分区所设定的范围,也就是图中的 101 - 400。

同样,在上述的分区在Linux系统中的设备文件名分别如下:

P1:/dev/sda1
P2:/dev/sda2
L1:/dev/sda5
L2:/dev/sda6
L3:/dev/sda7
L4:/dev/sda8
L5:/dev/sda9

仔细看看,怎么设备文件名没有/dev/sda3与/dev/sda4? 因为前面四个号码都是保留给主要分区 或扩展分区用的,所以逻辑分区的设备名称号码就从5号开始。这在 MBR 方式的分区表中是个很重要的 特性,不能忘记。

MBR 主要分区、扩展分区与逻辑分区的特性我们做个简单的定义。

  • 主要分区与扩展分区最多可以有 4 个(硬盘的限制);
  • 扩展分区最多只能有 1 个(操作系统的限制);
  • 逻辑分区是由扩展分区持续划分出来的分区
  • 能够被格式化后作为数据存取的分区是主要分区与逻辑分区,扩展分区无法格式化;
  • 逻辑分区的数量依赖于操作系统的不同。在Linux系统中,SATA硬盘已经突破63个以上的分区限制。
    分区是一个非常复杂的东西,因为它是以柱面为单位的连续磁道空间,且扩展分区又属于特殊的分区类型。所以在分区的时候要注意,特别是对于扩展分区的情况。

答案是这样的

上图可以整合:因为上图的D与E同属于扩展分区内的逻辑分区,因此只需将这两个分区割除,然后再重新建立一个新的分区,就可以在不影响其他分区的情况下,将两个分区的容量整合成为一个。

下图不可整合:因为D与E分属主要分区与逻辑分区,两者不能够整合在一起。如果扩展分区破坏,所有逻辑分区将会被删除,因为整张硬盘的信息都记录在扩展分区里面

由于第一个角度所记录的分区表与MBR是这么的重要,几乎只要读取硬盘都会先由这个角度先读取。因此,如果整个硬盘的第一个分区损坏,那么整个硬盘就没有用了。因为系统如果找不到分区表,怎么知道如何去读取柱面区间?

如果我想把一块大硬盘暂时划分为四个分区,同时还有其他的剩余容量可以让我在未来的时候进行规划,我能不能划分出四个主分区呢? 若不行,那么你建议我该如何划分?
可以用四个分区的三个主要和一个扩展分区,剩余容量在逻辑分区。

MBR分区除了上述的主要分区、扩展分区、逻辑分区分需要注意之外,由于每组分区表仅有16字节而已,因此记录的信息真的是相当有限。所以,在过去MBR分区表的限制中经常可以发现如下的问题

  • 操作系统无法使用2.2TB以上的磁盘容量
  • MBR仅有一个区块,若被破坏后,经常无法或很难恢复
  • MBR内的存放启动引导程序的区块仅446字节,无法存储较多的程序代码。

这个2.2TB限制的现象在早期并不会很严重。但是,近年来硬盘厂商推出的磁盘容量动不动就高达好几个TB。目前(2015年)单一磁盘最高容量甚至高达8TB。如果使用磁盘阵列的系统,用了24块4TB磁盘搭建出磁盘阵列,那在Linux下面就会看到有一块70TB左右的磁盘。如果使用MBR的话,那要2TB/2TB地划分下去,虽然Linux kernel现在已经可以通过某些机制使磁盘分区高过63以上,但是这样就要划分出将近四十个分区,真要命,为了解决这个问题,以后就有了GPT这个磁盘分区的格式出现。

GPT磁盘分区表

因为过去一个扇区大小就是 512 字节而已,不过目前已经有了 4K 的扇区设计出现。为了兼容所有的磁盘,因此在扇区的定义上面,大多会使用所谓的来处理。GPT 将磁盘所有区块以此 LBA(默认 512 字节)来规划,而第一个 LBA 称为 LBA0(从 0 开始编号)。

与 MBR 仅使用第一个 512 字节区块来记录不同,GPT 使用了 34 个 LBA 区块来记录分区信息。同时与过去的 MBR 仅有一个区块,被干掉就死光的情况不同GPT 除了前面 34 个 LBA 之外整个磁盘的最后 34 个 LBA 也拿来做为另一个备份。这样或许会比较安全些吧!详细的结构有点像右图的模样。

  • LBA0 (MBR 兼容区块)

与 MBR 模式相似,这个兼容区块也分为两个部分,一个是跟之前 446 字节相似的区块存储了第一阶段的启动引导程序。而在原本的分区表的记录区内,这个兼容模式仅放入一个特殊符号,用来表示此磁盘为 GPT 格式之意。而不懂 GPT 分区表的磁盘管理程序,就不会认识这块磁盘,除非用户有特别要求要处理这块磁盘,否则该管理软件不能修改此分区信息,进一步保护了磁盘。

  • LBA1 (GPT 表头记录)

这个部分记录了分区表本身的位置与大小,同时记录了备份用的 GPT 分区(就是前面谈到的在最后 34 个 LBA 区块放置的位置,同时放置了分区表的校验码(CRC32,操作系统可以根据这个校验码来判断 GPT 是否正确。若有错误,还可以通过这个记录区来获取备份的 GPT (磁盘最后的那个备份区块)来恢复 GPT 的正常运行。

  • LBA2-33 (实际记录分区信息处

从 LBA2 区块开始每个 LBA 都可以记录 4 组分区记录,所以在默认的情况下,总共可以有 4×32=128 组分区记录。因为每个 LBA 有 512 字节,因此每组记录用到 128 字节的空间,除了每组记录所需要的标识符与相关的记录之外,GPT 在每组记录中分别提供了 64 位来记载开始/结束的扇区号码,因此,GPT 分区表对于单一分区来说,它的最大容量限制就在【2^64 × 512 字节 = 2^63 × 1K 字节 = 2^33 × TB = 8 ZB】,要注意 1ZB = 2^30 TB,你说够不够大

现在 GPT 分区默认可以提供多达 128 组记录,而在 Linux 内核本身的设备记录中,针对单一磁盘来说,虽然过去最多只能到达 15 个分区,不过由于 Linux 内核通过 udev 方式的处理,现在 Linux 已经没有这个限制了。此外GPT 分区已经没有所谓的主要、扩展、逻辑分区的概念,既然每组记录都可以独立存在,当然每一个都可以视为是主要分区,每一个分区都可以拿来格式化使用。

虽然新版的 Linux 大多支持 GPT 分区表,没办法,我们的服务器常常需要比较高容量的磁盘。不过,在磁盘管理工具上,fdisk这个老牌软件不支持GPT, 要使用 GPT 的话,就得要运行类似 gdisk 或者 parted 命令才行。
另外,启动引导程序方面,grub 不要使用 GPT 的话,就得要运行类似 gdisk 或者 parted 命令才行,启动引导程序方面,grub 第一版并不支持 GPT。得要 grub2 以后版本才会支持。
并不是所有的硬件都可以读取到 GPT 的磁盘分区格式。同时,并不是所有的操作系统都可以读取到 GPT 的磁盘分区格式。
是否能够读写 GPT 格式又与启动的检测程序有关。那启动的检测程序又分成什么呢就是 BIOS 与 UEFI

我们在“计算机概论”一章里面谈到了,没有运行软件的硬件是没有用的,除了会电人之外。而 为了计算机硬件系统的资源合理分配,因此有了操作系统这个系统软件的产生。由于操作系统会控制 进一步地读取所有的硬件并且提供内核功能,因此我们的计算机就能够识别硬盘内的文件系统,并且执行硬盘内的软件与运行该软件来完成各项软件的运行目的。

问题是你有没有发现,既然操作系统也是软件,那么我的计算机又是如何认识这个操作系统软件并执行它的呢?明明启动时我的计算机还没有任何软件系统,它又要如何读取硬盘内的操作系统文件?嘿嘿,这就得牵涉到计算机的启动程序了。下面我们就来谈谈这个启动程序吧

基本上,目前的主机系统在加载硬件驱动方面的程序,主要有早期的BIOS与新的UEFI两种机制,我们分别来谈谈。

BIOS搭配MBR/GPT的启动流程

在“计算机理论”里我们提到那个可爱的BIOS和CMOS这两个东西CMOS是用来记录各种硬件参数并嵌入主板上的存储器BIOS是一个写入到主板上的一种固件(再次说明,固件就是在硬件上写入的一个软件程序。这个BIOS就是在启动的时候,计算机系统会主动执行的第一个程序。

接下来BIOS会去分析计算机里面有哪一些存储设备,我们以硬盘为例BIOS会依据用户的设置去取得能够启动的硬盘,并且到该硬盘里面去读取第一个扇区的MBR位置。MBR这个仅有446字节的硬盘容量里面会放置最基本的启动引导程序,此时BIOS就功成圆满接下来就是MBR内的启动引导程序的工作了。

这个启动引导程序的目的在于加载内核文件,由于启动引导程序是操作系统在安装的时候所提供的,所以它会认识硬盘内的文件系统格式,因此就能够读取内核文件,然后接下来就是内核文件的工作,启动引导程序与BIOS也就功成圆满,将之后的工作交给大家所知道的操作系统。

简单地说,整个启动流程到操作系统之前的步骤应该是这样的

1. BIOS:启动自动执行的固件,会认识第一个可启动的设备
2. MBR:第一个可启动设备的第一个扇区内的主引导记录块,包含启动引导代码
3. 启动引导程序(boot loader:一个可读取内核文件来执行的软件
4. 内核文件:开始启动操作系统。

注意,如果你的分区表为GPT格式的话,那么BIOS也能够从LBA0的MBR兼容区块读一阶段的启动引导程序代码,如果你的启动引导程序能够支持GPT的话,那么使用BIOS同样可以读取到正确的内核系统。如果你的启动引导程序不能够支持GPT的话,那么使用BIOS就无法读取到正确的内核系统,无法启动操作系统。

LBA0 只提供第一阶段的启动引导程序代码,因此如果你使用类似 GRUB 的启动引导程序的话,那就得额外划分出一个“BIOS boot”的分区,这个分区才能够放置其他开机过程所需的程序,在 CentOS 当中,这个分区通常占用 2MB 左右而已。

由上面的说明我们知道,BIOS 与 MBR 都是硬件本身会支持的功能,至于 Boot Loader 则是操作系统安装在 MBR 上面的一个软件。由于 MBR 仅有 446 节点而已,因此这个启动引导程序是非常小而高效的。这个 Boot Loader 的主要任务有下面这些

  • 提供选项:用户可以选择不同的启动选项,这也是多重引导的重要功能
  • 加载内核文件:直接指向可用的程序区域来启动操作系统
  • 转交给其他启动引导程序:将启动管理功能转交给其他启动引导程序负责。

在图中我们可以发现,MBR的启动引导程序提供两个选项,选项一(M1)可以直接加载Windows的内核文件来开机;选项二(M2)则是将开机管理工作交给第二个分区的启动扇区(boot sector)。当用户在开机的时候选择选项二时,那么整个开机管理工作就会交给第二分区的启动引导程序。当第二个启动引导程序启动后,该启动引导程序内(图2.2.8中)仅有一个启动选项,因此就能够使用Linux的内核文件来启动。
这就是多重引导的工作情况。

我们将上图做个总结

  • 每个分区都有自己的启动扇区(boot sector
  • 图中的系统分区为第一及第二分区
  • 实际可启动的内核文件是放置到各分区中的
  • 启动引导程序只会认识自己的系统分区内可启动的内核文件,以及其他启动引导程序而已
  • 启动引导程序可直接指向或是间接将管理权转交给另一个管理程序。

为什么人们常说“如果要安装多重引导,最好先安装 Windows 再安装 Linux”

  • Linux 在安装的时候,可以选择将启动引导程序安装在 MBR 或各分区的启动扇区,并且 Linux 的启动引导程序可以手动设置选项(即图 2.2.8 中的 M1、M2,因此可以在 Linux 的启动引导程序里面加入 Windows 启动的选项
  • Windows 在安装时其安装程序会主动覆盖 MBR 以及自己所在分区的启动扇区,没有选择的机会,并且它没有让我们自己选择选项的功能。

因此,如果先安装 Linux 再安装 Windows,那么 MBR 的启动引导程序就只有 Windows 的选项,而不会有 Linux 的选项(因为原本在 MBR 内的 Linux 的启动引导程序会被覆盖掉)。这需要重新安装 Linux 一次吗?当然不需要,只需要用尽各种方法来处理 MBR 的内容即可。例如利用 Linux 的恢复模式来修复 MBR。

UEFI BIOS搭配 GPT启动的流程

我们现在已经知道 GPT可以提供64位的寻址,然后也能够使用较大的区块来处理,而且BIOS不懂GPT。还得要通过GPT提供的兼容模式才能够读写这个磁盘设备,BIOS仅是16位的程序,在与新的操作系统的接轨有点弱。为了解决这个问题,有了UEFI(United extensible Firmware Interface)。

主要是想要取代BIOS这个固件接口,因此我们也称UEFI为UEFI BIOS。UEFI使用C程序语言编写,比起使用汇编语言的传统BIOS要更容易开发。也因为使用C语言来编写,因此如果开发者够厉害,甚至可以在UEFI启动阶段就让该系统了解TCP/IP而直接上网,根本不需要进入操作系统,这让小型系统的开发充满各式各样的可能性。

目录树结构

那么如何结合目录树结构核磁盘数据吗?就是挂载

文件系统与目录树的关系,挂载

发行版发行时,挂载和磁盘分区的规划


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号