荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: georgehill (终生勤奋便成天才), 信区: Linux
标  题:  Large Disk mini-HOWTO 中译版
发信站: BBS 荔园晨风站 (Mon Jan  3 10:26:27 2000), 转信

华南木棉站Hacker版精华区文章
========================================

Large Disk mini-HOWTO 中译版

作者: Andries Brouwer, jaeb@cwi.nl
译者: Asd L. Chen, asdchen@ms1.hinet.net

v1.0, 26 June 1996 翻译日期: 10-13 November 1997


所有有关 disk geometry 及 1024 cylinder 的限制.


1. 问题所在

2. 启动

3. 磁碟 geometry 以及分割区

4. 转换与磁碟管理程式

5. 核心的 IDE 磁碟转换

      5.1. EZD
      5.2. DM6:DDO
      5.3. DM6:AUX
      5.4. DM6:MBR
      5.5. PTBL

6. 结论

      6.1. IDE 细节
      6.2. SCSI 细节

Large Disk mini-HOWTO 中译版

作者: Andries Brouwer, jaeb@cwi.nl
译者: Asd L. Chen, asdchen@ms1.hinet.net

v1.0, 26 June 1996 翻译日期: 10-13 November 1997


所有有关 disk geometry 及 1024 cylinder 的限制.


1. 问题所在

2. 启动

3. 磁碟 geometry 以及分割区

4. 转换与磁碟管理程式

5. 核心的 IDE 磁碟转换

      5.1. EZD
      5.2. DM6:DDO
      5.3. DM6:AUX
      5.4. DM6:MBR
      5.5. PTBL

6. 结论

      6.1. IDE 细节
      6.2. SCSI 细节


1. 问题所在

假如你的磁碟超过 1024 个磁簇(cylinders). 还有, 假如你的作业系统使用基本输
出入系统(BIOS).那麽你会遇到一个问题, 因为一般磁碟输出入/输入所使用的
INT13 BIO有相关细节更详细的描述.注意, 我使用 2.0.8 版核心原始程式做为参
考.其它的版本可能有一点点出入.

2. 启动

当系统启动时, BIOS 从第一个磁碟(或从软碟)读取磁区 0 (一般通称的 MBR -
Master Boot Record, 主启动磁区)并跳至在该处的程式码 - 通常是一些启动载入程
式(bootstrap loader). 这些小小的启动程式一般不会有自己的磁碟驱动程式而会使
用 BIOS 所提供的服务.这意谓著只有整个 Linux 核心都位於开头的 1024 个磁簇内
时才能够被启动.

这个问题很容易解决: 确定核心(也许还包括其它启动时用到的档案, 像是 LILO map
档) 是放在一个 BIOS 可以存取的到, 全都在开头的 1024 个磁簇内的分割区里 - 这
可以(可能)是第一个或第二个磁碟.

另一点是启动载入程式与 BIOS 必须同意彼此对磁碟逻辑(geometry)上的看法. 给
LILO `linear' 这个选项参数可能会有些帮助.细节後述.

3. 磁碟 geometry 以及分割区

如果你的磁碟上有好几种作业系统, 每一种使用一个或多个分割区.那麽对於分割区
位於何处不同的看法可能导致灾难性的後果.

MBR 中包含一个分割表描述分割区(主分割区: primary) 在那里.有四个表格给四个
主要分割区使用, 它们看起来像

      struct partition {
              char active;    /* 0x80: bootable, 0: not bootable */
              char begin[3];  /* CHS for first sector */
              char type;
              char end[3];    /* CHS for last sector */
              int start;      /* 32 bit sector number (counting 簇/磁头/磁区:
Cylinder/Head/Sector 的缩写)

因此, 有项资讯是重覆的: 分割区的位置可以由 24 位元的 begin 以及 end 栏位, 和
32 位元的 start 以及 length 栏位给定.

Linux 只使用 start 以及 length 栏位, 故最多可以处理包含 2^32 个磁区的分割区,
也就是, 最大 2 T砸残碜愎煌崾甑男
枨螅?

不幸的是, BIOS INT13 呼叫使用三个位元组的 CHS 编码, 10 个位元作为磁簇号码,
8 个位元作为磁头号码, 及 6 个位元作为磁轨上的磁区号码. 可能的磁簇号码是
0-1023, 可能的磁头号码是 0-255, 而磁轨上可能的磁区号码为 1-63(是的, 磁轨上
的磁区是由 1 起算, 不是 0). 以这 24 位元最多可以定址 8455716864 个位元组
(7.875 GB), 这是 1983 年磁碟机的两百倍.

更不幸的是, 标准的 IDE 介面容许 256 个磁区/磁轨, 65536 个磁簇以及 16 个磁
头.它自己本身可以存取 2^37 = 137438953472 个位元组(128 GB), 但是加上 BIOS
方面 63 个磁区与 1024 个磁簇的限制後只剩 528482304 个位元组(504 MB)可以定址
的到.

这不足以应付现今的磁碟, 人们使用各种硬体或软体上的方法来克服.
. 转换与磁碟管理程式

没有人对磁碟的'真实' geometry 有兴趣.磁轨的磁区数通常是变动的 - 接近磁碟外
围的磁轨有比较多的磁区 - 所以没有'真实'的每磁轨磁区数. 对於使用者而言最好
是把磁碟当作编号 0,1,..., 的磁区组合成的线性阵列, 让控制器去找出磁区究竟位
於磁碟的那里.

此线性编号一般通称为 LBA.对於 geometry 为 (C,H,S) 的磁碟而言属(c,h,s) 的线
性位址为 c*H*S+h*S+(s-1).所有 SCSI 控制器都使用 LBA, 某些 IDE 控制器也是.

如果 BIOS 把这 24 个位元(c,h,s) 转换成 LBA 并□给懂得 LBA 的控制器, 那麽又
可以定址到 7.875 GB .并不足以应付所有的磁碟, 但仍然是个改进.注意此处 BIOS
使用的 CHS, 它不再与'实体'有任何关系.

当控制剖痹蚴褂?(C,H,S). 通常 S=S', C'=C/N 而 H'=H*N, 其中 N
是确保 C'<=1024 之 2 的最小次方(所以 C'=C/N 时舍去的数浪费少许容量).再一
次, 这允许存取最多达 7.875 GB.

如果 BIOS 不知道 'Large' 或是 'LBA', 那麽还是有软体的解决方案.像是
OnTracker 或 EZ-Drive 这些个磁碟管理程式会以它们自己的函式(routines)替换掉
BIOS 的. 通常这是藉由将磁碟管理程式放在 MBR 及其後几个磁区(OnTrack 称这些
程式码为 DDO: Dynamic Drive Overlay )来达成的, 所以它会在任何其它作业系统之
前被启动. 这也就是为什麽在安装磁碟管理程式後从软碟启动可能会出问题.

这影响可能多於或少於 BIOS 转换 - 但特别是在相同的磁碟上跑数种不同的作业系统
时, 磁碟管理程式可能引起许多问题.

Linux 从 1.3.14 版开始支援 OnTrack 磁碟管理程式, 从 1.3.29 开始 支援
EZ-Drive .下面有些更进一步的资讯.

5. 核心的 IDE 磁碟转换

如果 Linux 侦测到 IDE 磁碟上有某些磁碟管理程式存在, 它将会试著使用与该磁碟
管理程式相同的方式来重新对应磁碟, 所以 Linux 看到与, 例如 DOS 配合 OnTrack
或是 EZ-Drive 相同的磁碟分割. 然而, 当你在指令列上指定 geometry 时, 就不会
做任何的重新对应 - 所以一行 `hd=cyls,heads,secs' 指令列选项可能取消掉与磁碟
管理程式的相容.

此重新对应的方式是尝试 4,8,16,32,64,128,255 磁头数(H*C 保持不变)直到 C <=
1024 或是 H = 255.

细节如螪DO

侦测到 OnTrack DiskManager(在第一个磁碟上), 因为第一个主要分割区型态为 54
.如上述重新对应 geometry 而且整个磁碟平移 63 个磁区. (所以旧的磁区 63 变
成磁区 0)然後从新的第 0 磁区读入新的 MBR (与分割表).此平移当然是为 DDO 留
空间 - 这也就是为什麽其它磁碟不必平移.

5.3. DM6:AUX

侦测到 OnTrack DiskManager(在其它磁碟上), 因为第一个主要分割区型态为 51 或
53.如上述重新对应 geometry .

5.4. DM6:MBR

侦测到某旧版的 OnTrack DiskManager, 并非藉由分割区型态, 而是签名(signature
).(测试在 MBR 里第 2,3 位元组的匦露杂?
geometry .

5.5. PTBL

最後, 核心会尝试从主分割区的 start 以及 end 值推断转换方式: 若某些分割区的
start 以及 end 磁簇小於 256, 而且 start 以及 end 磁区号码分别为 1 和 63 , 而
且 end 磁头为 31, 63, 或 127, 那麽, 因为依惯例分割区会在磁簇边界结束, 而且
更因为 IDE 介面最多使用 16 个磁头, 故推测有开启 BIOS 转换, 分别使用 32, 64
或 128 磁头数重新对应 geometry. (也许这里有点瑕疵, genhd.c 不应该测试磁簇
号码前两个位元吗?)无论如何, 当目前的 geometry 已经为每磁轨 63 个磁区且至少
这麽多磁头时, 不会做重新对应 (因为这可能意谓著重对应已完成).

Large Disk mini-HOWTO 中译版 : 结论
Previous: 核心的 IDE 磁碟转换
Next: Large Disk mini-HOWTO 中译版


6. 结论

这到底意谓著什麽? 对 Linux 的使用者而言只有一件事: 就是他们必须得确保 LILO
以及 fdisk 使用正确的 geometry , 其中'正确'的定义对 fdisk 而言是与其它在同
一个磁碟上的作业系统所使用的 geometry 相同, 而对 LILO 而言是能够在启动时期
成功地与 BIOS 交谈的 geometry.(这两者通常相符.)

fdisk 如何得知该 geometry ? 它询问核心, 使用 HDIO_GETGEO ioctl.但使用者可以
交谈式地或在鳎甀DE 驱动程式有四个关於 geometry 的资讯来源.第一个(G_user)是
使用者在指令列上所指定的. 第二个(G_bios)是 BIOS 的固定磁碟参数表(只用於第
一及第二个磁碟), 在系统启动时, 切换至 32 位元模式之前读入. 第三个(G_phys)
及第四个(G_log) 是由 IDE 控制器传回, 作为对 IDENTIFY 指令的回应 - 它们是 '
实体的' 以及 '目前逻辑上的' geometries.

另一方面, 对於 geometry 驱动程式需要两个值: 其中之一是 G_fdisk, 由
HDIO_GETGEO ioctl 传回, 另一个是 G_used , 这是执行输出/入时实际使用的. 如
果给定 G_user 则 G-fdisk 以及 G_used 两者都会设为 G_user, 当此资讯是根据
CMOS 所提供时则设为 G_bios , 其它情形设为 G_phys.如果 G_log 看起来合理则
G_used 就设为 G_log. 不然, 如果 G_used 不合理而 G_phys 看起来合理那麽
G_used 就设为 G_phys.此处的'合理'代表磁头数在 1-16 的□围内.

换个方式说: 指令列选项大於 BIOS , 并且决定 fdisk 看到的样子, 但如果它指定转
换的 geometry(磁头数大於 16), 则核心会藉由 IDENTIFY 指令的输出重定它.

6.2. SCSI 细节

在 SCSI 方面情况有一点点不同, 因为 SCSI 指令已经使用逻辑区块号码, 所以
'geometry' 对实际的输出/入完全没关系. 然而, 分割区的格式仍然是相同的, 所
以 fdisk 必须得捏造些 geometry , 并且也在此使用 HDIO_GETGEO - 真的, fdisk 不
会分辨 IDE 以及 SCSI 磁碟. 你可以从下面的详细描述见到各种驱动程式捏造一些
个不同的 geometry .真是, 一团混乱.

如果你没有使用 DOS 或这类系统, 那麽避免使用所有额外的转换设定, 可能的话, 尽
管使用 64 磁头, 每磁轨 32 磁区 (良好的, 方便每磁簇 1 MB), 如此当你把磁碟从
一个控制器换到另一个去时不会遇到任何问题. 某些 SCSI 磁碟驱动程式
(aha152x,pas16,ppa,qlogicfas,qlogicisp)非常在意与 DOS 的相容性而不允许只有
Linux 的系统使用超过 8 GB 的容量, 这是只臭□.

真实的 geometry 是什麽? 最简单的答案是没有这种东西.如果真有的话, 你不会袭间的事
. 让我重覆这句话: 只有蠢蛋会告诉
fdisk/LILO/Kernel SCSI 磁碟真实的 geometry .

但如果你好学且坚持, 可以问磁碟机自己.有个重要指令 READ CAPACITY 将会传回磁
碟的总容量, 而且有个 MODE SENSE 指令 Rigid Disk Drive Page(page 04) 会传回
磁簇以及磁头的数目(这是不能改变的资讯), 而在 Format Page(page 03)有每磁区的
位元组, 以及每磁轨的磁区数. 这数字一般与 notch 有关, 而且每磁轨的磁区数是
变动的 - 外围的磁轨拥有比内圈磁轨多的磁区.Linux 程式 scsiinfo 会给予这项资
讯. 其中有许多繁琐的细节, 而且很明白的, 没有人(也许甚至是作业系统)需要使用
这项资讯. 还有, 因为我们只关心 fdisk 以及 LILO , 一般得到的回答像
C/H/S=4476/27/171 - 这样的值 fdisk 根本不能使用, 因为分割表只保留 10resp.
8resp. 6 bits 给 C/H/S.

那核心之 HDIO_GETGEO 从何处取得其资讯? 嗯, 不是从 SCSI 控制器, 就是推论猜
测. 有些驱动程式似乎认为我们想知道 '真相' , 但我们当然只想知道 DOS 或 OS/2
FDISK (或 Adaptec AFDISK 等等)所用的.

注意, Linux fdisk 需要磁头数 H 以及每磁轨磁区数 S 以便转换 LBA 磁区号码成为
c/h/s 位址, 但磁簇数 C 在此转换中并未扮演什麽角色. 有些驱动程式使用
(C,H,S) = (1023,255,63) 来表示磁碟容量至少为 1023*255*63 个磁区.这是不幸
的, 因为这不能显示实际的大小, 而且将限制大部份版本之 fdisk 的使用者其磁碟最
大到 8 GB - 现今实际的限制.

在下面的描述中, M 表示磁碟的全部容量, 而 C,H,S 是磁簇, 磁头以及每磁轨磁区
数.如果我们把 C 当作 M/(H*S) 那给 H,S 就可以满足.

依预设, H=64, S=32.

aha1740, dtc, g_NCR5380, t128, wd7000:

      H=64, S=32.

aha152x, pas16, ppa, qlogicfas, qlogic 程式码使用 M+1 取代 M 并认为这是因为在
sd.c
      里的一只臭□使 M 的值少一.

advansys:

      H=64, S=32 除非 C > 1024 而且还开启 BIOS 中的 `> 1 GB' 选项, 此情况下
      H=255, S=63.

aha1542:

      询问控制器使用两种可能的 schemes 中的那一种, 并且使用 H=255, S=63 或
      H=64, S=32. 前者有个启动讯息 "aha1542.c: Using extended bios
      translation".

aic7xxx:

      H=64, S=32 除非 C > 1024, 而且还给了 "extended" 启动参数, 或在 SEEPROM
      或 BIOS 设了 `extended' 位元, 此情况下 H=255, S=63.

buslo 读入分
      割表, 若三种可能的 (H,S) = (64,32), (128,32), (255,63) 中 endH=H-1 的
      值看来可行则使用该对 (H,S) , 并印出启动讯息 "Adopting Geometry from
      Partition Table".

fdomain:

      从 BIOS Drive Parameter Table 找出 geometry 资讯, 或从分割表读取并使用
      H=endH+1, S=endS 给第一个分割区, 若非空, 或使用 H=64, S=32 for M <
      2^21 (1 GB), H=128, S=63 for M < 63*2^17 (3.9 GB) and H=255, S=63
      otherwise.

in2000:

      使用 (H,S) = (64,32), (64,63), (128,63), (255,63) 中第一个让 C <= 1024
      的. 此情况下, 在 1023 截掉 C .

seagate:

      从磁碟读取 C,H,S. (真诚实!) 如果 C 或 S 太大, 放入 S=17, H=2 并倍增 H
      直到 C <= 1024. 这表示 H 将为 0 如果 M > 128*1024*17 (1.1 GB). 这是只
      臭□.

ultrastor and u14_34f:

      三种对应之一 ((H,S) = (16,63), (64,32), (64,63)) 根据控制器的对应模式
      而定.

如果驱动程式没有指定 geometry , 我们就回到使用分割表或磁碟总容量来推断猜
测.

仔细看看分割表.因为依惯例分割区在磁簇边界结束, 我们可以为任何分割区定
end=(endC,endH,ednS) , 只要放 = M/(62*1024)(无条件进位),S = M/(1024*H)(无条件进
位), C = M/(H*S)(无条
件舍去).这能产生一 (C,H,S) 其中 C 最大 1024 而 S 最大 62.



--

     书山有路勤为径;
     学海无涯苦作舟!
 我是来自大富翁的小美!^_^

※ 来源:·BBS 荔园晨风站 bbs.szu.edu.cn·[FROM: 192.168.1.115]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店