估计数据库占用磁盘空间.docx
《估计数据库占用磁盘空间.docx》由会员分享,可在线阅读,更多相关《估计数据库占用磁盘空间.docx(11页珍藏版)》请在冰豆网上搜索。
估计数据库占用磁盘空间
1.估计数据库占用磁盘空间的大小
1.1估计堆的大小
1.1.1指定表中显示的行数
Num_Rows=表中的行数
1.1.2指定固定长度和可变长度列的数量
计算存储所需的空间,计算每组列在数据行中所占据的空间。
列的大小取决于数据类型和长度规定。
有关详细信息,请参阅数据类型(数据库引擎)。
Num_Cols=总列数(固定长度和可变长度)
Fixed_Data_Size=所有固定长度列的总字节大小
Num_Variable_Cols=可变长度列的数量
Max_Var_Size=所有可变长度列的最大总字节大小
1.1.3保留行中称为Null位图的部分以管理列的为空性
Null_Bitmap=2+((Num_Cols+7)/8)
只应使用该表达式的整数部分。
而放弃所有余数。
1.1.4计算可变长度数据的大小
如果表中有可变长度列,请确定在行中存储这些列需使用的空间:
Variable_Data_Size=2+(Num_Variable_Colsx2)+Max_Var_Size
添加到Max_Var_Size中的字节用于跟踪每个可变长度列。
此公式假设所有可变长度列均百分之百充满。
如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整Max_Var_Size值,从而对整个表大小得出一个更准确的估计。
1.1.5计算总的行大小
Row_Size=Fixed_Data_Size+Variable_Data_Size+Null_Bitmap+4
1.1.6计算每页的行数
(每页有8096个可用字节)
Rows_Per_Page=8096/(Row_Size+2)
因为行不跨页,所以每页的行数应向下舍入到最接近的整数。
公式中的数值2是计算行数时引入的行大小余量。
1.1.7计算存储所有行所需的页数
Num_Pages=Num_Rows/Rows_Per_Page
估计的页数应向上舍入到最接近的整数。
1.1.8计算在堆中存储数据所需的空间量
(每页的总字节为8192)
堆大小(字节)=8192xNum_Pages
1.2估计聚集索引的大小
1.2.1计算存储聚集索引叶级数据所用的空间
1.2.1.1指定表中显示的行数
Num_Rows=表中的行数
1.2.1.2指定固定长度和可变长度列的数量
计算每组列在数据行中所占据的空间。
列的大小取决于数据类型和长度规定。
有关详细信息,请参阅数据类型(数据库引擎)。
Num_Cols=总列数(固定长度和可变长度)
Fixed_Data_Size=所有固定长度列的总字节大小
Num_Variable_Cols=可变长度列的数量
Max_Var_Size=所有可变长度列的最大字节大小
1.2.1.3唯一标识符
如果聚集索引不唯一,则请说明“唯一标识符”列:
唯一标识符是可为Null的可变长度列。
在具有非唯一键值的行中,它非Null而且大小为4个字节。
此值是索引键的一部分,用于确保每一行都具有唯一的键值。
Num_Cols=Num_Cols+1
Num_Variable_Cols=Num_Variable_Cols+1
Max_Var_Size=Max_Var_Size+4
这些修改假定所有值都不是唯一的。
1.2.1.4Null位图
保留行中称为Null位图的部分以管理列的为空性。
计算其大小:
Null_Bitmap=2+((Num_Cols+7)/8)
仅使用上述表达式中的整数部分,而放弃所有余数。
1.2.1.5可变长度数据
如果表中有可变长度列,请确定在行中存储这些列需使用的空间:
Variable_Data_Size=2+(Num_Variable_Colsx2)+Max_Var_Size
添加到Max_Var_Size中的字节用于跟踪每个可变列。
此公式假设所有可变长度列均百分之百充满。
如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整Max_Var_Size值,从而对整个表大小得出一个更准确的估计。
如果没有可变长度列,请将Variable_Data_Size设置为0。
1.2.1.6计算总的行大小
Row_Size=Fixed_Data_Size+Variable_Data_Size+Null_Bitmap+4
值4是数据行的行标题的开销。
1.2.1.7每页的行数
(每页有8096个可用字节):
Rows_Per_Page=8096/(Row_Size+2)
因为行不跨页,所以每页的行数应向下舍入到最接近的整数。
公式中的数值2是计算行数时引入的行大小余量。
1.2.1.8每页保留的空行数
根据指定的填充因子计算每页保留的空行数:
Free_Rows_Per_Page=8096x((100-Fill_Factor)/100)/(Row_Size+2)
计算中使用的填充因子为整数值,而不是百分比。
因为行不跨页,所以每页的行数应向下舍入到最接近的整数。
填充因子增大时,每页将存储更多的数据,因此页数将减少。
公式中的数值2是计算行数时引入的行大小余量。
1.2.1.9存储所有行所需的页数
Num_Leaf_Pages=Num_Rows/(Rows_Per_Page-Free_Rows_Per_Page)
估计的页数应向上舍入到最接近的整数。
1.2.1.10叶级别中存储数据所需的空间大小
(每页共有8192个字节):
Leaf_space_used=8192xNum_Leaf_Pages
1.2.2计算存储聚集索引的索引信息所用的空间
1.2.2.1索引键中固定长度和可变长度列
指定索引键中固定长度和可变长度列的数量,并计算存储所需的空间:
索引键列可以包括固定长度和可变长度列。
若要估计内部级别索引行的大小,请计算每组列在索引行中所占据的空间。
列的大小取决于数据类型和长度规定。
有关详细信息,请参阅数据类型(数据库引擎)。
Num_Key_Cols=总键列数(固定长度和可变长度)
Fixed_Key_Size=所有固定长度键列的总字节大小
Num_Variable_Key_Cols=可变长度键列的数量
Max_Var_Key_Size=所有可变长度键列的最大字节大小
1.2.2.2唯一标识符
如果索引不唯一,则请说明所需的任意唯一标识符:
唯一标识符是可为Null的可变长度列。
它将是非Null的,在具有非唯一索引键值的行中的大小是4个字节。
此值是索引键的一部分,用于确保每一行都具有唯一的键值。
Num_Key_Cols=Num_Key_Cols+1
Num_Variable_Key_Cols=Num_Variable_Key_Cols+1
Max_Var_Key_Size=Max_Var_Key_Size+4
这些修改假定所有值都不是唯一的。
1.2.2.3Null位图
计算Null位图大小:
如果索引键中有允许为Null的列,则索引行的一部分将为Null位图保留。
计算其大小:
Index_Null_Bitmap=2+((索引行中的列数+7)/8)
仅应使用上述表达式中的整数部分,而放弃所有余数。
如果没有可为Null的键列,请将Index_Null_Bitmap设置为0。
1.2.2.4可变长度数据
如果索引中有可变长度列,请确定在索引行中存储这些列需使用的空间:
Variable_Key_Size=2+(Num_Variable_Key_Colsx2)+Max_Var_Key_Size
添加到Max_Var_Key_Size中的字节用于跟踪每个可变长度列。
此公式假设所有可变长度列均百分之百充满。
如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整Max_Var_Key_Size值,从而对整个表大小得出一个更准确的估计。
如果没有可变长度列,请将Variable_Key_Size设置为0。
1.2.2.5索引行大小
Index_Row_Size=Fixed_Key_Size+Variable_Key_Size+Index_Null_Bitmap+1(对应于索引行的行标题开销)+6(对应于子页ID指针)。
1.2.2.6每页的索引行数
(每页有8096个可用字节)
Index_Rows_Per_Page=8096/(Index_Row_Size+2)
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。
公式中的2是计算行数时引入的行大小余量。
1.2.2.7索引中的级别数
Non-leaf_Levels=1+logIndex_Rows_Per_Page(Num_Leaf_Pages/Index_Rows_Per_Page)
将此值向上舍入到最接近的整数。
此值不包括聚集索引的叶级别。
1.2.2.8索引中的非叶页数
计算索引中的非叶页数:
Num_Index_Pages=∑Level(Num_Leaf_Pages/(Index_Rows_Per_PageLevel))
其中,1<=Level<=Non-leaf_Levels
将每个被加数向上舍入到最接近的整数。
由于是个简单示例,请考虑使用Num_Leaf_Pages=1000和Index_Rows_Per_Page=25的索引。
页级别以上的第一个索引级别存储1000个索引行,即每个叶页一个索引行,每页可以包括25个索引行。
这意味着存储这1000个索引行需要40页。
下一级索引必须存储40行。
这意味着需要2页。
最后一级索引必须存储2行。
这意味着需要1页。
这就提供了43个非叶索引页。
如果将这些数用到前面的公式中,结果如下:
Non-leaf_Levels=1+log25(1000/25)=3
Num_Index_Pages=1000/(253)+1000/(252)+1000/(251)=1+2+40=43,这是上面的示例中所述的页数。
1.2.2.9索引的大小
(每页总共有8192个字节):
Index_Space_Used=8192xNum_Index_Pages
1.2.3对计算出的值求和
聚集索引大小(字节)=Leaf_Space_Used+Index_Space_used
此计算不考虑以下因素:
(1)分区:
分区的空间开销很小,但是计算复杂。
是否包括它并不重要。
(2)分配页:
至少有一个IAM页用于跟踪为堆分配的页,但是空间开销很小,并且没有算法可以精确地计算出要使用的IAM页数。
(3)大型对象(LOB)值:
精确确定存储LOB数据类型varchar(max)、varbinary(max)、nvarchar(max)、text、ntext、xml和image值所用的空间量的算法非常复杂。
只需加上所期望的LOB值的平均大小,再乘以Num_Rows,然后再加上聚集索引的总大小就可以了。
(4)压缩:
无法预先计算压缩索引的大小。
1.3估计非聚集索引的大小
1.3.1计算相关值
1.3.1.1表中显示的行数
Num_Rows=表中的行数
1.3.1.2索引键中固定长度和可变长度列的数量
指定索引键中固定长度和可变长度列的数量,并计算存储所需的空间:
索引键列可以包括固定长度和可变长度列。
若要估计内部级别索引行的大小,请计算每组列在索引行中所占据的空间。
列的大小取决于数据类型和长度规定。
有关详细信息,请参阅数据类型(数据库引擎)。
Num_Key_Cols=总键列数(固定长度和可变长度)
Fixed_Key_Size=所有固定长度键列的总字节大小
Num_Variable_Key_Cols=可变长度键列的数量
Max_Var_Key_Size=所有可变长度键列的最大字节大小
1.3.1.3数据行定位符
如果索引不是唯一的,对所需的数据行定位符说明如下:
如果非聚集索引不是唯一的,数据行定位符将与非聚集索引键组合使用,以便为每一行生成唯一的键值。
如果非聚集索引在堆上,则数据行定位符是堆RID。
其大小是8个字节。
Num_Key_Cols=Num_Key_Cols+1
Num_Variable_Key_Cols=Num_Variable_Key_Cols+1
Max_Var_Key_Size=Max_Var_Key_Size+8
如果非聚集索引在聚集索引之上,则数据行定位符是聚集键。
必须与非聚集索引键结合使用的列是聚集键中的以下列:
不在非聚集索引键列集中的列。
Num_Key_Cols=Num_Key_Cols+不在非聚集索引键列集中的聚集键列数(如果聚集索引不唯一,则+1)
Fixed_Key_Size=Fixed_Key_Size+不在非聚集索引键列集中的固定长度聚集键列的总字节大小
Num_Variable_Key_Cols=Num_Variable_Key_Cols+不在非聚集索引键列集中的可变长度聚集键列数(如果聚集索引不唯一,则+1)
Max_Var_Key_Size=Max_Var_Key_Size+不在非聚集索引键列集中的可变长度聚集键列的最大字节大小(如果聚集索引不唯一,则+4)
1.3.1.4空位图
可以保留行的一部分(称为“空位图”),以管理列的为空性。
计算其大小:
如果索引键中有可为Null的列(包括步骤1.3中所述的所有必要的聚集键列),则保留索引行的一部分,以用于Null位图。
Index_Null_Bitmap=2+((索引行中的列数+7)/8)
仅应使用上述表达式中的整数部分,而放弃所有余数。
如果没有可为Null的键列,请将Index_Null_Bitmap设置为0。
1.3.1.5可变长度数据
计算可变长度数据大小:
如果索引键中有可变长度的列(包括所有必要的聚集索引键列),请确定存储索引行中的这些列需使用的空间:
Variable_Key_Size=2+(Num_Variable_Key_Colsx2)+Max_Var_Key_Size
添加到Max_Var_Key_Size中的字节用于跟踪每个可变列。
此公式假定所有可变长度列均百分之百充满。
如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整Max_Var_Key_Size值,从而对整个表大小得出一个更准确的估计。
如果没有可变长度列,请将Variable_Key_Size设置为0。
1.3.1.6索引行大小
计算索引行大小:
Index_Row_Size=Fixed_Key_Size+Variable_Key_Size+Index_Null_Bitmap+1(对应于索引行的行标题开销)+6(对应于子页ID指针)
1.3.1.7每页的索引行数
计算每页的索引行数(每页有8096个可用字节):
Index_Rows_Per_Page=8096/(Index_Row_Size+2)
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。
公式中的2是计算行数时引入的行大小余量。
1.3.2计算用于存储叶级中的索引信息的空间
1.3.2.1固定长度列和可变长度列
如果非聚集索引没有任何包含列:
Num_Leaf_Cols=Num_Key_Cols
Fixed_Leaf_Size=Fixed_Key_Size
Num_Variable_Leaf_Cols=Num_Variable_Key_Cols
Max_Var_Leaf_Size=Max_Var_Key_Size
如果非聚集索引确实具有包含列,则对步骤1中的值加上适当的值。
列的大小取决于数据类型和长度规定。
有关详细信息,请参阅数据类型(数据库引擎)。
Num_Leaf_Cols=Num_Key_Cols+包含列数
Fixed_Leaf_Size=Fixed_Key_Size+固定长度包含列的总字节大小
Num_Variable_Leaf_Cols=Num_Variable_Key_Cols+可变长度包含列数
Max_Var_Leaf_Size=Max_Var_Key_Size+可变长度包含列的最大字节大小
1.3.2.2数据行定位符
如果非聚集索引不是唯一的。
转到下一步。
如果非聚集索引是唯一的,则必须在叶级的所有行中说明数据行定位符。
如果非聚集索引在堆上,则数据行定位符是堆RID(大小为8字节)。
Num_Leaf_Cols=Num_Leaf_Cols+1
Num_Variable_Leaf_Cols=Num_Variable_Leaf_Cols+1
Max_Var_Leaf_Size=Max_Var_Leaf_Size+8
如果非聚集索引在聚集索引之上,则数据行定位符是聚集键。
必须与非聚集索引键结合使用的列是聚集键中的以下列:
不在非聚集索引键列集中的列。
Num_Leaf_Cols=Num_Leaf_Cols+不在非聚集索引键列集中的聚集键列数(如果聚集索引不唯一,则+1)
Fixed_Leaf_Size=Fixed_Leaf_Size+不在非聚集索引键列集中的固定长度聚集键列数
Num_Variable_Leaf_Cols=Num_Variable_Leaf_Cols+不在非聚集索引键列集中的可变长度聚集键列数(如果聚集索引不唯一,则+1)
Max_Var_Leaf_Size=Max_Var_Leaf_Size+不在非聚集索引键列集中的可变长度聚集键列的字节大小(如果聚集索引不唯一,则+4)
1.3.2.3Null位图
计算Null位图大小:
Leaf_Null_Bitmap=2+((Num_Leaf_Cols+7)/8)
仅应使用上述表达式中的整数部分,而放弃所有余数。
1.3.2.4可变长度数据
计算可变长度数据大小:
如果索引键中有可变长度的列,请确定存储索引行中的这些列需使用的空间:
Variable_Leaf_Size=2+(Num_Variable_Leaf_Colsx2)+Max_Var_Leaf_Size
添加到Max_Var_Key_Size中的字节用于跟踪每个可变列。
此公式假定所有可变长度列均百分之百充满。
如果预计可变长度列占用的存储空间比例较低,则可以按照该比例调整Max_Var_Leaf_Size值,从而对整个表大小得出一个更准确的估计。
如果没有可变长度的列,则将Variable_Leaf_Size设置为0。
1.3.2.5索引行大小
计算索引行大小:
Leaf_Row_Size=Fixed_Leaf_Size+Variable_Leaf_Size+Leaf_Null_Bitmap+1(对应于索引行的行标题开销)+6(对应于子页ID指针)
1.3.2.6每页的索引行数
(每页有8096个可用字节):
Leaf_Rows_Per_Page=8096/(Leaf_Row_Size+2)
因为索引行不能跨页,所以每页的索引行数应向下舍入到最接近的整数。
公式中的2是计算行数时引入的行大小余量。
1.3.2.7每页保留的空行数
根据指定的填充因子计算每页保留的空行数:
Free_Rows_Per_Page=8096x((100-Fill_Factor)/100)/(Leaf_Row_Size+2)
计算中使用的填充因子为整数值,而不是百分比。
因为行不跨页,所以每页的行数应向下舍入到最接近的整数。
填充因子增大时,每页将存储更多的数据,因此页数将减少。
公式中的2是计算行数时引入的行大小余量。
1.3.2.8存储所有行所需的页数
计算存储所有行所需的页数:
Num_Leaf_Pages=Num_Rows/(Leaf_Rows_Per_Page-Free_Rows_Per_Page)
估计的页数应向上舍入到最接近的整数。
1.3.2.9索引的大小
(每页总共有8192个字节):
Leaf_Space_Used=8192xNum_Leaf_Pages
1.3.3计算用于存储非叶级中的索引信息的空间
1.3.3.1索引中的非叶级数
计算索引中的非叶级数:
将此值向上舍入到最接近的整数。
此值不包括非聚集索引的叶级别。
1.3.3.2索引中的非叶页数
计算索引中的非叶页数:
将每个被加数向上舍入到最接近的整数。
由于是个简单示例,请考虑使用Num_Leaf_Pages=1000和Index_Rows_Per_Page=25的索引。
页级别以上的第一个索引级别存储1000个索引行,即每个叶页一个索引行,每页可以包括25个索引行。
这意味着存储这1000个索引行需要40页。
下一级索引必须存储40行。
这意味着需要2页。
最后一级索引必须存储2行。
这意味着需要1页。
这就产生了43个非叶索引页。
如果将这些数用到前面的公式中,结果如下:
,这是上面的示例中所述的页数。
1.3.3.3索引大小
计算索引的大小(每页总共有8192个字节):
Index_Space_Used=8192xNum_Index_Pages
1.3.4对计算出的值求和
对从前面两个步骤中得到的值求和:
Nonclusteredindexsize(bytes)=Leaf_Space_Used+Index_Space_used
此计算不考虑以下因素和以上提到的相同。