sqlserver的大批量数据的处理以及数据库的优化文档格式.docx

资源描述

sqlserver的大批量数据的处理以及数据库的优化文档格式.docx

《sqlserver的大批量数据的处理以及数据库的优化文档格式.docx》由会员分享，可在线阅读，更多相关《sqlserver的大批量数据的处理以及数据库的优化文档格式.docx（22页珍藏版）》请在冰豆网上搜索。

sqlserver的大批量数据的处理以及数据库的优化文档格式.docx

　　可以通过如下方法来优化查询:

　　1、把数据、日志、索引放到不同的I/O设备上，增加读取速度，以前可以将Tempdb应放在RAID0上，SQL2000不在支持。

数据量（尺寸）越大，提高I/O越重要.

　　2、纵向、横向分割表，减少表的尺寸（sp_spaceuse）

　　3、升级硬件

　　4、根据查询条件,建立索引,优化索引、优化访问方式，限制结果集的数据量。

注意填充因子要适当（最好是使用默认值0）。

索引应该尽量小，使用字节数小的列建索引好（参照索引的创建）,不要对有限的几个值的字段建单一索引如性别字段

　　5、提高网速;

　　6、扩大服务器的内存,Windows2000和SQLserver2000能支持4-8G的内存。

配置虚拟内存：

虚拟内存大小应基于计算机上并发运行的服务进行配置。

运行MicrosoftSQLServer?

2000时，可考虑将虚拟内存大小设置为计算机中安装的物理内存的1.5倍。

如果另外安装了全文检索功能，并打算运行Microsoft搜索服务以便执行全文索引和查询，可考虑：

将虚拟内存大小配置为至少是计算机中安装的物理内存的3倍。

将SQLServermaxservermemory服务器配置选项配置为物理内存的1.5倍（虚拟内存大小设置的一半）。

　　7、增加服务器CPU个数;

但是必须明白并行处理串行处理更需要资源例如内存。

使用并行还是串行程是MsSQL自动评估选择的。

单个任务分解成多个任务，就可以在处理器上运行。

例如耽搁查询的排序、连接、扫描和GROUPBY字句同时执行，SQLSERVER根据系统的负载情况决定最优的并行等级，复杂的需要消耗大量的CPU的查询最适合并行处理。

但是更新操作Update,Insert，Delete还不能并行处理。

　　8、如果是使用like进行查询的话，简单的使用index是不行的，但是全文索引，耗空间。

like'

a%'

使用索引like'

%a'

不使用索引用like'

%a%'

查询时，查询耗时和字段值总长度成正比,所以不能用CHAR类型，而是VARCHAR。

对于字段的值很长的建全文索引。

　　9、DBServer和APPLicationServer分离；

OLTP和OLAP分离

　　10、分布式分区视图可用于实现数据库服务器联合体。

联合体是一组分开管理的服务器，但它们相互协作分担系统的处理负荷。

这种通过分区数据形成数据库服务器联合体的机制能够扩大一组服务器，以支持大型的多层Web站点的处理需要。

有关更多信息，参见设计联合数据库服务器。

（参照SQL帮助文件'

分区视图'

）

　　a、在实现分区视图之前，必须先水平分区表

　　b、在创建成员表后，在每个成员服务器上定义一个分布式分区视图，并且每个视图具有相同的名称。

这样，引用分布式分区视图名的查询可以在任何一个成员服务器上运行。

系统操作如同每个成员服务器上都有一个原始表的复本一样，但其实每个服务器上只有一个成员表和一个分布式分区视图。

数据的位置对应用程序是透明的。

　　11、重建索引DBCCREINDEX,DBCCINDEXDEFRAG,收缩数据和日志DBCCSHRINKDB,DBCCSHRINKFILE.设置自动收缩日志.对于大的数据库不要设置数据库自动增长，它会降低服务器的性能。

在T-sql的写法上有很大的讲究，下面列出常见的要点：

首先，DBMS处理查询计划的过程是这样的：

　　1、查询语句的词法、语法检查

　　2、将语句提交给DBMS的查询优化器

　　3、优化器做代数优化和存取路径的优化

　　4、由预编译模块生成查询规划

　　5、然后在合适的时间提交给系统处理执行

　　6、最后将执行结果返回给用户其次，看一下SQLSERVER的数据存放的结构：

一个页面的大小为8K（8060）字节，8个页面为一个盘区，按照B树存放。

　　12、Commit和rollback的区别Rollback:

回滚所有的事物。

Commit:

提交当前的事物.没有必要在动态SQL里写事物，如果要写请写在外面如：

begintranexec（@s）committrans或者将动态SQL写成函数或者存储过程。

　　13、在查询Select语句中用Where字句限制返回的行数,避免表扫描,如果返回不必要的数据，浪费了服务器的I/O资源，加重了网络的负担降低性能。

如果表很大，在表扫描的期间将表锁住，禁止其他的联接访问表,后果严重。

　　14、SQL的注释申明对执行没有任何影响

　　15、尽可能不使用光标，它占用大量的资源。

如果需要row-by-row地执行，尽量采用非光标技术,如：

在客户端循环，用临时表，Table变量，用子查询，用Case语句等等。

游标可以按照它所支持的提取选项进行分类：

只进必须按照从第一行到最后一行的顺序提取行。

FETCHNEXT是唯一允许的提取操作,也是默认方式。

可滚动性可以在游标中任何地方随机提取任意行。

游标的技术在SQL2000下变得功能很强大，他的目的是支持循环。

有四个并发选项READ_ONLY：

不允许通过游标定位更新（Update），且在组成结果集的行中没有锁。

OPTIMISTICWITHvalueS:

乐观并发控制是事务控制理论的一个标准部分。

乐观并发控制用于这样的情形，即在打开游标及更新行的间隔中，只有很小的机会让第二个用户更新某一行。

当某个游标以此选项打开时，没有锁控制其中的行，这将有助于最大化其处理能力。

如果用户试图修改某一行，则此行的当前值会与最后一次提取此行时获取的值进行比较。

如果任何值发生改变，则服务器就会知道其他人已更新了此行，并会返回一个错误。

如果值是一样的，服务器就执行修改。

选择这个并发选项OPTIMISTICWITHROWVERSIONING:

此乐观并发控制选项基于行版本控制。

使用行版本控制，其中的表必须具有某种版本标识符，服务器可用它来确定该行在读入游标后是否有所更改。

在SQLServer中，这个性能由timestamp数据类型提供，它是一个二进制数字，表示数据库中更改的相对顺序。

每个数据库都有一个全局当前时间戳值：

@@DBTS。

每次以任何方式更改带有timestamp列的行时，SQLServer先在时间戳列中存储当前的@@DBTS值，然后增加@@DBTS的值。

如果某个表具有timestamp列，则时间戳会被记到行级。

服务器就可以比较某行的当前时间戳值和上次提取时所存储的时间戳值，从而确定该行是否已更新。

服务器不必比较所有列的值，只需比较timestamp列即可。

如果应用程序对没有timestamp列的表要求基于行版本控制的乐观并发，则游标默认为基于数值的乐观并发控制。

SCROLLLOCKS这个选项实现悲观并发控制。

在悲观并发控制中，在把数据库的行读入游标结果集时，应用程序将试图锁定数据库行。

在使用服务器游标时，将行读入游标时会在其上放置一个更新锁。

如果在事务内打开游标，则该事务更新锁将一直保持到事务被提交或回滚；

当提取下一行时，将除去游标锁。

如果在事务外打开游标，则提取下一行时，锁就被丢弃。

因此，每当用户需要完全的悲观并发控制时，游标都应在事务内打开。

更新锁将阻止任何其它任务获取更新锁或排它锁，从而阻止其它任务更新该行。

然而，更新锁并不阻止共享锁，所以它不会阻止其它任务读取行，除非第二个任务也在要求带更新锁的读取。

滚动锁根据在游标定义的Select语句中指定的锁提示，这些游标并发选项可以生成滚动锁。

滚动锁在提取时在每行上获取，并保持到下次提取或者游标关闭，以先发生者为准。

下次提取时，服务器为新提取中的行获取滚动锁，并释放上次提取中行的滚动锁。

滚动锁独立于事务锁，并可以保持到一个提交或回滚操作之后。

如果提交时关闭游标的选项为关，则COMMIT语句并不关闭任何打开的游标，而且滚动锁被保留到提交之后，以维护对所提取数据的隔离。

所获取滚动锁的类型取决于游标并发选项和游标Select语句中的锁提示。

锁提示只读乐观数值乐观行版本控制锁定无提示未锁定未锁定未锁定更新NOLOCK未锁定未锁定未锁定未锁定HOLDLOCK共享共享共享更新UPDLOCK错误更新更新更新TABLOCKX错误未锁定未锁定更新其它未锁定未锁定未锁定更新*指定NOLOCK提示将使指定了该提示的表在游标内是只读的。

　　16、用Profiler来跟踪查询，得到查询所需的时间，找出SQL的问题所在;

用索引优化器优化索引

　　17、注意UNion和UNionall的区别。

UNIONall好

　　18、注意使用DISTINCT，在没有必要时不要用，它同UNION一样会使查询变慢。

重复的记录在查询里是没有问题的

　　19、查询时不要返回不需要的行、列

　　20、用sp_configure'

querygovernorcostlimit'

或者SETQUERY_GOVERNOR_COST_LIMIT来限制查询消耗的资源。

当评估查询消耗的资源超出限制时，服务器自动取消查询,在查询之前就扼杀掉。

SETLOCKTIME设置锁的时间

　　21、用selecttop100/10Percent来限制用户返回的行数或者SETROWCOUNT来限制操作的行

　　22、在SQL2000以前，一般不要用如下的字句:

ISNULL"

NOT"

NOTEXISTS"

NOTIN"

NOTLIKE"

and"

LIKE'

%500'

，因为他们不走索引全是表扫描。

也不要在Where字句中的列名加函数，如Convert，substring等,如果必须用函数的时候，创建计算列再创建索引来替代.还可以变通写法：

WhereSUBSTRING（firstname,1,1）='

改为Wherefirstnamelike'

m%'

（索引扫描），一定要将函数和列名分开。

并且索引不能建得太多和太大。

NOTIN会多次扫描表，使用EXISTS、NOTEXISTS，IN,LEFTOUTERJOIN来替代，特别是左连接,而Exists比IN更快，最慢的是NOT操作.如果列的值含有空，以前它的索引不起作用，现在2000的优化器能够处理了。

相同的是ISNULL，"

能优化她，而"

等还是不能优化，用不到索引。

　　23、使用QueryAnalyzer，查看SQL语句的查询

展开阅读全文