大型数据库设计要注意哪些问题？_如何理解设计大型数据库原则？

2021-12-01 06:24:07

阅读 11680次标签：数据库设计作者： chenliwen666

　　一个好的数据库产品不等于就有一个好的应用体系，假如不能设计一个合理的数据库模型，不只会增加客户端和服务器段程序的编程和保护的难度，并且将会影响体系实践运转的功用。通常来讲，在一个MIS体系分析、设计、测验和试运转期间，由于数据量较小，设计人员和测验人员往往只注意到功用的完成，而很难注意到功用的薄弱的地方，比及体系投入实践运转一段时间后，才发现体系的功用在下降，这时再来思考进步体系功用则要花费更多的人力物力，而全部体系也不可避免的形成了一个打补丁工程。笔者根据多年来数据库设计和运用数据库的经历，提出以下一些设计原则，供同仁们参阅。

　　1、命名的规范
　　不同的数据库产品对对象的命名有不同的要求，因此，数据库中的各种对象的命名、后台程序的代码编写应采用大小写敏感的形式，各种对象命名长度不要超过30个字符，这样便于应用系统适应不同的数据库。
　　2、游标（Cursor）的慎用
　　游标提供了对特定集合中逐行扫描的手段，一般使用游标逐行遍历数据，根据取出的数据不同条件进行不同的操作。尤其对多表和大表定义的游标（大的数据集合）循环很容易使程序进入一个漫长的等特甚至死机，笔者在某市《住房公积金管理系统》进行日终帐户滚积数计息处理时，对一个10万个帐户的游标处理导致程序进入了一个无限期的等特（后经测算需48个小时才能完成）(硬件环境：Alpha/4000 128Mram ,Sco Unix ,Sybase 11.0)，后根据不同的条件改成用不同的UPDATE语句得以在二十分钟之内完成。示例如下：
　　Declare Mycursor cursor for select count_no from COUNT
　　Open Mycursor
　　Fetch Mycursor into @vcount_no
　　While (@@sqlstatus=0)
　　Begin
　　If @vcount_no=’’ 条件1
　　操作1
　　If @vcount_no=’’ 条件2
　　操作2
　　。。。
　　Fetch Mycursor into @vcount_no
　　End
　　。。。
　　。。。
　　改为
　　Update COUNT set 操作1 for 条件1
　　Update COUNT set 操作2 for 条件2
　　。。。
　　。。。
　　在有些场合，有时也非得使用游标，此时也可考虑将符合条件的数据行转入临时表中，再对临时表定义游标进行操作，可时性能得到明显提高。笔者在某地市〈电信收费系统〉数据库后台程序设计中，对一个表（3万行中符合条件的30多行数据）进行游标操作(硬件环境：PC服务器，PII266 64Mram ,NT4.0 Ms Sqlserver 6.5)。示例如下：
　　Create #tmp /* 定义临时表 */
　　(字段1
　　字段2
　　。。。
　　)
　　Insert into #tmp select * from TOTAL where
　　条件 /* TOTAL中3万行符合条件只有几十行 */
　　Declare Mycursor cursor for select * from #tmp
　　/*对临时表定义游标*/
　　。。。
　　3、索引(Index)的使用原则
　　创建索引一般有以下两个目的：维护被索引列的唯一性和提供快速访问表中数据的策略。大型数据库有两种索引即簇索引和非簇索引，一个没有簇索引的表是按堆结构存储数据，所有的数据均添加在表的尾部，而建立了簇索引的表，其数据在物理上会按照簇索引键的顺序存储，一个表只允许有一个簇索引，因此，根据B树结构，可以理解添加任何一种索引均能提高按索引列查询的速度，但会降低插入、更新、删除操作的性能，尤其是当填充因子（Fill Factor）较大时。所以对索引较多的表进行频繁的插入、更新、删除操作，建表和索引时因设置较小的填充因子，以便在各数据页中留下较多的自由空间，减少页分割及重新组织的工作。
　　4、数据的一致性和完整性
　　为了保证数据库的一致性和完整性，设计人员往往会设计过多的表间关联（Relation），尽可能的降低数据的冗余。表间关联是一种强制性措施，建立后，对父表（Parent Table）和子表(Child Table)的插入、更新、删除操作均要占用系统的开销，另外，最好不要用Identify 属性字段作为主键与子表关联。如果数据冗余低，数据的完整性容易得到保证，但增加了表间连接查询的操作，为了提高系统的响应时间，合理的数据冗余也是必要的。使用规则（Rule）和约束（Check）来防止系统操作人员误输入造成数据的错误是设计人员的另一种常用手段，但是，不必要的规则和约束也会占用系统的不必要开销，需要注意的是，约束对数据的有效性验证要比规则快。所有这些，设计人员在设计阶段应根据系统操作的类型、频度加以均衡考虑。
　　5、事务的陷阱
　　事务是在一次性完成的一组操作。虽然这些操作是单个的操作，SQL Server能够保证这组操作要么全部都完成，要么一点都不做。正是大型数据库的这一特性，使得数据的完整性得到了极大的保证。
　　---- 众所周知，SQL Server为每个独立的SQL语句都提供了隐含的事务控制，使得每个DML的数据操作得以完整提交或回滚，但是SQL Server还提供了显式事务控制语句
　　BEGIN TRANSACTION 开始一个事务
　　COMMIT TRANSACTION 提交一个事务
　　ROLLBACK TRANSACTION 回滚一个事务
　　事务可以嵌套，可以通过全局变量@@trancount检索到连接的事务处理嵌套层次。需要加以特别注意并且极容易使编程人员犯错误的是，每个显示或隐含的事物开始都使得该变量加1，每个事务的提交使该变量减1，每个事务的回滚都会使得该变量置0，而只有当该变量为0时的事务提交（最后一个提交语句时），这时才把物理数据写入磁盘。
　　6、数据库性能调整
　　在计算机硬件配置和网络设计确定的情况下，影响到应用系统性能的因素不外乎为数据库性能和客户端程序设计。而大多数数据库设计员采用两步法进行数据库程序设计：首先进行逻辑设计，而后进行物理设计。数据库逻辑设计去除了所有冗余数据，提高了数据吞吐速度，保证了数据的完整性，清楚地表达数据元素之间的关系。而对于多表之间的关联查询（尤其是大数据表）时，其性能将会降低，同时也提高了客户端程序的编程难度，因此，物理设计需折衷考虑，根据业务规则，确定对关联表的数据量大小、数据项的访问频度，对此类数据表频繁的关联查询应适当提高数据冗余设计。
　　7、数据类型的选择
　　数据类型的合理选择对于数据库的性能和操作具有很大的影响，有关这方面的书籍也有不少的阐述，这里主要介绍几点经验。
　　Identify字段不要作为表的主键与其它表关联，这将会影响到该表的数据迁移。
　　Text 和Image字段属指针型数据，主要用来存放二进制大型对象（BLOB）。这类数据的操作相比其它数据类型较慢，因此要避开使用。
　　日期型字段的优点是有众多的日期函数支持，因此，在日期的大小比较、加减操作上非常简单。但是，在按照日期作为条件的查询操作也要用函数，相比其它数据类型速度上就慢许多,因为用函数作为查询的条件时，服务器无法用先进的性能策略来优化查询而只能进行表扫描遍历每行。
　　例如：要从DATA_TAB1中（其中有一个名为DATE的日期字段）查询1998年的所有记录。
Select * from DATA_TAB1 where datepart(yy,DATE)=1998
设计技巧
１．分类拆分数据量大的表。对于经常使用的表（如某些参数表或代码对照表），由于其使用频率很高，要尽量减少表中的记录数量。例如，银行的户主账表原来设计成一张表，虽然可以方便程序的设计与维护，但经过分析发现，由于数据量太大，会影响数据的迅速定位。如果将户主账表分别设计为活期户主账、定期户主账及对公户主账等，则可以大大提高查询效率。
２．索引设计。对于大的数据库表，合理的索引能够提高整个数据库的操作效率。在索引设计中，索引字段应挑选重复值较少的字段；在对建有复合索引的字段进行检索时，应注意按照复合索引字段建立的顺序进行。例如，如果对一个５万多条记录的流水表以日期和流水号为序建立复合索引，由于在该表中日期的重复值接近整个表的记录数，用流水号进行查询所用的时间接近３秒；而如果以流水号为索引字段建立索引进行相同的查询，所用时间不到１秒。因此在大型数据库设计中，只有进行合理的索引字段选择，才能有效提高整个数据库的操作效率。
３．数据操作的优化。在大型数据库中，如何提高数据操作效率值得关注。例如，每在数据库流水表中增加一笔业务，就必须从流水控制表中取出流水号，并将其流水号的数值加一。正常情况下，单笔操作的反应速度尚属正常，但当用它进行批量业务处理时，速度会明显减慢。经过分析发现，每次对流水控制表中的流水号数值加一时都要锁定该表，而该表却是整个系统操作的核心，有可能在操作时被其他进程锁定，因而使整个事务操作速度变慢。对这一问题的解决的办法是，根据批量业务的总笔数批量申请流水号，并对流水控制表进行一次更新，即可提高批量业务处理的速度。另一个例子是对插表的优化。对于大批量的业务处理，如果在插入数据库表时用普通的Ｉｎｓｅｒｔ语句，速度会很慢。其原因在于，每次插表都要进行一次Ｉ/Ｏ操作，花费较长的时间。改进后，可以用Ｐｕｔ语句等缓冲区形式等满页后再进行Ｉ/Ｏ操作，从而提高效率。对大的数据库表进行删除时，一般会直接用Ｄｅｌｅｔｅ语句，这个语句虽然可以进行小表操作，但对大表却会因带来大事务而导致删除速度很慢甚至失败。解决的方法是去掉事务，但更有效的办法是先进行Ｄｒｏｐ操作再进行重建。
４．数据库参数的调整。数据库参数的调整是一个经验不断积累的过程，应由有经验的系统管理员完成。以Ｉｎｆｏｒｍｉｘ数据库为例，记录锁的数目太少会造成锁表的失败；逻辑日志的文件数目太少会造成插入大表失败等，这些问题都应根据实际情况进行必要的调整。
５．必要的工具。在整个数据库的开发与设计过程中，可以先开发一些小的应用工具，如自动生成库表的头文件、插入数据的初始化、数据插入的函数封装、错误跟踪或自动显示等，以此提高数据库的设计与开发效率。
６．避免长事务。对单个大表的删除或插入操作会带来大事务，解决的办法是对参数进行调整，也可以在插入时对文件进行分割。对于一个由一系列小事务顺序操作共同构成的长事务（如银行交易系统的日终交易），可以由一系列操作完成整个事务，但其缺点是有可能因整个事务太大而使不能完成，或者，由于偶然的意外而使事务重做所需的时间太长。较好的解决方法是，把整个事务分解成几个较小的事务，再由应用程序控制整个系统的流程。这样，如果其中某个事务不成功，则只需重做该事务，因而既可节约时间，又可避免长事务。
７．适当超前。计算机技术开展日新月异，数据库设计实例分析有必要具有必定前瞻性，不但要满足当时的使用需求，还要思考将来的事务开展，一起有必要有利于拓展或添加使用体系的处理功用。
相对于中小型数据库，大型数据库的设计与开发要杂乱得多，因此在设计、开发过程中，除了要遵循数据库范式理论、添加体系的一致性和完整性外，还要在总体上根据具体情况进行分布式设计，紧紧掌握集中操控、统一审阅的基本原则，确保数据库设计构造紧凑、分布平衡、定位敏捷。在数据库操作上，要选用必定的窍门进步全部使用体系的履行功率，并留意适当超前，以习惯不断改变的使用及体系开展的需求。
耗费在准备利用Oracle履行计划机制进步查询功能新的SQL句子的时间是Oracle SQL句子履行时间的最重要的组成部分。可是经过了解Oracle内部产生履行计划的机制，你可以操控Oracle花费在评价衔接次序的时间数量，而且能在大体上进步查询功能。
一品威客网汇聚了数百万专业的综合性网站、资讯型网站、团购网站、电子商务网站、宣传展示型网站、手机WAP网站、程序功能开发、数据库设计、接口开发、服务器系统等优秀威客人才，只要您在网站发布任务需求，就能够吸引众多威客给您献上最好的创意服务。

推荐更多与“大型数据库设计要注意哪些问题？_如何理解设计大型数据库原则？”相关推荐：

java 网站开发 | 外贸网站建设 | vs2010网站开发 | 手机wap网站开发 | 企业制作wap网站

网站开发流程 | 团购网站开发 | 数据库设计方法 | 数据库设计规范化| wap网站开发教程

手机网站制作 | 网站开发框架 | 微信 3g网站开发 | 数据库设计注意点| 数据库设计原则