分析数据仓库及其在SQL中的构建分析
2、索引策略 维度表的索引:维度表索引相对简单.即使这个策略偏离了市场,效率低的索引也不会产生极大的影响。因为维度表通常比较小和相对稳定。最好是创建一个集群化的、在每一个维度表的代理键的主键。代理键通常是一个IDEN,11TY列,这常常便利了插入操作。在一个业务键上的一个非集群的索引应该从查询目的考虑,或者如果代理键查找是通过Transact—SQL语句执行的。当使用SSIS来执行查找时,表或者表的子集合将会载入到SSIS服务器的存储器中.并且在一个业务键上的索引通常是没有用的。实际表的索引:因为索引的存在并不意味着SQLServer一定要使用它。SQL Server很少使用的索引的创建常常被作为一个入口或者对进程的管理.而不涉及到磁盘资源。索引创建的一个考虑因素是尽可能紧凑的保持它们。紧凑的索引需要更少的页。从这方面说它提高了性能,特别当具有巨大的实际表时更加如此。
3、索引的分片 在数据仓库环境中,索引的性能问题能够被忽略。我们已经找到了执行索引维护的客户.因为观察到这儿并没有寻艮么多的批量窗口来支持它。一个索引片段对性能将产生巨大的负面影响。最好通过创建有用的索引来最小化索引的维护工作.并且重新组织那些被分片的索引。
4、快速载入和查询性能的分离 在数据仓库中表的分离是一个通用的实践.主要是用来方便对大量的实际表进行管理。我们假设水平的分离是基于日期的.这对于时间的实际进展是大致平行的.因此对于数据仓库也是一个不错的选择。虽然维度表能够被分离,但是考虑的时候它们通常过小,所以并不适合分离。分离的优点:降低数据库维护操作:提高载入的有效性:查询优化器能够消除实际表的很大的一部分分离;使得数据归档更加方便。
五、结束语
数据仓库建立成功后,下一步就是在OLAP服务器上建立元数据数据库。这个数据库和我们以前所说的数据库不同。它是存放元数据的数据库,比如我们下一步要创建的多维数据集、角色、数据源、共享维度和挖掘模型等。建设数据仓库项目必然涉及到数据仓库建模的问题.合理而完备的数据模型是用户业务需求的体现,是数据仓库成败的技术因素。在设计数据仓库模型时,不仅要考虑数据存储效率,同时也要考虑数据仓库系统查询性能和OLAP分析性能,并根据具体项目情况灵活调整。 (编辑:焦作站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |