数据架构——作业分析1

分析可以贯穿整个计算环境使用,企业计算中最重要的环境之一就是作业环境。作业环境是进行详细、即时决策的场所之一。作业环境主要由办公人员使用,作业环境有而是处理企业业务的场所。大多数企业都有两种基本的环境:既有作业化境也有管理决策环境。有一些标准能促使作业环境取得成功,其中一些标准涵盖了以下功能:

  • 创建、更新和删除单个事务
  • 访问数据
  • 具备事务处理的完整性
  • 处理大量的数据
  • 系统性的处理数据
  • 快速执行

由于这些因素,在作业系统中快速访问和处理数据的能力是最为重要的。事务处理响应事件是作业环境中最重要的要素。

数据架构——作业分析1

计算机中存在两种建立排队时间的基本方式:既可以让单个程序执行很长一段事件,也可以采用当食物处理达到队列的事件超过平均执行事件后就执行的方式,在任何情况下,排队时间都会降低处理速度。观察性表现得方式还可以按照事务处理所进行得I/O操作次数。为了提高性能,分析师可以将所有得数据整合成带个数据库,这种设计称为非规范化设计。

数据架构——作业分析1

当数据进行了非规范化之后,事务处理所需执行的I/O操作数据就减少了。有一类事务处理需要经常查看大量的数据,而不论这些数据是如何组织的,用于查看每日工作或者月度工作的报表程序就是这样一个典型的应用程序。当有一个需要访问大量数据的事务处理和那些只需要访问少量数据的事务处理混合执行时,对每个事务处理的性能都会造成破坏。解决程序长期运行和需要保持一致的响应时间之间的矛盾的一种解决方案就是为计算机的运行划分时段。当业务需要提供良好的响应时间,可将所有可快速运行的事务处理都放在白天运行,需要长期运行的程序则放在凌晨执行。另一种替代方案是在事务处理使用的数据库和机器不同的DBMS和机器上执行长期运行程序。无论何时,只要长期运行的程序不需要访问那些正在处理的实际数据,这种方式就没有问题。

当作业环境正常运行时,一切都是以现代、高效的方式运转的。作业处理过程中生成的数据具有巨大的价值。作业分析包括在作业环境中执行事务处理时产生的决策。处于作业分析核心位置的那些数据都是由作业系统产生的。作业系统就是那些运行事务处理和用于管理数据库管理系统中数据的系统。作业系统的任务有:快速执行、在细节层面操作数据、以及与各种应用程序绑定在一起。因为需要快速执行事务处理,所以其数据通常是非规范化的,这种情况可能导致数据库的数据单元也可能在另一个数据库中同样存在。在高性能环境中,将数据分开存储到不同的数据是数据非规范化所产生的必然结果。在高性能事务处理环境中,数据的非规范化是一种正常的、自然的现象。在作业应用程序中只有最少量的历史数据。历史数据的用途包括:

  • 标定和评估趋势
  • 理解客户的长期习惯
  • 研究发展模式

由于数据完整性的确实,而且需要一个存储历史数据的场所,需要有一种与作业应用程序不同的架构化结构——数据仓库。数据仓库是面向主题的、集成的、时变的、非易失的、支持管理决策的数据集,是事实的唯一版本。作为数据仓库基础最好的数据模型是关系模型。关系模型是一种规范化的数据,对于在最小粒度层面上描述数据而言很有用。将数据从作业应用程序装载到数据仓库中,作业应用程序中的数据仍然以非规范化状态保留在应用程序中。数据通过ETL过程装载到数据仓库中。数据完整性和建立企业数据的一个基本理念就是“记录系统”,记录系统是企业的权威数据,在作业环境中,记录系统就是向数据参考古输送价值的数据。数据仓库最重要的功能之一就是能够作为不同组织的基础,使之能够以不同的视角查看同样的数据,同时仍然保持同样的数据基础。数据仓库能够作为数据基础的原因是数据仓库中的数据是粒度化和集成的,这样按照不同的最终用户需求重塑数据。数据仓库服务于不同群体的方式是通过创建数据集市实现的。数据仓库及其粒度化的数据为数据集市中的数据提供了基础,数据仓库中的粒度化数据通过汇总和合计数据的方式形成了每个数据集市所需要的数据。数据集市最好基于维度模型建立,在维度模型中有事实表和维度表,事实表和维度表相互连接,形成星型链接的结构。当数据仓库中以集成的、历史的形式存放时,就要进行数据的集成。当数据基础建立之后就可以将数据输送到不同的数据集市中。

ODS既有一些数据仓库的特征,也有一些作业环境的特征,ODS可以事实更新而且ODS可以支持高性能事务处理,但是ODS还含有集成数据。ODS是面向企业的一种可选的数据结构,通常组织有大量的事务处理工作则需要一个ODS。数据集市中的数据类型通常包括所谓的KPI。除了KPI之外,数据集市通常还采用了立方体的结构。立方体是对数据的一种编排模式,支持从不同的视角来研究数据。数据集市的特征之一就是他们相对简单并且能够快速创建。由于创建容易,大多数组织都直接创建新的数据集市,而不会对已有的数据集市进行维护。因为数据集市含有KPI,所以就会存在很大的变更倾向。只要业务在变更,KPI就会变化,数据集市也会随之变化。