第8章数据的排序与合并.docx

资源描述

第8章数据的排序与合并.docx

《第8章数据的排序与合并.docx》由会员分享，可在线阅读，更多相关《第8章数据的排序与合并.docx（31页珍藏版）》请在冰点文库上搜索。

第8章数据的排序与合并.docx

第8章数据的排序与合并

本章主要介绍COBOL中数据的排序和合并功能。

其中在数据的排序一节中将首先介绍如何定义排序中间文件以及指定用于排序的输入输出文件。

此后，重点讲解如何使用SORT语句进行排序。

同时，在介绍完使用SORT语句排序后，还将介绍如何编写排序的输入输出过程。

最后，将介绍使用包含有输入输出过程的SORT语句进行排序。

对于数据的合并，本章将首先介绍如何指定用于排序的输入输出文件。

其后，介绍如何编写合并的输出过程。

最后，重点介绍如何使用MERGE语句进行合并。

8.1排序与合并概述

首先需要说明的一点是，本章讲解的排序与合并是COBOL中所自带的功能。

二者在此处并非指通常所说的排序与合并的算法。

同时，这里所说的排序与合并都是针对文件中的数据而言的。

因此，有的书上也将其称做文件的排序与合并。

8.1.1排序的基本概念

所谓数据的排序，就是将文件中的数据按一定的顺序进行重新排列。

COBOL中的文件数据实际上是由记录所组成的。

因此，对数据的排序实际上通常就是对记录的排序。

一条记录中往往含有多个数据项，将记录排序时，必须以一个或多个数据项为基准。

此处的数据项，也就是排序中所要用到的关键字。

例如，下面为一记录员工信息的文件。

文件中每条记录对应一个员工信息。

其中每个员工信息包括该员工的工号，姓名，住址，邮编。

该文件中的数据如下。

1235ZHUBOWUHAN430074

1024WUGUOJUNBEIJING100085

1346ZHANGXIANGSHENZHEN518057

1005XIEFEIWUHAN430023

1253XIEFEIWUHAN430022

此时，如果以员工工号作为关键字，并按照升序进行排序，则排序后的数据如下。

1005XIEFEIWUHAN430023

1024WUGUOJUNBEIJING100085

1235ZHUBOWUHAN430074

1253XIEFEIWUHAN430022

1346ZHANGXIANGSHENZHEN518057

如果按照员工工号的降序排列，则排序后的数据如下。

1346ZHANGXIANGSHENZHEN518057

1253XIEFEIWUHAN430022

1235ZHUBOWUHAN430074

1024WUGUOJUNBEIJING100085

1005XIEFEIWUHAN430023

此外，还可以按照员工的姓名排序。

由于存在重名现象，因此可以将工号作为第二关键字。

则若将员工姓名作为第一关键字按升序排列，将工号作为第二关键字按降序排列，排序结果将如下。

1024WUGUOJUNBEIJING100085

1253XIEFEIWUHAN430022

1005XIEFEIWUHAN430023

1346ZHANGXIANGSHENZHEN518057

1235ZHUBOWUHAN430074

由此可见，排序的结果主要是由两方面因素所决定的。

其中一方面因素是排序的方式。

排序方式分为升序和降序两种。

排序方式的不同将导致完全相反的排序结果。

另一方面因素是排序关键字的选取。

关键字选取的不同通常也将直接导致排序结果的不同。

以上谈到了排序的基本概念。

对于在COBOL中的实际开发，通常情况下，使用排序功能时主要需要用到以下3种文件。

❑排序输入文件。

该文件即排序操作的对象，其中包含用来进行排序的原始无序数据。

❑排序中间文件。

该文件是一个临时工作文件，仅用于排序操作。

该文件的功能是从排序输入文件得到原始数据，并将排序后的结果数据输出到排序输出文件中。

该文件在此处相当于一个临时缓冲区。

❑排序输出文件。

该文件保存排序后的结果，其中包含排序完成后的有序数据。

关于以上3种文件的使用方式以及排序功能的具体实现，将在后面的小节中进行详细讲解。

此处只需要了解COBOL中排序的基本概念。

8.1.2合并的基本概念

合并通常是指将两个及其以上的文件中的数据合并到一个新的文件中。

并且，用于合并的文件通常应该是已经排序过的文件。

合并后的文件中的数据也是有序数据。

实际上，合并也是基于相关数据的顺序而进行的操作。

例如，下面为其中一个用于合并的记录大型机从业人员信息的文件。

令文件中每条记录包括人员编号，姓名，公司，入职时间这几个数据项。

假设该文件中的具体数据如下。

001000WANGWEIIBMCDL2003/06/01

001003YUZHUEDS2007/07/05

001008ZHENGJICSTS2005/09/08

001010LIQIANGIBMCSDL2007/06/08

001025JIANGTAOIBMISSC2006/11/20

另一个用于合并的文件中的数据如下。

001004WANGWEIIBMTSS2002/06/20

001007YUZHUFDI2004/07/12

001012ZHENGJIISTC2007/09/15

将以上两文件按关键字为人员编号进行升序合并后，将生成一新的合并后的文件。

该合并后的文件中的数据将如下。

001000WANGWEIIBMCDL2003/06/01

001003YUZHUEDS2007/07/05

001004WANGWEIIBMTSS2002/06/20

001007YUZHUFDI2004/07/12

001008ZHENGJICSTS2005/09/08

001010LIQIANGIBMCSDL2007/06/08

001012ZHENGJIISTC2007/09/15

001025JIANGTAOIBMISSC2006/11/20

同样，类似于排序，合并在实际应用中也是需要３种文件的。

这3种文件分别为合并输入文件，合并中间文件，以及合并输出文件。

以上3种文件的概念和排序中3种文件的概念基本类似，只是此处是用于合并功能的。

最后需要补充的一点是，无论是排序还是合并，其结果并不是一定要保存在一个文件中的。

排序或合并的结果既可保存在多个文件中，也可不保存在任何文件中，而直接提供给程序进行处理。

8.2数据的排序

前面已经讲到，数据的排序实际上是对文件中的数据进行排序。

并且，用于排序的文件有3种，分别为排序中间文件，排序输入文件，以及排序输出文件。

本节将首先讲解如何实际应用以上3种文件。

其后，重点讲解在程序中是如何实际进行排序的。

在讲解完如何进行排序后，还将介绍通常是如何编写排序输入输出过程的。

最后，将讲解包含有输入输出过程的数据排序操作。

8.2.1使用SD语句定义排序中间文件

排序中间文件是一个临时工作文件，因此和普通的文件是不同的。

普通文件是通过在数据部的文件节中通过FD语句定义的。

而排序中间文件则是通过SD语句进行定义的。

其定义位置则仍然是在数据部的文件节中。

此处，不妨令在前面排序的基本概念一节中的员工信息文件为排序输入文件。

该文件内容为。

1235ZHUBOWUHAN430074

1024WUGUOJUNBEIJING100085

1346ZHANGXIANGSHENZHEN518057

1005XIEFEIWUHAN430023

1253XIEFEIWUHAN430022

假设对应以上内容需要定义的排序中间文件的文件名为“TEST-SORT-FILE”。

同任何文件一样，在使用SD语句定义该文件之前，首先需要在环境部进行指定。

指定方式如下。

……

ENVIRONMENTDIVISION.

INPUT-OUTPUTSECTION.

FILE-CONTROL.

SELECTTEST-SORT-FILE

ASSIGNTOS-SORT.

……

以上代码中的“S-SORT”为系统中所指定的一个文件名。

而“TEST-SORT-FILE”则是本COBOL程序编写中所用到的文件名。

两文件名对应同一个文件。

此外，为体现程序结构的完整性，该段代码中分别使用两个省略号表示程序中的其他部分。

其中前一个省略号表示标志部中的内容，后一个省略号表示环境部其他内容，及后面数据部中的内容。

在环境部指定该文件后，便可使用SD语句在数据部的文件节中进行相应定义了。

使用SD语句定义该文件的方式如下。

……

DATADIVISION.

FILESECTION.

SDTEST-SORT-FILE.

RECORDCONTAINS80CHARACTERS

DATARECORDISSORT-RECORD.

01SORT-RECORD.

05EMP-CODEPIC9（4）.

05FILLERPICX（4）

VALUESPACES.

05EMP-NAMEPICX（17）.

05FILLERPICXXX

VALUESPACES.

05EMP-ADDRPICX（12）.

05FILLERPICX（4）

VALUESPACES.

05ADDR-CODEPIC9（6）.

05FILLERPICX（30）

VALUESPACES.

……

同样，为体现程序结构的完整性，该段代码中也使用省略号表示其上下文内容。

其中前一个省略号表示环境部中的内容，后一个省略号表示数据部其他内容及过程部中的内容。

以上便完成了排序中间文件的定义。

关于所定义的排序中间文件，还有以下两点需要注意。

❑排序中间文件在SD语句定义之后必须包含有一条记录。

例如，上面例子中的记录就为“SORT-RECORD”。

❑排序中间文件仅用于排序操作。

也就是说，对于该文件而言，不能如通常文件一样对其进行输入输出操作。

8.2.2使用USING短语指定排序输入文件

排序输入文件实际上就是通常的文件，只是此处用于对该文件的数据进行排序而已。

也就是说，排序输入文件为排序功能提供了原始数据。

仍然使用前面员工信息文件的例子，则该文件作为排序输入文件，在程序数据部中的定义应该如下。

……

DATADIVISION.

FILESECTION.

FDTEST-INPUT-FILE.

01INPUT-RECORD.

05EMP-CODEPIC9（4）.

05FILLERPICX（4）

VALUESPACES.

05EMP-NAMEPICX（17）.

05FILLERPICXXX

VALUESPACES.

05EMP-ADDRPICX（12）.

05FILLERPICX（4）

VALUESPACES.

05ADDR-CODEPIC9（6）.

05FILLERPICX（30）

VALUESPACES.

……

对于以上定义的排序输入文件，此处重点需要说明其在排序操作中是如何应用的。

实际上，该文件是通过在用于排序功能的SORT语句里的USING短语所指定的。

指定位置在程序过程部的具体编码之中。