firstobs=常数 

obs=常数选项

set sashelp.class(firstobs=3 obs=5);

读取class的第三到第五条观测并输出

 

注:我们发现获取一个数据集的子数据集的定位最快的方式应该是

set sashelp.class(firstobs=3 obs=6 keep=name age sex);

这样不会引起冗余读入。

 

以下是非数据集选项,即不带括号的options

 

nobs=变量,将数据集观测数传给临时变量(非输出变量)

data n_obs;

if 0 then set sashelp.class nobs=total_obs;

total=total_obs;

output;

stop;

run;

因为头文件信息在编译后就产生,这样一来if语句虽然不进行任何读入,但是nobs在编译时已经把观测数传给了total_obs.上述语句几乎是获得数据集观测数的最快的方式。

 

point=变量

data point1;

n=3;

set sashelp.class point=n;

output;

stop;

run;

获取第三条观测。注意不能写成point=3,因为point后面只能跟变量,也可以用point来获取一连串值,使用do循环:

data point2;

do n=3 to 11;

set sashelp.class point=n;

output;

end;

stop;

run;

注意stop语句绝对不能省略,否则进入死循环。

 

一个最实用的程序是快速获得最后一条观测

data mylastobs;
set sashelp.class nobs=last point=last;
n=last;
output;
stop;
run

程序在编译时nobs=观测总数就会传送给last变量,接下来程序读入class进入PDV,数据指针直接获取last值并读取最后一条数据,输出并停止Data步。

 

上述代码比朱世武教材快很多,朱书中是这样获取最后数据的

data zhu;

set sashelp.class end=obs_last;

if obs_last=1;

run;

这样的代码要读入所有数据直到发现是最后末尾才输出,显然前面nobs-1条读取操作都是没有用的。

 

end=选项就是是否结尾的标志