マクロの%doループはループ値にリスト形式の離散値は指定できないので、工夫しようの話

例えば適当なマクロがあったとして

%macro a(no);
data DS&no;
a=&no;
run;
%mend a;

このマクロaのパラメータを1から7で実行したいと思えば

%macro tloop;
%do i = 1 to 7 ;
%a( &i )
%end;
%mend tloop;

として、

%tloop

とすればできます。

ではパラメータが1 3 5 7のように非連続であればどうしましょう?

%macro _tloop;
%do i = 1 , 3 , 5 , 7 ;
%a( &i )
%end;
%mend _tloop;

%_tloop


とかって書きたいところですが、こいつは漏れなくエラーです。

通常のデータステップのdoステートメントでは

do i = 1 , 3, 5, 7;end; のような非連続値をリスト形式で指定して回せますが
マクロの%do はできません。基本的には別物だと考えた方がいいでしょう。


でも、どうしても、非連続のループがやりたいのって場合はどうするか。
ぱっと思いつく範囲で書いてみました。


まずパターン1として、今回はパラメータを変えながらマクロを実行したいだけなので
ループ用マクロを作らずに通常のデータステップの、do ループで値を遷移させて
call executeしちゃうパターン

data _null_;
do i = 1 , 3 , 5 , 7;
call execute( cats( '%a(' , i ,')' ));
end;
run;


つづいてパターン2 として minoperator オプションを使って
マクロ内でのin演算子を有効にし、ループ変数の最小最大値でループして
inでターゲットの非連続値の値が来た時のみ実行するパターン

%macro loop;
options minoperator;
%do i = 1 %to 7;
%if &i in 1 3 5 7 %then %a(&i);
%end;
options nominoperator;
%mend loop;

%loop



パターン3はインデックス値をマクロ変数で与えて%scanで代入していくパターン

%macro loop2 ;
 %let loopval =1 3 5 7; 
   %let i = 1 ;                 
   %do %until(%scan(&loopval,&i) eq) ;
      %let j = %scan(&loopval,&i);
     %a(&j)
      %let i = %eval(&i+1) ;
   %end ;                       
%mend loop2;                

%loop2

パターン4 はパターン3と発想は同じで、よりシンプルな書き方

%macro loop3;
%let loopval=1 3 5 7;
%do i=1 %to %sysfunc(countw(&loopval));
%let j=%scan(&loopval,&i);
   %a(&j)
%end;
%mend;

%loop3;


パターン2以外は、多分ループ用に与えたい値が文字であっても
そのまま応用できると思います。

また、多分、他にもいろいろ書けるとは思います

univariateプロシジャで任意のパーセント点を出力する話

適当なテストデータをつくります

data Q1;
call streaminit(2015);
do i= 1 to 100;
X = int(rand('uniform')*100);
output;
end;
run;

パーセント点を算出してデータセットに出力したい場合、
univariateプロシジャを利用して、以下のようにかけます

proc univariate data = Q1 noprint ;
var X ;
output out = A1
p1    =p1
p5    =p5
p10   =p10
q1    =p25
median=p50
q3    =p75
p90   =p90
p95   =p95
p99   =p99
;
run ;





1%点はp1 5%点はp5 といったようにキーワードが決まっていて
結果を格納したい変数を右辺に書くわけです。
q1は25%点、q3は75%点、medianは50%点のことです。

ただ、例えば35%点を算出したいと思って p35= と書いてもエラーになります。
上のコードで指定したポイント以外は、統計量キーワードとして登録されていません。

しかし、じゃあできないと言うわけではなく、そういった場合は
pctlpts= と pctlpre = をセットで使うことで可能になります。

まずpctlpts=で、出したいパーセント点を指定します。
そしてpctlpre=で格納する変数名の接頭部分を指定します。

pctlpts=35 pctlpre = p とするとできる変数名はp35
pctlpts=55 pctlpre = XX とするとできる変数名はXX55
みたいな感じです。

実際に

proc univariate data = Q1 ;
var X ;
output out = A2
       pctlpts  = 35
       pctlpre = p ;
run ;





という感じです。

pctlpts=の指定は、複数指定もできて、例えば以下のように
かけば、0から100まで5%刻みで出力したりできます。

proc univariate data = Q1 noprint ;
var X ;
output out = A3
       pctlpts  = 0 to 100 by 5
       pctlpre = p ;
run ;

画像は途中までです






複数変数の場合は

proc univariate data = Q1 noprint ;
var X i ;
output out = A4
       pctlpts  = 35
       pctlpre = PX_ Pi_ ;
run ;






のようにも書けます。



nomreplaceオプションでマクロの上書きをブロックする方法

以下の2つのコードを実行します

%macro mm;
%put AAAA ;
%mend mm;

%macro mm;
%put BBBB ;
%mend mm;

そして


%mm

とマクロを実行したとき、ログにでるのはAAAA BBBBどっちでしょうか?
はい、BBBBです。そりゃそうですね。
%macroステートメントで、既にマクロカタログに存在している(コンパイル済)マクロ名を指定した場合
マクロの内容は上書きされます。

さて、それはいいんですが、そのことで怖い思いをした経験はあるでしょうか?
要するに、うっかり別の処理を同じマクロ名で書いてしまって上書きしてしまい、実行時に
意図していない処理が行われたという感じの体験です。
僕はあります。

基本、自分で書いた1つのプログラム内であれば、よほど疲れてない限り、同じマクロ名使っちゃうことは
少ないと思います。

ただ、例えば%include等を使えば、他のプログラムのマクロを実行できるわけですが
大規模な仕事になってくると、それが結構な量になりがちです。

しかも他人の書いたプログラムと共有する場合、なにか管理する術を考えないと、高確率で
バッティングします。

データを読み込むマクロに名前をつけろと言われたら
%makedataとか%datainとか%dataimpとか、似たりよったりな命名になりがちです。

また、1人でやっててもロジカルチェックとかで各チェックをマクロにしてる場合とか、途中の仕様変更で
チェック番号の全振り直しとかふざけてたことが起きたりして、やっちゃたりします。


さて、そういった時、実行したコードでマクロ名がバッティングして上書きが起きていないかを
確かめるにはどうすればいいでしょう。

options nomreplace;

としてから、実行してみましょう。


%macro mm;
%put AAAA ;
%mend mm;

とすると
ERROR: マクロ MM はコンパイルされません。 NOMREPLACE
       オプションが設定されています。
       ソースコードは、 %MEND
       ステートメントが検出されるまで取り除かれます。

とエラーがでてきます。

これがでるということはその時点で、指定したマクロ名は既にコンパイル済の状態ということです。
おしまい。

ちなみに

options mreplace;

で元の状態に戻ります。

SASの「プログラムを開く」をした時の初期フォルダパスを変更する方法

かなりニッチな小技ですが、たまたま困っている方がいたので、その方に捧げます。

SASの画面で、「ファイル」→「プログラムを開く」とするとダイアログが立ち上がりますが
その際の「ファイルの場所」のデフォルトのパスをどうやって変えるかという話です。

ちなみにWindows環境であれば、デフォルトは恐らくSASインスト時に
MyDocument下に作成される「My SAS Files」フォルダ下のSASのバージョン番号フォルダではないかと思います。

方法は以下の通りです

SASのコンフィングファイル「SASV9.CFG」に事前に記述を追加します。
パスは環境や設定によってことなりますがwindows環境で言語日本語にしているならなら
(C:\Program Files\SAS\SASFoundation\9.2\nls\ja)等に存在するのがデフォルトでしょうか?

ちなみにコンフィングファイルいじるのに慣れている変態系の人は別にいいんですけど
まだおっかなびっくりな方は、余計なところを変えないように注意すると共に必ず変更前に
ファイルをコピーしてバックアップしておきましょう。

コンフィングファイルをメモ帳でもなんでもいいのでテキストエディタで開いて、
いちばんお尻とかでいいので

-SASINITIALFOLDER "任意のフォルダパス"

と書き足して保存すればOKです。

今後SASを新しく立ち上げたときから設定が有効化されているはずです。




SQLでフォーマットとかラベルとかを消す場合のちょっと変わった書き方の話とか

脈絡のない話をいくつか。


最近、SAS友のコードレビューしていて、ん??と思ったのが

proc sql noprint;
create table B as
select X + 0 as X
      ,Y||'' as Y
from A;
quit;

っていうコード(ほんとはもっと処理が入りますが、単純化しています)。

意図わかります?一瞬、なにがしたいんだ?ってなりません?

実はこれ、SQLでデータ元の変数をそのまま参照したいけど、それに定義されているフォーマットやラベルは
初期化したいという意図があるんですね。

ためしに

data A;
X=1;Y='A';
label X='ラベルX' Y='ラベルY';
format X yymmdds10.;
run;








としてから、上のコードを実行すると確かにラベルとフォーマットが消えていることが確認できます。







もちろん

proc sql noprint;
create table _B as
select X format=best. label=''
      ,Y label=''
from A;
quit;

こうしてもいいんだけど、そうやって書き連ねるより楽だし、このことを知っていれば、初期化してるんだって
わかりやすいですね。

ちなみにデータステップで

data C;
set A;
X=X+0;
Y=Y||'';
run;

としてもXとYは元の変数を引き継いでしまうんですね。盲点といえば盲点かも。


ちなみにちなみに、もしデータセットを新規に作らずにフォーマットやラベルを変更する場合、よく
proc datasets;でmodifyを使うと思いますが、

SQLならalter文で書けます。(あんまりSASでalter文を書く必然性がなかったから書いたことないけど)

proc sql noprint;
alter table A 
modify X format=best. label='';
quit;


続いての話題、SAS忘備録のSQL入門がシリーズ15回までいって、とりあえず終了予定だそうです
このシリーズは必読物です。勉強になるし、わかりやすい!特にSASで初めてSQLに触れる方は必読です。
で、最後に僕のブログの書籍紹介にリンクを貼っていただいていているのですが、そこに1冊追加です

「プログラマのためのSQL 第4版 すべてを知り尽くしたいあなたに」
Joe Celko (著), ミック (翻訳, 監修)
出版社: 翔泳社; 2013/5/23

タイトルにグッときたら買いでしょう。それが全てを物語っています。

あと、日本のSQLをひっぱるミックさんがまた最近本をだされて
「SQL実践入門──高速でわかりやすいクエリの書き方」
っていうのを、今読もうとしています。

はい、それだけです。


続いての話題、
SASプログラマーなら必ず一度はお世話になっているはずのサイト「SAS統計データ解析入門
ですが、そちらの管理人さんが海外赴任される等の諸事情で、サイトを更新していきたいのに中々できなくてジレンマを感じている。できればSASの普及に意欲のある方でサイトを引き継ぎたいという方がいればお願いしたいというご相談を受けました。
最初、僕が引き継がせていただこうかとも思ったのですが、まあ、僕のブログは知っての通り、一部のマニア向けなもので、僕はそういうのしか書けないことを見抜かれて、やんわり断っていただきました。

なので、「SAS統計データ解析入門」のテイストを愛しつつ、ぜひ後を継ぎたいという方は、サイトの掲載のメールアドレスか、僕の方にご連絡ください。

続いての話題、
今年もSASユーザー総会の季節がやってきます

2日間にわたって行われるSASユーザーのお祭りで、参加費も安い!
一般:5,400円(税込)
教育機関/公的研究機関:2,700円(税込)
学生:1,100円(税込)

しかし、さらにお得に、参加費を無料にして、論文集もタダで貰え
懇親会でタダ飯を食べることができる裏ワザがあります。

そうです、自分で論文かプレゼンテーション、ポスター・セッションを投稿して発表すればいいんです!
僕も恐らくまた投稿すると思います。
毎年常連の方の発表もいいんですが、やっぱり色んな分野の新しい人の発表を聞いてみたいです。

以上、脈絡のない話でした。