본문 바로가기
유용한정보모음/SAS 프로그램

SAS 데이터 세트파일 만들기

by 유익한일상입니다 2020. 9. 1.
반응형
728x170

1.데이터 세트를 만드는 방법

SAS프로그램 내에서 CARDS문을 이용해 직접 데이터 line을 넣는 방법

데이터 파일을 작성하여 USB(혹은 하드 디스크)에 저장하였다가 SAS 프로그램에서 불러 쓰는 방법

dBASESII SK dBASEIII를 이용 기존의 소프트웨어로 만들어진 데이터베이스를 활용하는 방법

 


2.데이터 파일을 별도로 작성해야 하는 이유

통계분석이 1회의 작업으로 끝나지 않고 추후에 새로운 분석이 필요한 경우 

SAS 이외의 다른 소프트 웨어 (예를 들면 SPSS, BMDP, MITAB 등의 패키지 프로그램)로 분석이 요구되는 경우

데이터 파일을 별도로 작성해야 합니다.


1.PROC UNIVARIATE의 형태

PROC UNIVARIATE는 기술통계량을 구하는 프로시저인 MEANS, SUMMARY, TABULATE에 비해 보다 정밀한 통계량을 구할 수 있습니다. PROC UNIVARIATE로 구할 수 있는 통계량은 다음과 같습니다.

변수의 극한치들(Extreme Values)에 대한 세부 정보

중앙값(Median)과 같은 4분웍수

분포 형태를 분석할 수 있는 여러 가지 그림

쌍체비교검정의 t값

DATA가 정규분포를 하는가에 대한 검정

VAR variables;

UNIVARIATE에 사용되는 변수명을 나열하면 된다. 생략시에는 SAS 데이터셋에 들어 있는 모든 변수에 대하여 PROC MEANS를 실행합니다.

 

BY variables;

특정변수의 각 수준별로 PROC UNIVARIATE를 실행하고자 할 때 사용합니다. 이때 SAS 데이터셋은 BY 뒤의 변수명으로 정렬되어야 합니다. 만약 정렬되어 있지 않으면 PROC SORT를 이용하며 먼저 정렬하여야 합니다.

 

FREQ variables;

각 관측지가 FREQ 뒤에 지정되어 있는 변수의 크기만큼 대표하는 것으로 계산됩니다.

FREQ 뒤의 변수의 값이 Missing이거나 1보다 적으면 계산에서 제외되고 정수가 아닌 경우에는 정수 부분만을 고려합니다.

 

WEGHT variables;

각 관측치에 가중치를 지정하고자 할 때 사용합니다. 이때 가중치의 값이 0과 같거나 작으면 관측치는 계산에서 제외됩니다.

 

OUTPUT OUT = SAS dataset keyword= 이름

OUTPUT OUT=SAS dataset : Output을 받아내는 SAS데이터셋 이름을 지정하는 것으로 OUT=가 생략되면 SAS에서 통상적으로 적용되는 DATan 형식의 이름으로 보관됩니다.

keyword=names : output을 받아내는 SAS데이터셋에 보관하고자 하는 단어들입니다. keyword 다음의 변수명은 VAR문에 있는 각 변수에 해당되는 통계치에 대한 이름입니다.

 

 

반응형
그리드형