본문 바로가기
유용한정보모음/SAS 프로그램

SAS 프로그램 작성 기본 예제

by 유익한일상입니다 2020. 9. 1.
반응형
728x170

1. SAS 언어

SAS 언어는 타 프로그래밍 언어 같이 그 자체의 문법 체계를 가지고 있습니다. SAS를 이용하여 통계 분석을 하기 위해서는 먼저 DATA를 입력하여 SAS 자료 세트를 만들어야 합니다. 그리고  DATA의 입력이 완료된 후 통계 처리 PROCEDURE를 실행하면 작업이 실행됩니다

SAS 명령문은 중심어(Keyword), 이름(Name) 등으로 구성됩니다.


· 중심어 : SAS 명령문의 종류를 나타내기 위하여 규정된 단어로서 DATA, PUT, INPUT, PROC, RUN 등이 있습니다.

[SAS 이름을 짓는 규칙]

· 변수와 SAS 자료 이름은 최대 8개까지 문자열을 이용하여 만든다.

· 첫 문자로는 반드시 영문자나 밑줄(underscore:_)을 사용한다.

· 두 번째 문자부터는 영문자, 밑줄, 숫자를 사용할 수 있다.

· SAS 이름 중간에 빈칸이 있을 수 없다.

· 이름 : 변수, 자료 세트, 프로시저 , 포맷 또는 옵션 등 SAS 프로그램에 나타내는 모든 종류의 이름을 뜻합니다.


2. SAS 명령문 작성규칙

· SAS 명령문은 중심 어를 통해 시작하고  ;(세미콜론=관상점)으로 끝난다.

· SAS 명령문은 아무 열(column)에서 시작과 끝을 낼 수 있다.

· 한 SAS 명령문은 여러 줄에 걸쳐 작성할 수 있고, 여러 명령문들을 한 줄에 작성할 수 있다.

· 프로그램 소스(source)에는 대, 소문자 구별 없이 사용할 수 있다.

· 필요에 의해 주석을 사용할 수 있다.(/*주석*/, *주석;)


3. 자료 세트 설명

SAS 프로그램을 이용하여 자료를 분석, 처리하기 위해서는 반드시 하나 이상의 자료 세트를 만들어야 합니다. 이것을 DATA 단계라고 합니다. 자료의 입력을 하여 자료 세트를 생성하는 단계인 DATA 단계는 DATA문장으로 시작하고 RUN문장으로 실행합니다.

1. DATA문

DATA문은 DATA 단계의 시작을 알리는 문장으로 반드시 DATA 문장으로 시작합니다. DATA문장의 형식은 아래와 같습니다.

형식

DATA 자료 세트명;

·

·

RUN;

 

2. INPUT문

INPUT문은 지정하는 각 변숫값에 자료를 기억시키기 위해 변수명을 지정하는 기능을 합니다. INPUT 문에서 문자 변수명 뒤에는 반드시 $를 표시하고 한 줄에 여러 개의 자료를 입력할 때는 포인터(@@)를 사용합니다.

연속적인 변수명을 갖는 경우는 하이픈(-)을 이용합니다. 변수를 지정하는 방식에는 자유 포맷과 지정 포맷이 있습니다. “자유 포맷(free format)”은 자료와 자료 사이에 하나 이상의 공백을 주어 입력하는 형식이고, “지정 포맷(fixed format)”은 변수 다음에 해당 자료 값이 차지하는 열의 위치를 나타내는 방법입니다. INPUT문의 형식은 아래에 있습니다.

 

형식

DATA 자료 세트명;

INPUT 변수명;

CARDS;

원시자료

RUN;

 

 

3. CARDS문

CARDS문은 자료를 프로그램 내에 입력하여 분석하고자 할 때 사용하는 문장입니다. CARDS문은 자료들이 입력될 때 자료 문장의 시작을 알리는 기능을 하고, 자료를 입력할 때 자료와 자료 사이에는 빈칸으로 구분을 해주면 됩니다.

자료를 입력한 후 관성점(;) 또는 RUN을 이용하여 자료 입력의 끝을 나타낸다. 형식은 아래와 같습니다.

형식

DATA 자료 세트명;

INPUT 변수명;

CARDS;

원시자료

RUN;

 

 

4. INFILE문

외부에서 만들어진 파일을 SAS 자료 세트로 변환하기 위해  DATA문과 INPUT문 사이에 INFILE문을 사용합니다. 자료 파일을 작성한 후에는 반드시 ASCⅡ 파일 형태로 저장해야 합니다.

형식

DATA 자료 세트명;

INFILE “경로 및 파일명”;

INPUT 변수명;

RUN;

 

 

5. 예시

이 예제는 DATA문을 이용하여 “SUNHO”이라는 자료 세트를 생성한 프로그램입니다. INPUT문을 이용하여 ID, FIELD, MID, FINAL이라는 변수를 자유 방식으로 지정해 주었으며, CARDS 문을 이용하여 자료의 값을 정하였습니다.

<화면 21> 중심 명령어 예제(편집기 창)

위의 중심 명령어를 통해 만들어진 자료 세트를 아래 모양의 키를 통해 실행시키면, 아래의 결과(표)를 얻을 수 있습니다.

 

 

 

반응형
그리드형