21_빅데이터 분석기사

02_데이터 분석계획(9)_CRISP-DM분석 방법론

chuu_travel 2026. 3. 4. 20:38
728x90

5) CRISP-DM 분석 방법론

CRISP-DM(Cross Industry Standard Process for Data Mining)은 계층적 프로세스 모델로써 4계층으로 구성된 데이터 마이닝 프로세스이다.

 

①CRISP-DM분석 방법론의 4계층

● 최상위 레벨: 여러 개의 단계(Phase)로 구성된다.

일반화 태스크(Generic Tasks): 데이터 마이닝의 단일 프로세스를 완전하게 수행하는 단위이다.

세분화 태스트(Specialized Tasks): 일반화 태스크를 구체적으로 수행한다.

프로세스 실행(Process Instances): 데이터 마이닝을 구체적으로 실행한다.

 

②CRISP-DM 분석 방법론의 분석 절차

단계 내용 세부업무
업무이해
(Business Understanding)
  비즈니스 관점에서 프로젝트의 목적과 요구사항을 이해하기 위한 단계이다.
도메인 지식을 데이터 분석을 위한 문제정의로 변경한다.
초기 프로젝트 계획을 수립한다.
업무 목적 파악
상황 파악
데이터 마이닝 목표 설정
프로젝트 계획 수립

데이터 이해
(Data Understanding)
분석을 위한 데이터 수집 및 데이터 속성을 이해한다.
데이터 품질 문제를 식별한다.
인사이트를 발견하는 단계이다.

초기 데이터 수집
데이터 기술 분석
데이터 탐색
데이터 품질 확인

데이터 준비
(Data Preparation)
수집된 데이터를 분석 기법에 적합한 데이터로 변환한다. 분석용 데이터셋 선택
데이터 정제
분석용 데이터셋 편성
데이터 통합
데이터 포맷팅

모델링
(Modeling)
다양한 모델링 기법과 알고리즘으로 모형 파라미터를 최적화한다.
모델링 결과를 테스트용 프로세스와 데이터셋으로 평가하여 모형 과적합 등의 문제를 확인한다.
데이터셋을 추가하기 위해 데이터 준비 절차를 반복할 수 있다.
모델링 기법 선택
모형 테스트 계획 설계
모형 작성
모형 평가

평가
(Evaluation)
분석 모형이 프로젝트의 목적에 부합하는지 평가한다.
데이터 마이닝 결과를 수용할 것인지 최종적으로 판단한다.
분석결과 평가
모델링 과정 평가
모형 적용성 평가

전개
(Deployment)
완성된 분석 모형을 업무에 적용하기 위한 계획을 수립한다.
모니터링과 분석 모형의 유지보수 계획을 마련한다.
프로젝트 종료 관련 프로세스를 수행하여 프로젝트 완료한다.

전개 계획 수립
모니터링과 유지보수 계획 수립
프로젝트 종료 보고서 작성
프로젝트 리뷰

 

③ CRISP-DM과  KDD분석 방법론의 비교

CRISP-DM 분석 방법론 KDD분석 방법론
업무 이해(Business Understanding) -
데이터 이해(Data Understanding) 데이터셋 선택(Selection)
데이터 전처리(Preprocessing)
데이터 준비(Data Preparation) 데이터 변환(Transformation)
모델링(Modeling) 데이터 마이닝(Data Mining)
평가(Evaluation) 데이터 마이닝 결과 평가(Interpretation/Evaluation)
전개(Deployment) -