728x90
5) CRISP-DM 분석 방법론
CRISP-DM(Cross Industry Standard Process for Data Mining)은 계층적 프로세스 모델로써 4계층으로 구성된 데이터 마이닝 프로세스이다.
①CRISP-DM분석 방법론의 4계층
● 최상위 레벨: 여러 개의 단계(Phase)로 구성된다.
● 일반화 태스크(Generic Tasks): 데이터 마이닝의 단일 프로세스를 완전하게 수행하는 단위이다.
● 세분화 태스트(Specialized Tasks): 일반화 태스크를 구체적으로 수행한다.
● 프로세스 실행(Process Instances): 데이터 마이닝을 구체적으로 실행한다.
②CRISP-DM 분석 방법론의 분석 절차
| 단계 | 내용 | 세부업무 |
| 업무이해 (Business Understanding) |
● 비즈니스 관점에서 프로젝트의 목적과 요구사항을 이해하기 위한 단계이다. ● 도메인 지식을 데이터 분석을 위한 문제정의로 변경한다. ● 초기 프로젝트 계획을 수립한다. |
● 업무 목적 파악 ● 상황 파악 ● 데이터 마이닝 목표 설정 ● 프로젝트 계획 수립 |
| 데이터 이해 (Data Understanding) |
● 분석을 위한 데이터 수집 및 데이터 속성을 이해한다. ● 데이터 품질 문제를 식별한다. ● 인사이트를 발견하는 단계이다. |
● 초기 데이터 수집 ● 데이터 기술 분석 ● 데이터 탐색 ● 데이터 품질 확인 |
| 데이터 준비 (Data Preparation) |
● 수집된 데이터를 분석 기법에 적합한 데이터로 변환한다. | ● 분석용 데이터셋 선택 ● 데이터 정제 ● 분석용 데이터셋 편성 ● 데이터 통합 ● 데이터 포맷팅 |
| 모델링 (Modeling) |
● 다양한 모델링 기법과 알고리즘으로 모형 파라미터를 최적화한다. ● 모델링 결과를 테스트용 프로세스와 데이터셋으로 평가하여 모형 과적합 등의 문제를 확인한다. ● 데이터셋을 추가하기 위해 데이터 준비 절차를 반복할 수 있다. |
● 모델링 기법 선택 ● 모형 테스트 계획 설계 ● 모형 작성 ● 모형 평가 |
| 평가 (Evaluation) |
● 분석 모형이 프로젝트의 목적에 부합하는지 평가한다. ● 데이터 마이닝 결과를 수용할 것인지 최종적으로 판단한다. |
● 분석결과 평가 ● 모델링 과정 평가 ● 모형 적용성 평가 |
| 전개 (Deployment) |
● 완성된 분석 모형을 업무에 적용하기 위한 계획을 수립한다. ● 모니터링과 분석 모형의 유지보수 계획을 마련한다. ● 프로젝트 종료 관련 프로세스를 수행하여 프로젝트 완료한다. |
● 전개 계획 수립 ● 모니터링과 유지보수 계획 수립 ● 프로젝트 종료 보고서 작성 ● 프로젝트 리뷰 |
③ CRISP-DM과 KDD분석 방법론의 비교
| CRISP-DM 분석 방법론 | KDD분석 방법론 |
| 업무 이해(Business Understanding) | - |
| 데이터 이해(Data Understanding) | 데이터셋 선택(Selection) |
| 데이터 전처리(Preprocessing) | |
| 데이터 준비(Data Preparation) | 데이터 변환(Transformation) |
| 모델링(Modeling) | 데이터 마이닝(Data Mining) |
| 평가(Evaluation) | 데이터 마이닝 결과 평가(Interpretation/Evaluation) |
| 전개(Deployment) | - |
'21_빅데이터 분석기사' 카테고리의 다른 글
| 02_데이터 분석계획(11)_빅데이터 분석 방법론 (0) | 2026.03.04 |
|---|---|
| 02_데이터 분석계획(10)_SEMMA분석 방법론 (0) | 2026.03.04 |
| 02_데이터 분석계획(8)_KDD분석 방법론 (3) | 2026.03.04 |
| 02_데이터 분석계획(7)_데이터 분석 방안 (0) | 2026.03.04 |
| 02_데이터 분석계획(6)_상향식 접근 방식(Bottom Up Approach) (0) | 2026.03.03 |