728x90
4) KDD분석 방법론
KDD(Knowledge Discovery in Database)는 1996년 Fayyad가 통계적인 패턴이나 지식을 탐색하는 데 활용할 수 있도록 체계적으로 정리한 프로파일링 기술 기반의 데이터 마이닝 프로세스이다.
① KDD분석 방법론의 9가지 프로세스
| 1. 분석 대상 비즈니스 도메인의 이해 2. 분석 대상 데이터셋 선택과 생성 3. 데이터에 포함되어 있는 잡음(Noise)과 이상값(Outlier)등을 제거하는 정제작업이나 선처리 4. 분석 목적에 맞는 변수를 찾고 필요시 데이터의 차원을 축소하는 데이터 변경 5. 분석 목적에 맞는 데이터 마이닝 기법 선택 6. 분석 목적에 맞는 데이터 마이닝 알고리즘 선택 7. 데이터 마이닝 시행 8. 데이터 마이닝 결과에 대한 해석 9. 데이터 마이닝에서 발견된 지식 활용 |
② KDD 분석 방법론의 분석절차
데이터 분석은 데이터셋(Dataset) 선택, 데이터 전처리, 데이터 변환, 데이터 마이닝, 데이터 마이닝 결과 평가 총 5단계에 걸쳐 진행된다.
| 단계 | 내용 | |
| 1 | 데이터셋 선택 (Selection) |
● 분석대상 비즈니스 도메인에 대한 이해 및 프로젝트 목표의 정확한 설정을 선행한다. ● 데이터베이스 또는 원시 데이터에서 분석에 필요한 데이터를 선택한다. ● 필요시에 목표 데이터를 추가적으로 구성하여 활용한다. |
| 2 | 데이터 전처리 (Preprocessing) |
● 잡음(Noise)과 이상값(Outlier), 결측치(Missing Value)를 식별하고 필요시 제거하거나 대체한다. ● 데이터가 추가적으로 필요한 경우 데이터셋 선택 절차부터 다시 실행한다. |
| 3 | 데이터 변환 (Transformation) |
● 분석 목적에 맞는 변수를 선택하거나 데이터의 차원 축소 등을 수행한다. ● 학습용 데이터와 검증용 데이터로 데이터를 분리한다. |
| 4 | 데이터 마이닝 (Data Mining) |
● 분석 목적에 맞는 데이터 마이닝 기법 및 알고리즘을 선택하여 분석을 수행한다. ● 필요시 데이터 전처리와 데이터 변환 절차를 추가로 실행하여 데이터 분석 결과의 품질을 높일 수 있다. |
| 5 | 데이터 마이닝 결과 평가 (Interpretation/Evaluation) |
● 분석 결과에 대한 해석과 평가 및 분석 목적과이 일치성을 확인한다. ● 발견된 지식을 업무에 활용하기 위한 방안을 모색한다. ● 필요한 경우 데이터셋 선택부터 데이터 마이닝 절차까지 반복하여 수행한다. |
'21_빅데이터 분석기사' 카테고리의 다른 글
| 02_데이터 분석계획(10)_SEMMA분석 방법론 (0) | 2026.03.04 |
|---|---|
| 02_데이터 분석계획(9)_CRISP-DM분석 방법론 (1) | 2026.03.04 |
| 02_데이터 분석계획(7)_데이터 분석 방안 (0) | 2026.03.04 |
| 02_데이터 분석계획(6)_상향식 접근 방식(Bottom Up Approach) (0) | 2026.03.03 |
| 02_데이터 분석계획(4)_분석 문제 정의 (0) | 2026.03.03 |