21_빅데이터 분석기사

02_빅데이터 기술 및 제도(6)-데이터 분석 방법

chuu_travel 2026. 2. 21. 23:05
728x90

5) 빅데이터 분석

① 데이터 분석 방법의 분류

● 탐구 요인 분석(Exploratory Factor Analysis, EFA): 데이터 간 상호 관계를 파악하여 데이터를 분석하는 방법이다.

● 확인 요인 분석(Confirmatory Factor Analysis, CFA): 관찰된 변수들의 집합 요소 구조를 파악하기 위한 통계적 기법을 통해 데이터를 분석하는 방법이다.

 

②데이터 분석 방법

구분 내용
분류
(Classification)
● 미리 알려진 클래스들로 구분되는 학습 데이터셋(Data Set)을 학습시켜 새로 추가되는 데이터가 속할 만한 데이터셋을 찾는 지도학습 방법이다.
군집화
(Clustering)
●특성이 비슷한 데이터를 하나의 그룹으로 분류하는 방법으로, 분류와 달리 학습 데이터셋을 이용하지 않는 비지도학습 방법이다.
기계학습
(Machine Learning)
● 인공지능 분야에서 인간의 학습을 모델링한 방법이다.
● 의사결정트리 등 기호적 학습과 신경망이나 유전 알고리즘 등 비기호적 학습, 베이지안이나 은닉 마코프 등 확률적 학습 등 다양한 기법이 있다.
텍스트 마이닝
(Text Mining)
● 자연어 처리 기술을 이용해 인간의 언어로 쓰인 비정형 텍스트에서 유용한 정보를 추출하거나 다른 데이터와의 연관성을 파악하기 위한 방법이다.
● 분류나 군집화 등 빅데이터에 숨겨진 의미 있는 정보를 발견하는 데 사용하기도 한다.
웹 마이닝
(Web Mining)
● 인터넷을 통해 수집한 정보를 데이터 마이닝 방법으로 분석하는 응용분야이다.
오피니언 마이닝
(Opinion Mining)
● 온라인의 다양한 뉴스와 소셜 미디어 코멘트 또는 사용자가 만든 콘텐츠에서 표현된 의견을 추출, 분류, 이해하는 응용분야이다.
리얼리티 마이닝
(Reality Mining)
● 휴대폰 등 기기를 사용하여 인간관계와 행동 양태 등을 추론하는 응용분야이다.
● 통화량, 통화 위치, 통화 상태, 통화 대상, 통화 내용 등을 분석하여 사용자의 인간관계나 행동 특성을 찾아낸다.
소셜 네트워크 분석
(Social Network Analysis)
● 수학의 그래프 이론을 바탕으로 소셜 네트워크 서비스에서 네트워크 연결 구조와 강도를 분석하여 사용자의 명성 및 영향력을 측정하는 방법이다.
감성 분석
(Sentiment Analysis)
● 문장의 의미를 파악하여 글의 내용에 긍정 또는 부정, 좋음 또는 나쁨을 분류하거나 만족 또는 불만족 강도를 지수화하는 방법이다.
● 도출된 지수를 이용하여 고객의 감성 트렌드를 시계열로 분석하고, 고객의 감성 변화에 기업들이 신속하게 대응 및 부정적인 의견의 확산을 방지하는 데 활용할 수 있다.