1. 데이터 마이닝(Data Mining)의 개요

 1-1. 데이터 마이닝(Data Mining)의 정의 

   - 대용량 데이터 베이스에서 데이터의 관계, 특성, 패턴, 규칙을 찾아 모형화하여 유용한 지식으로
추론/변환하는 일련의 과정

 

 1-2. 데이터 마이닝(Data Mining)의 특징

 1) 예측 :정보를 이용하여 다음에 발생될 일을 변수로 추정

 2) 일반화 : 예측모형을 기반으로 일반화

 3) 패턴 : 데이터에 대해 자주 발생하는 유형 및 배열을 도출

 4) 활용 : 축적된 과거자료를 활용 가능

 

2. 데이터 마이닝(Data Mining)의 단계, 과정

 2-1. 데이터 마이닝(Data Mining)의 단계

 

단계 설명
문제정의 적용하고자 하는 비즈니스 문제 정의 및 목표 결정
데이터베이스/ Data Warehouse 정의된 비즈니스 문제에 따라 필요한 데이터를 선정하고 준비
데이터 마이닝 과정 준비된 데이터를 샘플링하고, 사전 분석을 통해 탐색하고 변형과정을 거친 후 적절한 데이터 마이닝 기법을 이용하여 정보의 패턴을 발견/평가
비즈니스 레포트 / 그래프 데이터 마이닝 과정에서 얻어진 결과물에 대해 사용자가 쉽게 이해할 수 있도록 비즈니스의 문제와 목적에 맞게 재표현하는 단계
의사결정 데이터 마이닝으로부터의 정보를 기반으로 전략이나 의사결정을 통한 실제 업무로의 활용
피드백(Feedback) 실제 업무에서의 적용 후의 결과나 효과를 토대로 향상된 정보를 얻기 위해 마이닝의 초기단계로 회귀

 

 2-2. 데이터 마이닝(Data Mining) 과정

단계 설명
Sampling 과정 - 방대한 양의 데이터로부터 모집단위 유형과 닮은 작은 양의 데이터 추출
탐색(Exploration) 과정 - 이미 알고 있는 사실들을 확인하여 수치화하는 작업을 시작으로 하여 보유하고 있는 수많은 변수들의 관계를 살펴보는 단계 (알고리즘 적용)
변형 및 조정(Modification) 과정 - 탐색 단계에서 얻어진 정보를 기반으로 모형화 단계에서 모형의 성능을 향상시키기 위하여, 데이터가 가지고 있는 정보를 효율적으로 사용할 수 있도록 하여주는 단계
- 사용되어지는 방법으로는 변수변환, 수량화, 그룹화 등의 방법
모형화(Modeling) 과정 - 데이터 마이닝의 핵심과정으로 이전 단계에서의 결과를 토대로 하여 분석 목적에 따라 적절한 기법을 통해서 예측 모형을 찾아내는 방법들을 제공
- Predictive Model : 의사결정수, 신경망
- Descriptive Model : 연관분석 기법
평가(Assesment) 과정 - 앞서 적절한 두개 이상의 모형의 효과를 비교하여 가장 좋은 모형을 선택
- 이렇게 선택된 모형은 실제 모집단에 반영하여 그 효과를 재 평가 할 수 있으며, 이로 인하여 새로운 문제를 재기하여 이전 작업을 다시 반복할 수 도 있음

 

'1. IT Story > Basic Studies' 카테고리의 다른 글

Key Escrow  (0) 2019.08.08
ITO(IT Outsourcing)  (0) 2019.08.07
OLAP(Online Analytical Processing)  (0) 2019.08.06
프로세스마이닝 (Process Mining)  (0) 2019.08.03
EII(Enterprise Information Integration)  (0) 2019.08.01
ETL(Extraction, Transformation, Loading)  (0) 2019.07.31
DW (Data Warehouse)  (0) 2019.07.30
BI(Business Intelligence)  (0) 2019.07.29
블로그 이미지

운명을바꾸는자

IT와 함께 살아가는 삶

,