1. 데이터 마이닝(Data Mining)의 개요
1-1. 데이터 마이닝(Data Mining)의 정의
- 대용량 데이터 베이스에서 데이터의 관계, 특성, 패턴, 규칙을 찾아 모형화하여 유용한 지식으로
추론/변환하는 일련의 과정
1-2. 데이터 마이닝(Data Mining)의 특징
1) 예측 :정보를 이용하여 다음에 발생될 일을 변수로 추정
2) 일반화 : 예측모형을 기반으로 일반화
3) 패턴 : 데이터에 대해 자주 발생하는 유형 및 배열을 도출
4) 활용 : 축적된 과거자료를 활용 가능
2. 데이터 마이닝(Data Mining)의 단계, 과정
2-1. 데이터 마이닝(Data Mining)의 단계
단계 | 설명 |
문제정의 | 적용하고자 하는 비즈니스 문제 정의 및 목표 결정 |
데이터베이스/ Data Warehouse | 정의된 비즈니스 문제에 따라 필요한 데이터를 선정하고 준비 |
데이터 마이닝 과정 | 준비된 데이터를 샘플링하고, 사전 분석을 통해 탐색하고 변형과정을 거친 후 적절한 데이터 마이닝 기법을 이용하여 정보의 패턴을 발견/평가 |
비즈니스 레포트 / 그래프 | 데이터 마이닝 과정에서 얻어진 결과물에 대해 사용자가 쉽게 이해할 수 있도록 비즈니스의 문제와 목적에 맞게 재표현하는 단계 |
의사결정 | 데이터 마이닝으로부터의 정보를 기반으로 전략이나 의사결정을 통한 실제 업무로의 활용 |
피드백(Feedback) | 실제 업무에서의 적용 후의 결과나 효과를 토대로 향상된 정보를 얻기 위해 마이닝의 초기단계로 회귀 |
2-2. 데이터 마이닝(Data Mining) 과정
단계 | 설명 |
Sampling 과정 | - 방대한 양의 데이터로부터 모집단위 유형과 닮은 작은 양의 데이터 추출 |
탐색(Exploration) 과정 | - 이미 알고 있는 사실들을 확인하여 수치화하는 작업을 시작으로 하여 보유하고 있는 수많은 변수들의 관계를 살펴보는 단계 (알고리즘 적용) |
변형 및 조정(Modification) 과정 | - 탐색 단계에서 얻어진 정보를 기반으로 모형화 단계에서 모형의 성능을 향상시키기 위하여, 데이터가 가지고 있는 정보를 효율적으로 사용할 수 있도록 하여주는 단계 - 사용되어지는 방법으로는 변수변환, 수량화, 그룹화 등의 방법 |
모형화(Modeling) 과정 | - 데이터 마이닝의 핵심과정으로 이전 단계에서의 결과를 토대로 하여 분석 목적에 따라 적절한 기법을 통해서 예측 모형을 찾아내는 방법들을 제공 - Predictive Model : 의사결정수, 신경망 - Descriptive Model : 연관분석 기법 |
평가(Assesment) 과정 | - 앞서 적절한 두개 이상의 모형의 효과를 비교하여 가장 좋은 모형을 선택 - 이렇게 선택된 모형은 실제 모집단에 반영하여 그 효과를 재 평가 할 수 있으며, 이로 인하여 새로운 문제를 재기하여 이전 작업을 다시 반복할 수 도 있음 |
'1. IT Story > Basic Studies' 카테고리의 다른 글
Key Escrow (0) | 2019.08.08 |
---|---|
ITO(IT Outsourcing) (0) | 2019.08.07 |
OLAP(Online Analytical Processing) (0) | 2019.08.06 |
프로세스마이닝 (Process Mining) (0) | 2019.08.03 |
EII(Enterprise Information Integration) (0) | 2019.08.01 |
ETL(Extraction, Transformation, Loading) (0) | 2019.07.31 |
DW (Data Warehouse) (0) | 2019.07.30 |
BI(Business Intelligence) (0) | 2019.07.29 |