압축기술 (데이터 전송효율을 높이기 위한)
1. 압축 기술의 개요
1-1. 개념
- Text, 멀티 미디어(오디오, 영상) 서비스를 위한 효과적 데이터 저장공간, 전송을 위해 부피를 줄이고(부호화), 원데이터로 복원(복호화)하는 기술
- 데이터를 더 작은 크기로 변환하는 인코딩, 원래 데이터로 복원하는 디코딩으로 이루어짐
1-2. 데이터 압축의 원리
- 중복제거: 공간적 중복성 (연속되는 공간에서 상관되는 정보들), 시간적 중복성(현재 프레임과 이전 프레임 중 상관되는 정보)
- 크기 축소: 압축률 = 압축 전 비트수 / 압축 후 비트수 >= 1
- 압축 대상 특성 반영 : 텍스트(Run-Length, Huffman), 정지화상(JPEG, GIF, TIFF), 디지털 컨텐츠( MPEG1, MPEG2~4 )
2. 데이터 압축의 분류 및 압축 기법
2-1. 데이터 압축의 분류
1) 무손실 압축 : 복원 후 압축전의 데이터와 완전 일치하는 방법 (Run-Length Coding, Huffman Coding 등)
- 데이터의 통계적 특징 이용 효율적으로 압축 (텍스트, 프로그램, 의료영상)
2) 손실 압축 : 복원 후 압축전의 데이터와 일치 하지 않는 방법 (예측 기법, 변환기법(FFT, DCT, 계층적 기법)
- 연속 매체를 압축하는데 적상 ( 이미지, 사운드, 멀티미디어)
3) 혼합 압축 : 손실압축과 무손실 압축 방법을 모두 사용 (JPEG, MEPG, H.264)
- 영상 압축에서 많이 사용하는 방식, 매우 큰 압축률 (영상)
2-2. 데이터 압축 기법
1) 반복순차 부호화
- 연속길이 부호화 : 반복되는 코드와 개수를 코드로 작성 (영화 동일장면 연속, 음악 한음의 연속적인 구간)
- 제로 및 공백 변호나 부호화 : 연속길이 부호화의 특별한 경우로 데이터 스트림에서 제로나 공백 문자는 제거
2) 통계적 부호화
- 허프만 부호화: 빈도수가 높은 코드에 가중치를 부여하여 새롭게 부호의 코드를 설정하는 방법
- 산술 부화화 : 심볼의 표본값과 예측된 표본 값의 차를 부호화 하여 정보량을 감소 시킴
3) 차분/예측 부호화, 변환부호화 등 존재
2-3. 데이터 압축시 장/단점
1) 장점 : 공간 효율화, 시간 효율화, 프로세싱 효율화, 전송 효율화, ILM 실현(정보생명주기관리)
2) 단점 : 자원 사용증가, SW 비용증가, SW 개발 복잡도 증가, 품질 저하 가능성, 효율성 저하 가능
3. 데이터 압축시 고려사항
- 압축수준 : 문자수준, 단어 수준
- 데이터 모델의 유형 선택 고려 : 정적, 적응, 반정적 모델
- 정확한 용도를 파악하여 용도에 알맞는 압축기법 사용
'1. IT Story > Basic Studies' 카테고리의 다른 글
암달의 법칙(병렬처리의 한계, 성능평가) (0) | 2019.01.11 |
---|---|
DBMS Optimizer(옵티마이저) (0) | 2019.01.10 |
OSI 7 Layer (Open System Interconnection) (1) | 2019.01.09 |
클라우드 컴퓨팅(Cloud Computing) (0) | 2019.01.08 |
GRC(Governance, Risk & Compliance) (0) | 2019.01.07 |
ISO/IEC 38500, IT Governance 국제표준 (0) | 2019.01.07 |
경영-IT Governance (0) | 2019.01.02 |
정보보안-방화벽 (0) | 2019.01.02 |