압축기술 (데이터 전송효율을 높이기 위한)



1. 압축 기술의 개요

1-1. 개념

 - Text, 멀티 미디어(오디오, 영상) 서비스를 위한 효과적 데이터 저장공간, 전송을 위해 부피를 줄이고(부호화), 원데이터로 복원(복호화)하는 기술

- 데이터를 더 작은 크기로 변환하는 인코딩, 원래 데이터로 복원하는 디코딩으로 이루어짐


1-2. 데이터 압축의 원리

 - 중복제거: 공간적 중복성 (연속되는 공간에서 상관되는 정보들), 시간적 중복성(현재 프레임과 이전 프레임 중 상관되는 정보)

 - 크기 축소: 압축률 = 압축 전 비트수 / 압축 후 비트수 >= 1

 - 압축 대상 특성 반영 : 텍스트(Run-Length, Huffman), 정지화상(JPEG, GIF, TIFF), 디지털 컨텐츠( MPEG1, MPEG2~4 )


2. 데이터 압축의 분류 및 압축 기법

2-1. 데이터 압축의 분류

 1) 무손실 압축 : 복원 후 압축전의 데이터와 완전 일치하는 방법 (Run-Length Coding, Huffman Coding 등)

     - 데이터의 통계적 특징 이용 효율적으로 압축 (텍스트, 프로그램, 의료영상)


 2) 손실 압축 : 복원 후 압축전의 데이터와 일치 하지 않는 방법 (예측 기법, 변환기법(FFT, DCT, 계층적 기법)

     - 연속 매체를 압축하는데 적상 ( 이미지, 사운드, 멀티미디어)


 3) 혼합 압축 : 손실압축과 무손실 압축 방법을 모두 사용 (JPEG, MEPG, H.264)

     - 영상 압축에서 많이 사용하는 방식, 매우 큰 압축률 (영상)

2-2. 데이터 압축 기법

 1) 반복순차 부호화

   - 연속길이 부호화 : 반복되는 코드와 개수를 코드로 작성 (영화 동일장면 연속, 음악 한음의 연속적인 구간)

   - 제로 및 공백 변호나 부호화 : 연속길이 부호화의 특별한 경우로 데이터 스트림에서 제로나 공백 문자는 제거


 2) 통계적 부호화

   - 허프만 부호화: 빈도수가 높은 코드에 가중치를 부여하여 새롭게 부호의 코드를 설정하는 방법

   - 산술 부화화 : 심볼의 표본값과 예측된 표본 값의 차를 부호화 하여 정보량을 감소 시킴


 3)  차분/예측 부호화, 변환부호화 등 존재


2-3. 데이터 압축시 장/단점

 1) 장점 : 공간 효율화, 시간 효율화, 프로세싱 효율화, 전송 효율화, ILM 실현(정보생명주기관리)

 2) 단점 : 자원 사용증가, SW 비용증가, SW 개발 복잡도 증가, 품질 저하 가능성, 효율성 저하 가능


3. 데이터 압축시 고려사항

 - 압축수준 : 문자수준, 단어 수준

 - 데이터 모델의 유형 선택 고려 : 정적, 적응, 반정적 모델 

 - 정확한 용도를 파악하여 용도에 알맞는 압축기법 사용 


블로그 이미지

운명을바꾸는자

IT와 함께 살아가는 삶

,