반응형

Qlik 2

change data capture (CDC) 란

0. CDC 란 change data capture 의 약어로 마지막으로 추출한 이후 변경된 데이터만 골라내는 기술을 의미한다. 흔히 데이터 백업이나 통합 작업을 할 경우 방대한 데이터를 다뤄야 하는데 원본소스 가운데 최근 변경된 데이터들만 골라 다른 시스템으로 옮기게되면 시스템 로드도 줄이고 전체적인 작업 생산성을 향상시킬 수 있다. 특히 한 시스템에 있는 대량의 데이터를 정기적으로 추출해 다른 시스템으로 이동하는 데이터 통합이나 데이터 웨어하우스 업무의 경우 CDC 기술을 이용하면 데이터를 추출, 이동하는 시간을 크게 줄일 수 있다. 또한 24시간 운영해야 하는 필수업무 시스템의 경우 CDC 기술을 이용하면 다운타임 없이 실시간 백업과 데이터 통합이 가능하다. 1. CDC의 개념 및 특징- CDC는 ..

BigData&AI 2021.05.28

ODS, DW, DM, ETL, CDC, EDW, OLAP 정리

※ Operational systems 현업에서 '원천' 이라고 많이들 쓴다. (나도 마찬가지) ※ ODS (Operational Data Store) 갓 생성된 다양하고 많은양의 데이터를 정형화시켜 저장하는 곳이다. 이 곳의 데이터만으로는 사실상 활용이 불가능하다. ( 식당으로 비유하면, 갓 캐낸 야채들을 대충 씻고 바구니에 담은 정도...) ※ Data warehouse ODS 데이터들을 활용이 가능한 형태로 만들어 저장하고 관리, 분석할 수 있는 시스템 (식당으로 비유하면, 씻은 야채에 썩은 부분이 제거되고, 껍질이 벗겨진 상태) 데이터 웨어하우징이라 함은 다양하게 분포되어있는 데이터들을 분석과 데이터 웨어하우스가 활용가능한 데이터들의 집합 DW 구축 단계 1단계 DW Modeling – 비즈니스 ..

BigData&AI 2021.05.11
반응형