˙ETL : Extract Transform Load
ETL은 데이터 추출 Extract, 변환 Transform, 적재 Load의 약자이다. 현대 사회에 기업이 전 세계 모든 곳에서 많은 사용자들이 관리하는 데이터들을 특정 목적으로 모아두는 것을 말하며, 실질적으로 유용한 상태의 가공한 데이터를 변환 및 적재하여 보유하는 프로세스를 의미한다.
˙데이터 추출 Extract
SQL 문의 SELECT 등을 통하여 데이터를 조회(추출)하는 과정이다. 쉽게 말하여, 필요한 데이터를 꺼내오는 과정이다. 일반적으로는 특정 조건에 의하여 조회(추출)하고자 하는 데이터를 가져오는 과정이며, 필요에 따라 이외 테이블을 JOIN 하는 등의 참조 과정을 거치기도 한다.
˙데이터 변환 Transform
필요한 데이터를 꺼내온 이후에 변환 또는 가공하는 과정이다. 간단하거나 SQL문에서 지원 가능한 함수로 가공할 수도 있으며, 주로 정형화된 데이터를 추출한 이후에 그대로 적재하지만, 때로는 테이블 자체의 데이터를 조회(SELECT)한 이후에 그대로 적재하여 적재된 데이터를 사용할 때에 특정 함수 또는 연산(변환) 과정을 거칠 수도 있다.
˙데이터 적재 Load
변환된 데이터에 대하여 적재(INSERT)하는 과정으로, 사용자가 원하는 대로 가공 또는 원본 그대로의 데이터를 저장소(특정 테이블 또는 서버 등)에 입력하는 과정이다. 결국, 여러 가지의 데이터 또는 여러 서버에서 운영되고 있는 데이터를 사용자의 목적성과 활용성에 맞도록 한 곳으로 모아서 관리하는 부분으로 생각하면 될 것 같다. 기존 데이터에 대하여 변형하고 제어하는 과정이 필요할 수도 있지만, 변형하지 않고 수집하는 부분에 의미를 두는 작업이 될 수도 있다. 이러한 데이터들은 집계 또는 분석 등에 활용될 수 있고, 새로운 비즈니스 모델 수립이나 가치 창출에 도움을 줄 수 있다.
'끄적대기' 카테고리의 다른 글
CI/CD : 지속적 통합과 지속적 제공 (0) | 2022.05.16 |
---|---|
데이터베이스 정규화와 비정규화 (0) | 2022.04.19 |
[Chapter 2] React (0) | 2022.03.24 |
[Chapter 1] NodeJS (0) | 2022.03.24 |
화이트박스 테스트와 블랙박스 테스트 (0) | 2022.03.24 |