Storing Data

Storing Data

(Phần 2 )

(...) Khi chúng ta suy nghĩ nơi để lưu trữ dữ liệu, hãy nghĩ xem làm cách nào để data truyền vào trong và được truyền ở form nào.

Có 2 phương thức chính để mô tả data flows :

1. ETL (Extract - Transform - Load )

2.ELT (Extract - Load - Transform )

  • ETL là phương thức truyền thống hơn để lưu kho và phân tích với quy mô nhỏ hơn. Trong khi ELT thường được dùng trong cái dự án có lượng data lớn .
  • Trong ETL, data được transform (quá trình chuyển đổi dữ liệu) trước khi được "ghi chép" vào storage và thường theo mô hình của storage đó.
  • Trong ELT, data được lưu trữ ở dạng "thô" trong các giải pháp storage như là Data lake. Các phần dữ liệu sẽ được chuyển đổi theo từng mục đích khác nhau, từ việc xây dựng data warehouse để phục vụ cho deep learning.

image.png

p.

(Tư liệu : Lis Sulmont - Workspace Architect , google ... )