Một số tiêu chuẩn công nghiệp cho tích hợp dữ liệu
Về mặt lịch sử, quá trình đồng bộ hóa một hệ hỗ trợ ra quyết định với dữ liệu từ các hệ thống hoạt động đã được gọi như Extract, Transform, Load (ETL) và các công cụ hỗ trợ quá trình này được gọi là công cụ ETL. Ngày nay, ETL đã được thay thế bởi một thuật ngữ toàn diễn hơn - Tích hợp dữ liệu (data integration (DI)). DI mô tả quá trình trích xuất và kết hợp dữ liệu từ một vài định dạng nguồn dữ liệu, chuyển đổi dữ liệu này thành một mô hình mới và thống nhất, chuyển đổi nó vào trong kho dữ liệu. Mặc dù tầm quan trọng của việc có một hệ thống DI hiệu quả cao, chúng ta cần có tiêu chuẩn công nghiệp để đo và so sánh hiệu suất của chúng. Bài báo này trình bày các tính cấp thiết, đặc điểm chính như khối lượng công việc, quy tắc chạy để nhằm trình bày các tiêu chuẩn được xem xét cho một hệ thống tích hợp dữ liệu.