1. Tổng quan
- Việc cấu hình Cơ chế và Lịch đồng bộ là bước cuối cùng trong quy trình cấu hình nguồn dữ liệu. Quá trình này giúp người dùng kiểm soát cách thức (Cơ chế) dữ liệu được tiếp nhận và thời điểm (Lịch) hệ thống CDP sẽ tiến hành tải dữ liệu vào.
2. Điều kiện tiên quyết
- Bài viết trước: Cấu hình Quy tắc Ánh xạ (Data Mapping)
- Phân quyền: Tài khoản Mobio phải được cấp quyền RBAC:
INTERGRATION> Cài đặt > Cài đặt DN > Đồng bộ dữ liệu > Data Flow > Nguồn dữ liệu. Xem hướng dẫn phân quyền truy cập RBAC tại đây.
3. Các bước thiết lập Lịch đồng bộ
Cơ chế Streaming
Tại cơ chế đồng bộ dữ liệu, hệ thống hiển thị streaming. Hệ thống mô tả: “Mô hình xử lý dữ liệu theo luồng. Dữ liệu được xử lý lập tức hoặc trong một khoảng thời gian rất ngắn.” Không có lịch định kỳ — dữ liệu chạy về CDP ngay khi phát sinh trên Nguồn.
Cấu hình Giới hạn đồng bộ (Các tham số kỹ thuật kiểm soát khối lượng dữ liệu mỗi request):
- Bulk API query batch size: Hệ thống sử dụng tham số này để xác định kích thước phân vùng. Khi số lượng bản tin trong một yêu cầu vượt quá giới hạn, Connector sẽ tự động chia thành nhiều yêu cầu để đồng bộ dữ liệu. (Mặc định: 200 Bản tin/Request)
- Payload size: Dung lượng bản ghi tối đa, bao gồm headers và request body. Nếu dung lượng bản tin ghi nhận trong mỗi request vượt quá giới hạn, Connector sẽ không xử lý bản tin đó. (Mặc định: 3 MB/Request)
Sau khi cấu hình Giới hạn đồng bộ, bỏ qua phần Cơ chế Snapshot và chuyển thẳng đến bước Trace Key và Thông báo kết quả đồng bộ bên dưới.
Cơ chế Snapshot
Hệ thống tự động lưu lại dữ liệu gốc và luôn duy trì bản sao chép. Quá trình này được lặp đi lặp lại sau mỗi lần dữ liệu được sửa đổi, xử lý theo lô (Batch).
Chọn 1 trong 2 hình thức Snapshot
- Snapshot Full: Đồng bộ toàn bộ dữ liệu từ bảng nguồn mỗi lần chạy.
- Snapshot Incremental: Tiếp nối dữ liệu từ mốc ghi nhận gần nhất. Hệ thống chỉ truy vấn các bản ghi phát sinh mới thay vì quét lại toàn bộ bảng.
Cấu hình Mốc bắt đầu đồng bộ
Thiết lập mốc giá trị để hệ thống truy vấn dữ liệu từ đó.
Snapshot Full
- Mặc định duy nhất: Đồng bộ từ bản tin đầu tiên — Hệ thống sẽ tự động tiếp tục và đồng bộ lại từ đầu mỗi phiên. Không cần điều chỉnh thêm.
Snapshot Incremental
- Mặc định: Giá trị đã ghi nhận ở lần đồng bộ gần nhất — Hệ thống tự động ghi nhận từ giá trị gần nhất của phiên đồng bộ trước.
- Nếu cần can thiệp thủ công một lần (ví dụ: chạy lại từ đầu, hoặc bắt đầu từ một mốc thời gian/ID cụ thể), hãy bật toggle Thiết lập ngoại lệ cho phiên tiếp theo. Lưu ý: thiết lập ngoại lệ chỉ áp dụng cho 1 phiên duy nhất, sau đó hệ thống tự động trở về mặc định.
Cấu hình Kích thước phân đoạn (Chunk size)
Chia dữ liệu thành các phần nhỏ (mặc định: 10.000) để tối ưu hiệu suất truy vấn. Đây là cơ chế giúp hệ thống resume (chạy tiếp) từ đúng phân đoạn bị ngắt mà không cần quét lại từ đầu. Không cần điều chỉnh trong hầu hết trường hợp.
Cấu hình Lịch đồng bộ
- Thủ công: Hệ thống thực hiện đồng bộ dữ liệu từ nguồn khi bạn bật đồng bộ trên giao diện hoặc Doanh nghiệp chủ động đẩy dữ liệu qua API/ETL.
- Định kỳ: Hệ thống chủ động đồng bộ dữ liệu từ nguồn theo lịch định kỳ. Chọn Lịch trình và Thời gian đồng bộ tương ứng:
| Lịch trình | Cấu hình |
|---|---|
| Theo phút | Mỗi X phút (Tối thiểu 15 phút, tối đa 720 phút) |
| Theo giờ | Mỗi X giờ (Tối thiểu 1 giờ, tối đa 24 giờ) + Thời điểm bắt đầu |
| Hàng ngày | Chạy vào giờ quy định hàng ngày (hh:mm) |
| Hàng tuần | Chọn các ngày trong tuần + Giờ chạy |
| Hàng tháng | Chọn ngày cụ thể trong tháng + Giờ chạy |
Bật Tự động đồng bộ lại nếu xảy ra lỗi (tuỳ chọn)
Khi bật, hệ thống sẽ tự động chạy lại phiên đồng bộ nếu phiên trước đó bị lỗi đường truyền hoặc lỗi hệ thống. Tính năng này chỉ áp dụng cho cơ chế Snapshot, không áp dụng cho Streaming.
Bật và thiết lập Trace Key (tuỳ chọn nhưng cực kỳ khuyến nghị)
Trace key giúp định danh bản ghi nguồn và đối chiếu kết quả xử lý trong tracking log.
- Tại Thông tin sử dụng làm Trace Key: Chọn cột dữ liệu từ bảng nguồn hoặc sử dụng giá trị mặc định. Nếu chọn nhiều cột, các giá trị được nối với nhau bằng ký tự đặc biệt.
- Hệ thống hiển thị mô phỏng cách giá trị hiển thị để bạn xem trước kết quả.
Cấu hình Thông báo kết quả đồng bộ (tuỳ chọn)
- Chọn Thông tin liên hệ (Tài khoản người dùng Mobio) sẽ nhận thông báo.
- Chọn các sự kiện cần theo dõi:
- Thay đổi trạng thái kết nối: Thông báo về trạng thái kết nối của nguồn dữ liệu.
- Thay đổi trạng thái phiên đồng bộ: Chủ động theo dõi quá trình thực hiện của các phiên đồng bộ dữ liệu gắn với thời gian thực.
- Phiên đồng bộ có bản tin xử lý thất bại: Phát hiện sớm sự cố trong quá trình đồng bộ.
Sau khi hoàn tất tất cả các cấu hình, nhấn Lưu để kích hoạt Connector.
4. Các câu hỏi thường gặp (FAQ)
- Hỏi: Nếu Database gốc của tôi là Oracle thì tôi có thể chọn chạy luồng Streaming được không?
- Trả lời: KHÔNG. Tùy thuộc vào giao thức của từng loại Database Nguồn mà hệ thống Mobio mở tính năng tương ứng. Ví dụ: Oracle hiện tại chỉ hỗ trợ cơ chế Snapshot. Connector dạng HTTP API chỉ hỗ trợ Streaming.
5. Bước tiếp theo
- Sau khi hoàn thành việc thiết lập cấu hình của Connector, lượng dữ liệu đổ vào mỗi ngày sẽ được giám sát tại giao diện báo cáo.
- Chuyển tiếp tới chuyên mục tiếp theo: Theo dõi báo cáo đồng bộ & Xử lý sự cố