Cloud Pub/Sub và Datalab

Bất cứ khi nào bạn làm việc với các sự kiện realtime, người xây dựng hệ thống sẽ phải sử dụng dịch vụ hướng thông điệp (messaging service). Cloud Pub/Sub được google phát triển ra để phục vụ mục đích trên.

Pub trong cụm từ Pub/Sub là viết tắt của publishers  Sub là viết tắt của subscribers. Các ứng dụng có thể gửi thông điệp trong Pub/ Sub và 1 hoặc nhiều subscribers có thể nhận được thông điệp.
Đây là kiểu hướng thông điệp bất đồng bộ. Chi tiết các hoạt động các bạn có thể tham khảo bài viết:
https://toc.123doc.org/document/66921-chuong-3-cac-mo-hinh-goi-nhan-thong-diep.htm

 Cloud Pub/Sub là một khối được xây dựng phục vụ dữ liệu truyền tới với tốc độ cao và không thể đoán trước như hệ thống IOT. Nếu bạn đang phân tích dữ liệu streaming data, Cloud Dataflow và cloud Pub/Sub thường được kết hợp với nhau để đem lại kết quả tốt nhất.

Đối với data science, cần 1 công cụ để lưu trữ và phân tích các kết quả. Một trong các môi trường phổ biến đó là Project Jupyter. Môi trường này cho phép bạn tạo và duy trì như 1 cuốn sổ ghi lại các dòng lệnh và kết quả của nó. Cloud Datalab giúp việc quản lý này ít bị phụ thuộc vào mặt kĩ thuật nhất.

Cloud Datalab được chạy trong một máy ảo Compute Engine.Khi chạy nó đã sử dụng môi trường Python để sẵn sàng sử dụng. Cloud Datalab sẽ tự động điều phối các dịch vụ GCP khác chính vì thể bạn có thể tập trung vào phân tích dữ liệu nhiều hơn. Cloud Datalab cũng được tích hợp với nhiều dịch vụ khác của google như BigQuery, Compute Engine và Cloud Storage, vì vậy việc truy cập dữ liệu của bạn không gặp phải những trở ngại xác thực. Khi bạn đưa dữ liệu và chạy, bạn có thể trực quan hóa dữ liệu của mình bằng các biểu đồ Google hoặc đường biểu đồ và vì có một cộng đồng Python tương tác rộng lớn, bạn có thể tìm hiểu từ các notebools khác. Có rất nhiều gói hiện có để thống kê, học máy, v.v.

Đăng nhận xét

0 Nhận xét