QUORUM LÀ GÌ

     

Tổng quan lại về Quorum

Định nghĩa

split-brain là hiện tượng lạ cluster to bị tách ra thành nhiều cluster nhỏ. Điều này vẫn dẫn tới việc mất đồng nhất giữa các tài nguyên,ảnh hướng về sự toàn vẹn của hệ thống.

Bạn đang xem: Quorum là gì

Quorum là chiến thuật ngăn chặn hiện tượng kỳ lạ “split brain” trong cluster. Cluster tất cả quorum chỉ lúc số node đang hoạt động nhiều hơn một nửa số node nằm trong Cluster ((Số node hoạt động) > (tổng số node của cụm) / 2).

Quorum được thiết lập bằng chế độ voting. Lúc node ở trong cluster xảy ra sự chũm hoặc mất liên kết với phần sót lại của cluster, những node đang hoạt động sẽ vote cho vấn đề node nào sẽ ảnh hưởng đóng băng cô lập, node nào sẽ tiếp tục hoạt động.

Kỹ thuật Quorm được hỗ trợ mặc định trong pacemaker, cùng với 2 kỹ thuật:

hỗ trợ kỹ thuật Resource-driven cluster - chuyên môn phân cấp, đội tài nguyên để quản lý độc lập hỗ trợ kỹ thuật Quorate Clusters - nghệ thuật tính điểm của những node nằm trong cluster, ý tưởng của kỹ thuật là lúc cụm to bị phân miếng thành 2 phần, cluster sẽ reviews so sánh số điểm của 2 cụm để ra quyết định cụm làm sao sẽ liên tục chạy, cụm nào sẽ ảnh hưởng đóng băng hoặc tắt hẳn. Bí quyết tính quorum (tức số node về tối thiểu để cụm chuyển động bình thường)

(Số node hoạt động) > (tổng số node của cụm) / 2

Ví dụ về quorum:

Đối cùng với Cluster có 2 node, toàn bô vote là 2. Dựa vào kỹ thuật voting quorum đang chỉ vận động nếu số vote lớn hơn 1 nửa số node hoạt động (tức lớn hơn 1 node). Bởi vậy nếu có một node xẩy ra sự cố, cả cluster đang dừng hoạt động

*

Đối cùng với Cluster tất cả 3 node, toàn bô vote là 3. Dựa vào kỹ thuật voting quorum đã chỉ vận động nếu số vote lớn hơn 1 nửa số node vận động (tức to hơn 1 node). Bởi vì vậy nếu gồm hơn 2 node xẩy ra sự cố, cả cluster sẽ dừng hoạt động

*

Trong trường hợp cluster gồm 6 node bị phân mảnh thì cần ít độc nhất 4 node cùng vận động trong cluster để hiện ra quorum. Trong trường thích hợp bị phân mảnh bé dại hơn pacemaker sẽ cô lập hoặc kết thúc cung cấp cho dịch vụ.

Xem thêm: Hệ Thống Embedded System Là Gì, Embedded Developer Cần Những Kỹ Năng Gì

*

Các tùy chọn khi pacemaker mất Quorum (Số node hiện tất cả không thể sản xuất thành quorum):

ignore: liên tục quản trị duy trì hoạt đông cluster của cả khi mất quorum freeze: tiếp tục quản trị duy trì hoạt đông cluster nhưng đóng băng tài nguyên xẩy ra sự cố, không cố gắng khôi phục stop: hoàn thành cung cấp dịch vụ cluster lúc mất quorum suicide: Cô lập những node đang xẩy ra sự cố

Tổng quan lại về STONITH/Fencing

Định nghĩa

STONITH viết tắt Shoot-The-Other-Node-In-The-Head, chuyên môn bảo vễ dữ liệu khỏi những node xảy ra sự cố. Trong trường hợp node không phản hổi cluster dẫu vậy không chắc hẳn rằng trạng thái của node, các dịch vụ trên node, cách rất tốt để bảo đảm an toàn dữ liệu là tắt nóng, bảm đảm node thực sự offline. STONITH đang sử dụng những giao thực quản lí trị tự xa hỗ trợ bởi phần cứng, được cho phép cluster thao tác làm việc trực tiếp với server thứ lý.

Trong hệ thống cluster, các node chia sẻ tài nguyên sử dụng, trường hợp một node xẩy ra sự nỗ lực tài nguyên share giữa những node rất có thể bị ảnh hướng dẫn mang đến trạng thái các node khác cũng bị thất thường. Để tránh hiện tượng này xảy ra, ta sẽ thực hiện kỹ thuật fencing nhằm cô lập những tài nguyên của node đang xẩy ra sự cố.

Fencing sẽ thải trừ kết nối giữa node tới những tài nguyên chia sẻ giữa cluster (shared storage, database, ..). Cluster thực hiện cô lập tài nguyên (fencing) trải qua kỹ thuật STONITH.

Xem thêm: An Toàn Vệ Sinh Thực Phẩm Là Gì ? Vệ Sinh An Toàn Thực Phẩm Là Gì

Với pacemaker, khi nhận ra node xảy ra sự cố, nó sẽ thông tin cho những node đang hoạt động về node lỗi và cô lập node thông qua STONITH.

Cô lập node thông STONITH hoàn toàn có thể được tiến hành thông trải qua không ít mức, dựa trên nhiều các loại thiết bị hỗ trợ

Uninterruptible power nguồn Supply (UPS): xa lánh tài nguyên cung cấp năng lượng bằng bộ giữ điện, áp dụng khi hệ thống cung ứng năng lượng xảy ra sự thay Power Distribution Unit (PDU): xa lánh tài nguyên cung cấp năng lượng bằng thiết bị cấp phép nguồn, sử dụng khi hệ thống cung ứng năng lượng xảy ra sự nỗ lực Blade power nguồn control device: Hệ thống chuyên dụng trong những datacenter, sử dụng để cô lập những cluster node xẩy ra sự cố. Lights-out device: Thiết bị đính mạng cung ứng giao thức quản trị từ bỏ xa tất cả phép thế lập tài nguyên dựa trên thao tác làm việc tắt bật. VD: HP Integrated Lights-Out - (HP ILO); Dell Remote Access Controller (DRAC)

Các giao thức hỗ trợ STONITH:

IPMI - intelligent Platform Management Interface ( General Standard ) IDRAC - Integrated Dell Remote Access ( Dell ) ILO - Integrated Lights-Out ( HP ) IMM - Integrated Management Module ( IBM )

Ngoài ra, nếu dịch vụ chạy trên những máy ảo, những vật nhà hỗ trợ phương thức fencing:

fence_vmware_soap (vSphere Vmware) Fence virtd, fence-agents-virsh (Cho trình ảo hóa cung ứng lib virt

Ví dụ minh họa:Trong trường hợp Node 3 xẩy ra sự cố, cluster hiện ra giữa node 1 và node 2 đã tắt nóng node 3 thông qua thông số kỹ thuật STONITH (ILO, IDRAC, …)

*

Nguồn

https://github.com/hocchudong/ghichep-pacemaker-corosync

https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/high_availability_add-on_overview/ch-operation-haao#s1-quorumoverview-HAAO

https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/high_availability_add-on_overview/s1-fencing-haao

Thực hiện do goutcare-gbc.com.vn


Chuỗi nội dung bài viết về High Availability - Series

Chuồi các bài viết về High Availability cho các thành phần trong Web Server