Backup máy chủ như thế nào ?

Backup vps như thế nào
Chia sẻ

Một vấn đề đặt ra cho doanh nghiệp khi dữ liệu của máy chủ ngày càng lớn đó là sao lưu và phục hồi như thế nào. Dữ liệu của một hệ thống dù có được bảo vệ bằng hệ thống lưu trữ riêng biệt, các tủ đĩa NAS, hay cao cấp hơn là SAN, thì việc bảo đảm dữ liệu sao lưu vẫn luôn cần thiết. Thông qua bài viết này, Cloudzone muốn mang đến cho các bạn các rủi ro gặp phải của một hệ thống máy chủ và sự cần thiết của dữ liệu backup. Trước tiên, hãy cùng tìm hiểu xem các loại máy chủ, thiết bị lưu trữ thường hay được sử dụng là gì, và phương thức sao lưu dữ liệu hiện nay của các thiết bị đó có thực sự an toàn.

Sử dụng máy chủ vật lý

Những năm trước đây, khi môi trường ảo hóa còn chưa phát triển và phổ biến như hiện nay, doanh nghiệp sử dụng máy chủ vật lý để lưu trữ dữ liệu – ví dụ máy chủ web hosting, máy chủ email, máy chủ chứa phần mềm kế toán, phần mềm Smile (khách sạn), … Mô hình hoạt động sẽ là Máy chủ vật lý cài hệ điều hành (Windows Server hoặc Linux), sau đó cài các ứng dụng cần thiết (Web server, database, mail, hoặc các phần mềm chuyên dụng của doanh nghiệp) và đi vào hoạt động. Dữ liệu sinh ra trong quá trình hoạt động sẽ lưu trữ trên chính máy chủ vật lý đó.

Rủi ro đến từ máy chủ vật lý

  • Hư hỏng linh kiện máy chủ vật lý nói chung, ví dụ hư mainboard, hỏng RAM, hỏng nguồn, … nhưng không hỏng đĩa cứng: đối với các trường hợp này, việc thay thế linh kiện là hoàn toàn khả thi khi chỉ cần có linh kiện thay thế lắp vào, thì máy chủ sẽ trở lại hoạt động bình thường.
  • Hư hỏng đĩa cứng: đây là vấn đề quan trọng nhất của an toàn dữ liệu. Nếu các linh kiện khác có thể thay thế, thì đĩa cứng là nơi lưu trữ dữ liệu lại không thể thay thế. Vì vậy, trong các máy chủ vật lý, cơ chế RAID được sinh ra để dữ liệu được lưu trữ đồng thời trên nhiều đĩa cứng vật lý của một máy chủ, phòng trừ trường hợp hỏng 1 hoặc vài đĩa cứng, dữ liệu vẫn bảo đảm an toàn.

Như vậy có thể thấy máy chủ vật lý có khá nhiều rủi ro dẫn đến gián đoạn/mất mát dữ liệu khi phải đối mặt với bài toán độ ổn định của tất cả các linh kiện bên trong máy chủ, nhất là đối với các máy chủ có thời gian sử dụng từ 2-3 năm trở lên, xác suất hỏng hóc của linh kiện ngày càng tăng.

Phương án sao lưu và phục hồi

  • Vậy phương án backup cho trường hợp này là như thế nào?
    Để sao lưu hệ thống nói trên, cách thông thường nhất là copy dữ liệu bên trong máy chủ vật lý lưu ra bên ngoài. Ví dụ: Lưu dữ liệu trên 1 máy tính/máy chủ khác.
  • Và khi có sự cố thì sẽ copy vào lại máy chủ vật lý nói trên, hoặc cài đặt một môi trường tương tự trên máy chủ mới, sau đó copy dữ liệu đã sao lưu vào máy chủ mới vừa thiết lập.

Nhược điểm

Có thể thấy phương án sao lưu nói trên khi gặp sự cố thì việc khôi phục sẽ mất rất nhiều thời gian. Việc setup một môi trường Production rồi copy lại dữ liệu đã sao lưu không hề đơn giản và nhanh chóng, nhất là đối với các hệ thống lớn, khi mà môi trường cần nhiều cấu hình phức tạp. Đó là chưa tính đến các hệ thống đã chạy nhiều năm, việc kiểm soát nó còn khó, huống gì phải cài đặt lại môi trường tương tự.

Sử dụng máy chủ ảo (VPS)

Khi công nghệ ảo hóa phát triển đã mang đến một sự lựa chọn tuyệt vời cho doanh nghiệp, việc sử dụng ảo hóa vừa giúp tiết kiệm tài nguyên, khai thác hiệu quả tài nguyên máy chủ, vừa thuận tiện trong công tác sao lưu, phục hồi. Tuy nhiên nó cũng không hẳn hoàn hảo và vẫn có những rủi ro đáng kể.

Rủi ro đến từ máy chủ ảo

Thuật ngữ máy chủ ảo còn gọi là VPS – để chỉ các máy ảo hoạt động như 1 máy chủ thông thường với 3 thông số cơ bản CPU, RAM, DISK, nằm bên trên máy chủ vật lý. Một số rủi ro đến từ máy chủ ảo VPS:

  • VPS hay Cloud VPS – sự khác nhau cơ bản của 2 từ khóa này nằm ở chỗ an toàn dữ liệu. Khi VPS (còn gọi VPS thông thường) nằm trên 1 máy chủ vật lý và được lưu trữ trên đĩa cứng local của máy chủ vật lý đó, thì Cloud VPS nằm trên 1 cụm máy chủ vật lý và hệ thống lưu trữ nhân bản dữ liệu. Vì vậy, nếu sử dụng Cloud VPS thì độ an toàn gần như không khác gì máy chủ vật lý – nếu máy chủ vật lý chứa nó bị sự cố, VPS đó cũng bị gián đoạn/mất dữ liệu.
  • Cloud VPS có thể giải quyết được bài toán hỏng hóc máy chủ vật lý, tuy nhiên cũng không phải an toàn tuyệt đối. Nếu một ngày đẹp trời, bạn bị hacker tấn công, hoặc vô tình xóa nhầm dữ liệu trên Cloud VPS, thì dữ liệu của bạn cũng hoàn toàn biến mất theo cơ chế đồng bộ data, ngay cả trên các nhân bản ở máy chủ khác.

Phương án sao lưu và phục hồi

Có thể thấy dù là VPS hay Cloud VPS thì rủi ro an toàn dữ liệu vẫn tiềm ẩn nhiều nguy cơ. Vậy phương án sao lưu phục hồi như thế nào là phù hợp? Có thể phân tích thấy 2 phương án sao lưu – phục hồi hợp lý nhất đó là:

  • Sao lưu dữ liệu và copy lại dữ liệu vào hệ thống mới khi cần phục hồi: cách làm hoàn toàn tương tự như đối với máy chủ vật lý => đây là phương án bị động và chỉ nên áp dụng trong 1 số trường hợp đặc thù của dữ liệu.
  • Sao lưu cả VPS: ưu điểm của ảo hóa cho phép thực hiện copy/clone một VPS ra một VPS mới giống nó hoàn toàn dễ dàng, kể cả với các cấu hình phức tạp. Việc phục hồi cũng dễ dàng khi chỉ cần copy VPS đã sao lưu từ bên ngoài vào hệ thống ảo hóa là có thể hoạt động trở lại bình thường.
  • Tính năng snapshot” đây là tính năng lưu lại trạng thái của VPS trên hệ thống ảo hóa, ngay cả trạng thái của RAM cũng được lưu lại, rất tiện lợi cho việc đưa VPS trở về trạng thái ngay tại thời điểm snapshot. 

Nhược điểm

  • Phương án sao lưu cả VPS tuy có vẻ an toàn, nhưng lại không hoàn toàn khả thi, nhất là đối với các VPS có dung lượng lớn hoặc các hệ thống có nhiều VPS – hàng trăm, hàng ngàn VPS. Việc backup có thể tốn hàng chục giờ khi phải copy và lưu trữ nhiều máy ảo, các công việc phải thực hiện thủ công, tần suất backup càng ngắn thì càng khó khăn.
  • Đối với phương án snapshot, việc thực hiện khá nhanh chóng và có vẻ tiện lợi, nó không thực sự hiệu quả đối với các hệ thống lớn với số lượng VPS lớn, và việc quản lý snapshot lại là một câu chuyện không hề đơn giản. Ngoài ra, việc các bản snapshot được lưu trữ liên tục sẽ làm cho VPS hoạt động cực kỳ chậm chạp trong khi lại tiêu tốn một tài nguyên cực lớn của máy chủ.

Sử dụng SAN hoặc NAS

Một phương án lưu trữ dữ liệu khá phổ biến và tốn kém nhiều chi phí hiện nay đó là sử dụng SAN và NAS.

Trong khi NAS là giải pháp lưu trữ dự phòng, chủ yếu lưu trữ các dữ liệu không cần đọc ghi lớn, thì SAN là phương án tối ưu nhất hiện nay đối với các hệ thống CNTT. Tủ đĩa SAN là sự kết hợp của nhiều đĩa cứng bên trong hoạt động theo cơ chế RAID cộng với nhiều ưu điểm về caching SSD, caching RAM và chuẩn giao tiếp FC tốc độ cao để giao tiếp với các máy chủ thông qua các card HBA. Vì vậy các hệ thống dùng SAN thường được đầu tư và thiết lập khá đồng bộ từ môi trường network, máy chủ, thiết bị lưu trữ (SAN), đĩa cứng, thiết bị mạng và SAN switch. Do đó chi phí cho các hệ thống SAN rất đắt tiền, vượt ngoài tầm với của các doanh nghiệp vừa và nhỏ.

Tuy chi phí cao là vậy, độ an toàn của nó cũng không hẳn là tuyệt đối và cũng bộc lộ nhiều lỗ hỗng. Có thể kể ra một số nhược điểm của SAN như sau:

  • SPOF (Single Point of Failure): đây là đặc điểm cố hữu của bất kỳ 1 hệ thống tập trung nào và SAN cũng vậy. Việc tập trung storage vào 1 chỗ sẽ gây ra điểm nghẽn liên quan đến kết nối, số lượng máy chủ vật lý kết nối đến SAN càng tăng, thì nền tảng giao tiếp FC phải càng chuẩn và tốc độ cao. Ngoài ra, việc bảo đảm IO cho hệ thống lưu trữ phải đáp ứng cho cả hệ thống và cho cả khả năng mở rộng trong tương lai khi việc thay thế, nâng cấp SAN là rất khó khăn, phức tạp, chi phí lớn.
  • Công nghệ RAID: bản chất của SAN vẫn phụ thuộc vào công nghệ RAID tương tự như trên máy chủ. Bên trong SAN, các đĩa cứng cũng được chia theo từng cụm RAID, cụm cần nhiều Storage thì chia RAID 6, cụm cần đọc ghi cao thì chia RAID 10, … Thông thường trong SAN hay sử dụng RAID 6 vì ưu điểm trong việc dự phòng đĩa cứng khi có đến 2 ổ làm dự phòng trong mỗi cụm RAID 6. SAN càng có nhiều disk thì sẽ phải phân chia ra nhiều cụm RAID khác nhau. Vì vậy, mọi nhược điểm của RAID sẽ là nhược điểm của SAN, khi có nhiều hơn 2 disk hỏng trong 1 cụm RAID 6, disk group đó sẽ bị fail, và dữ liệu sẽ bị mất. Rủi ro lớn nhất của SAN trong trường hợp này đó là thay thế, khi việc thay thế disk cho 1 cụm RAID trên máy chủ đơn giản hơn, ít bị ảnh hưởng đến hệ thống hơn, thì trên SAN lại phức tạp hơn nhiều, đòi hỏi nhiều kỹ thuật và có khi cần sự can thiệp từ phía hãng, rất tốn kém chi phí dịch vụ và phần cứng thay thế.
  • Dữ liệu lưu trên 1 disk group trên SAN chưa hẳn đã an toàn. Lấy ví dụ 1 hệ thống SAN có 24 đĩa cứng SATA 2Tb, chia thành 3 cụm RAID 6, mỗi cụm 8 disk x SATA 2Tb. Vậy mỗi cụm RAID 6 sẽ có 8 disk, 6 disk chứa data và 2 disk dự phòng, cho phép hỏng tối đa 2 disk trên mỗi cụm, nếu hỏng qua đĩa thứ 3 trên cùng cụm thì coi như toàn bộ dữ liệu bị mất sạch. Cơ chế này không tận dụng được tính dự phòng của các cụm Disk Group Raid 6 khác, gây lãng phí đồng thời lại kém an toàn.

Như vậy trong trường hợp này, để sử dụng SAN được an toàn, cần phải (1) Đầu tư chi phí để mua các loại đĩa cứng cực xịn để giảm thiểu rủi ro cho hệ thống, đồng thời (2) phải sử dụng các dịch vụ support của hãng cung cấp để được hỗ trợ thay thế phần cứng khi có sự cố với mức chi phí không nhỏ.

Vậy phương án sao lưu VPS như thế nào là hợp lý ?

Để được gọi là hợp lý còn tùy thuộc vào nhiều yếu tố, chủ yếu dựa vào phân loại tầm quan trọng của hệ thống mà có các phương án backup cho phù hợp. Cloudzone đưa ra phương án backup phổ biến và hiệu quả nhất trong quá trình vận hành chúng tôi đã áp dụng, đó là: Cloud VPS kết hợp với dịch vụ Backup as a Service.

  • Như đã nói ở trên, Cloud VPS là xu thế lựa chọn công nghệ trong thời đại ngày nay, giúp đảm bảo tính sẵn sàng của hệ thống. Hệ thống lưu trữ của Cloud thường được thiết kế theo xu hướng phân tán, hướng đến việc sử dụng đa mục đích thay vì một yêu cầu đặc thù nào đó. Mỗi dữ liệu trong Cloud thường được định nghĩa là 1 Object và mỗi Object được nhân bản thành nhiều bản – lưu trữ trên nhiều máy chủ vật lý khác nhau trong cụm Cloud. Khi có sự cố trên 1 máy chủ vật lý, những Object bị mất đi sẽ tồn tại ở các máy chủ khác, và tự động sao thêm 1 bản nữa để luôn bảo đảm số nhân bản trong 1 cụm là không đổi. Vì vậy, có thể thấy mô hình này tối ưu hơn so với các giải pháp lưu trữ khác, khi đạt được tính linh hoạt cao, đồng thời khai thác được hiệu quả tài nguyên sẵn có, đó cũng là lý do vì sao các dịch vụ hạ tầng như Cloud VPS có giá cả rất hợp lý, lại bảo đảm an toàn.
  • Backup as a Service – đây được hiểu là dịch vụ backup theo nhu cầu của khách hàng, thông thường do chính nhà cung cấp triển khai và cung cấp. Dịch vụ sẽ sao lưu toàn bộ VPS của khách hàng và lưu trữ trên 1 hệ thống riêng biệt, việc sao lưu sẽ thực hiện hằng ngày vào ban đêm, và khi có sự cố thì sẽ mang bản backup trong thời gian gần nhất trước đó (hoặc theo chỉ định của khách hàng) để khôi phục lại. 

Có thể nói, sự kết hợp này là phương án an toàn cho dữ liệu của khách hàng khi trong bất kỳ tình huống nào, khách hàng cũng sẽ có bản backup để dự phòng, tránh được các trường hợp rủi ro thất thoát dữ liệu do hacker tấn công, sự cố chủ quan ngoài ý muốn.

Dịch vụ Backup as a service tại Cloudzone

Đây là dịch vụ bổ sung dành cho khách hàng đang sử dụng Cloud VPS tại Cloudzone. Hệ thống backup của Cloudzone sử dụng giải pháp của VEEAM và được thiết lập cơ chế sao lưu, dự phòng đối với các VPS theo định kỳ hằng ngày.

Theo đó, đối với các khách hàng sử dụng dịch vụ backup, Cloud VPS của quý khách sẽ được đưa vào hệ thống sao lưu và tự động backup vào ban đêm – sau 22h. Toàn bộ dữ liệu sau khi backup sẽ được dump thành 1 file theo định dạng của VEEAM và được lưu trữ trên hệ thống dự phòng của Cloudzone. Trong trường hợp quý khách cần khôi phục lại VPS phiên bản gần nhất (1 ngày trước đó), Cloudzone sẽ hỗ trợ quý khách khôi phục. Ngoài ra, bạn cũng có thể download file backup về để lưu trữ tùy ý.

Tham khảo bảng giá dịch vụ Backup As A Service

 Tham khảo bảng giá và dịch vụ Backup As a service của Cloudzone tại đây:Dịch vụ backup as a service

Lưu ý: Dịch vụ Backup as a Service của Cloudzone không chỉ áp dụng cho các khách hàng đang sử dụng Cloud VPS tại Cloudzone, mà còn có thể áp dụng cho các khách hàng sử dụng dịch vụ tại các nhà cung cấp khác.

Hy vọng qua bài viết trên đây sẽ giúp các bạn có được cái nhìn toàn cảnh về sao lưu, dự phòng và chọn cho mình phương án phù hợp nhất.

Cuối cùng, CLOUDZONE luôn đặt sự hài lòng của khách hàng lên hàng đầu, do vậy chúng tôi đảm bảo hỗ trợ kỹ thuật 24/7/365 cho khách hàng xuyên suốt thời gian cung cấp dịch vụ. Với đội ngũ kỹ thuật chuyên nghiệp và giàu kinh nghiệm, chúng tôi cam kết việc trả lời và khắc phục sự cố sẽ đáp ứng các yêu cầu khắc khe nhất của khách hàng.

Liên hệ ngay CLOUDZONE qua số điện thoại 08 8888 0043, email support@cloudzone.vn hoặc Fanpage CLOUDZONE.VN để được tư vấn sớm nhất!

Chia sẻ