Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.08 MB, 44 trang )
Tìm hiểu công nghệ ảo hóa
Công nghệ máy ảo phục vụ cho nhiều mục đích phong phú. Công nghệ này cho
phép hợp nhất phần cứng bởi vì nhiều hệ điều hành có thể cùng chạy trên một máy
tính. Những ứng dụng then chốt của công nghệ máy ảo bao gồm khả năng tích hợp
chéo giữa các nền tảng và các khả năng dưới đây:
+ Hợp nhất máy chủ: Nếu nhiều máy chủ vận hành ứng dụng mà chỉ tiêu thụ một phần
nhỏ tài nguyên sẵn có, thì công nghệ máy ảo có thể được sử dụng để cho phép nhiều
ứng dụng chạy song song trên một máy chủ duy nhất, ngay cả khi các ứng dụng này
cần tới những phiên bản hệ điều hành hay middleware khác nhau.
+ Hợp nhất cho các môi trường triển khai và thử nghiệm: Mỗi máy ảo đóng vai trò như
một môi trường riêng, điều này sẽ giảm bớt rủi ro và tạo điều kiện để các chuyên gia
phát triển nhanh chóng tái xây dựng các cấu hình hệ điều hành khác nhau hoặc so
sánh các phiên bản ứng dụng được thiết kế cho các hệ điều hành khác nhau. Ngoài ra,
chuyên gia phát triển cũng có thể kiểm tra các phiên bản phát triển sớm của một ứng
dụng trong một máy ảo mà không sợ làm mất đi tính ổn định của hệ thống đối với
những người dùng khác.
+ Re-hosting ứng dụng riêng: Các hệ điều hành và ứng dụng riêng có thể chạy trên
phần cứng mới cùng với những hệ điều hành và ứng dụng được đưa ra gần đây hơn.
+ Đơn giản hóa kế hoạch đối phó và khôi phục thảm họa: Công nghệ máy ảo có thể
được sử dụng như một phần của kế hoạch phòng chống và khôi phục sau thảm họa. Kế
hoạch như vậy thường yêu cầu ứng dụng phải có khả năng di động, linh hoạt trên khắp
các nền tảng phần cứng.
+ Chuyển tới một trung tâm dữ liệu động: Giờ đây, Hyper- V, cùng với những giải pháp
quản lý hệ thống, giúp bạn tạo ra một môi trường CNTT năng động. Môi trường này
không chỉ cho phép bạn phản ứng lại các sự cố một cách hiệu quả hơn mà còn xây
dựng một giải pháp quản lý CNTT có khả năng tự quản lý và có tính chất phòng trừ.
21
Tìm hiểu công nghệ ảo hóa
2.2 Công nghệ Raid
2.2.1 Khái niệm Raid
RAID là chữ viết tắt của Redundant Array of Independent Disks. Ban đầu, RAID
được sử dụng như một giải pháp phòng hộ vì nó cho phép ghi dữ liệu lên nhiều đĩa
cứng cùng lúc. Về sau, RAID đã có nhiều biến thể cho phép không chỉ đảm bảo an toàn
dữ liệu mà còn giúp gia tăng đáng kể tốc độ truy xuất dữ liệu từ đĩa cứng
2.2.2 Lịch sử ra đời và phát triển của Raid
Lần đầu tiên RAID được phát triển năm 1987 tại trường Đại học California ở
Berkeley với những đặcđiểm chỉ ghép các phần đĩa cứng nhỏ hơn thông qua phần mềm
để tạo ra một hệ thống đĩa dung lưng lớn hơn thay thế cho các ổ cứng dung lượng lớn
giá đắt thời bấy giờ.
Mặc dù hiện nay không tồn tại nữa, nhưng Hội đồng tư vấn phát triển RAID
(RAID Advisory Board: Viết tắt là RAB) đã ra thành lập tháng 7 năm 1992 để định
hướng, lập ra các tiêu chuẩn, định dạng cho RAID. RAB đã phân ra các loại cấp độ
RAID (tôi dịch từ từ: level), các tiêu chuẩn phần cứng sử dụng RAID. RAB đã phân ra 7
loại cấp độ RAID từ cấp độ 0 đến cấp độ 6. Cấp độ ở đây không được hiểu rằng cứ cấp
độ cao là cao cấp hoặc là "đời sau", mà chúng chỉ phân biệt rằng giữa loại RAID này và
loại RAID khác, (nhưng lại được sử dụng để giải thích giữa các loại với nhau).
2.3.3 Các chuẩn Raid
2.2.3.1 Chuẩn Striping
Trong một dãy gồm nhiều ổ đĩa, có thể tăng tốc độ truy cập lên mức tối đa bằng
cách ghi song song dữ liệu trên các ổ đĩa này. Theo đó, dung lượng ổ đĩa sẽ được chia
thành nhiều phần nhỏ (strip). Dữ liệu sẽ được ghi trên các strip của từng ổ đĩa.
Ví dụ: trong trường hợp ghi một tập tin lên đĩa cứng, thay vì phương pháp cổ
điển, kỹ thuật Striping sẽ chia nhỏ tệp này ra rồi ghi mỗi phần của tệp lên một ổ cứng
trong dãy một cách đồng thời. Theo cách này, khi đọc dữ liệu, bộ điều khiển cũng sẽ đọc
cùng lúc trên tất cả các ổ đĩa, hệ quả là hiệu năng của hệ thống lưu trữ sẽ được nâng
cao lên rất nhiềtùy thuộc vào số ổ đĩa trong dãy.
Striping có thể thực hiện ở cấp độ các byte, hoặc ở cấp độ các block dữ liệu. Ở
cấp độ byte được sử dụng trong RAID 3, tập tin sẽ được chia thành từng gói nhỏ có
kích thước một byte, và bộ điều khiển sẽ ghi từng byte này lên các ổ đĩa. Trái lại, trong
cấp độ block, tùy theo kích thước block mà các phần của tập tin được chia nhỏ sẽ được
lưu.
22
Tìm hiểu công nghệ ảo hóa
2.2.3.2 Chuẩn Duplexing
Là một chuẩn mở rộng của Mirroring, Duplexing có những nét tương tự về mặt
công nghệ như chuẩn ánh xạ đề cập ở trên. Dữ liệu cũng được ghi như nhau trên hai ổ
đĩa. Tuy nhiên có một điểm khác biệt ở đây là Duplexing không chỉ “nhân đôi” dữ liệu
mà thậm chí còn “nhân đôi” cả yêu cầu về phần cứng. Cụ thể, cần tới hai bộ điều khiển
RAID để kết nối hai ổ đĩa dùng trong Duplexing (mỗi ổ đĩa sẽ kết nối tới một bộ điều
khiển).
Duplexing mang tính bảo mật cao hơn Mirroring một bậc, vì có khả năng hạn
chế những hư hỏng từ bộ phận điều khiển.
2.2.3.3 Chuẩn Parity Raid
Bên cạnh Mirroring,Parity là một phương pháp khác để bảo vệ an toàn cho dữ
liệu là sử dụng các thông tin mang tính “chẵn lẻ” đặc biệt gọi là Parity Information
được tính toán thực tế từ giá trị của dữ liệu.
Khái niệm “chẵn lẻ” được sử dụng trong cơ chế chống lỗi của bộ nhớ truy xuất
ngẫu nhiên (RAM) máy tính. “Parity” của công nghệ RAID cũng có rất nhiều điểm
tương đồng với thuật ngữ trên trong công nghệ bộ nhớ. Nguyên tắc hoạt động của
Parity như sau:Từ các khối dữ liệu X0,X1,X2,…,Xn ,bộ điều khiển sẽ tính toán ra khối Y
mang tính chẵn lẻ của các khối dữ liệu X và lưu trữ nó bằng phép OR hoặc XOR bit.Nếu
mất bất kỳ gói dữ liệu Xk nào , bộ điều khiển sẽ khôi phục lại nó dựa trên các tính toán
từ gói Xi (i <> k) và Y, bất chấp gói bị mất vì lý do gì.
2.2.4 Các Loại Raid
2.2.4.1 Raid level 0
Đây là dạng RAID đang được người dùng ưa thích do khả năng nâng cao hiệu
suất trao đổi dữ liệu của đĩa cứng. Đòi hỏi tối thiểu hai đĩa cứng, RAID 0 cho phép máy
tính ghi dữ liệu lên chúng theo một phương thức đặc biệt được gọi là Striping. Ví dụ
bạn có 8 đoạn dữ liệu được đánh số từ 1 đến 8, các đoạn đánh số lẻ (1,3,5,7) sẽ được
ghi lên đĩa cứng đầu tiên và các đoạn đánh số chẵn (2,4,6,8) sẽ được ghi lên đĩa thứ
hai. Để đơn giản hơn, bạn có thể hình dung mình có 100MB dữ liệu và thay vì dồn
100MB vào một đĩa cứng duy nhất, RAID 0 sẽ giúp dồn 50MB vào mỗi đĩa cứng riêng
giúp giảm một nửa thời gian làm việc theo lý thuyết. Từ đó bạn có thể dễ dàng suy ra
nếu có 4, 8 hay nhiều đĩa cứng hơn nữa thì tốc độ sẽ càng cao hơn. Tuy nghe có vẻ hấp
dẫn nhưng trên thực tế, RAID 0 vẫn ẩn chứa nguy cơ mất dữ liệu. Nguyên nhân chính
lại nằm ở cách ghi thông tin xé lẻ vì như vậy dữ liệu không nằm hoàn toàn ở một đĩa
23
Tìm hiểu công nghệ ảo hóa
cứng nào và mỗi khi cần truy xuất thông tin (ví dụ một file nào đó), máy tính sẽ phải
tổng hợp từ các đĩa cứng. Nếu một đĩa cứng gặp trục trặc thì thông tin (file) đó coi như
không thể đọc được và mất luôn. Thật may mắn là với công nghệ hiện đại, sản phẩm
phần cứng khá bền nên những trường hợp mất dữ liệu như vậy xảy ra không nhiều.
Có thể thấy RAID 0 thực sự thích hợp cho những người dùng cần truy cập nhanh
khối lượng dữ liệu lớn, ví dụ các game thủ hoặc những người chuyên làm đồ hoạ, video
số.
2.2.4.2 Raid level 1
Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu. Cũng giống
như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ
giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục
hoạt động bình thường. Bạn có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến
vấn đề thông tin thất lạc. Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên
chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người say mê
tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều
thông tin quan trọng thì hệ thống RAID 1 là thứ không thể thiếu. Dung lượng cuối cùng
của hệ thống RAID 1 bằng dung lượng của ổ đơn (hai ổ 80GB chạy RAID 1 sẽ cho hệ
thống nhìn thấy duy nhất một ổ RAID 80GB).
2.2.4.3 Raid level 5
Đây có lẽ là dạng RAID mạnh mẽ nhất cho người dùng văn phòng và gia đình
với 3 hoặc 5 đĩa cứng riêng biệt. Dữ liệu và bản sao lưu được chia lên tất cả các ổ cứng.
Nguyên tắc này khá rối rắm. Chúng ta quay trở lại ví dụ về 8 đoạn dữ liệu (1-8) và giờ
đây là 3 ổ đĩa cứng. Đoạn dữ liệu số 1 và số 2 sẽ được ghi vào ổ đĩa 1 và 2 riêng rẽ,
đoạn sao lưu của chúng được ghi vào ổ cứng 3. Đoạn số 3 và 4 được ghi vào ổ 1 và 3
với đoạn sao lưu tương ứng ghi vào ổ đĩa 2. Đoạn số 5, 6 ghi vào ổ đĩa 2 và 3, còn đoạn
sao lưu được ghi vào ổ đĩa 1 và sau đó trình tự này lặp lại, đoạn số 7,8 được ghi vào ổ
1, 2 và đoạn sao lưu ghi vào ổ 3 như ban đầu. Như vậy RAID 5 vừa đảm bảo tốc độ có
cải thiện, vừa giữ được tính an toàn cao. Dung lượng đĩa cứng cuối cùng bằng tổng
dung lượng đĩa sử dụng trừ đi một ổ. Tức là nếu bạn dùng 3 ổ 80GB thì dung lượng
cuối cùng sẽ là 160GB.
2.2.4.4 Raid level 1-0
Có bao giờ bạn ao ước một hệ thống lưu trữ nhanh nhẹn như RAID 0, an toàn
như RAID 1 hay chưa? Chắc chắn là có và hiển nhiên ước muốn đó không chỉ của riêng
bạn. Chính vì thế mà hệ thống RAID kết hợp 0+1 đã ra đời, tổng hợp ưu điểm của cả hai
24
Tìm hiểu công nghệ ảo hóa
“đàn anh”. Tuy nhiên chi phí cho một hệ thống kiểu này khá đắt, bạn sẽ cần tối thiểu 4
đĩa cứng để chạy RAID 0+1. Dữ liệu sẽ được ghi đồng thời lên 4 đĩa cứng với 2 ổ dạng
Striping tăng tốc và 2 ổ dạng Mirroring sao lưu. 4 ổ đĩa này phải giống hệt nhau và khi
đưa vào hệ thống RAID 0+1, dung lượng cuối cùng sẽ bằng ½ tổng dung lượng 4 ổ, ví
dụ bạn chạy 4 ổ 80GB thì lượng dữ liệu “thấy được” là (4*80)/2 = 160GB.
2.3 Công nghệ lưu trữ mạng Sans
2.3.1 Định nghĩa Sans
Lưu trữ mạng có thể được hiểu như một phương pháp truy cập dữ liệu ứng
dụng trên nền tảng mạng mà quá trình truyền dữ liệu trên mạng tương tự như quá
trình truyền dữ liệu từ các thiết bị quen thuộc trên máy chủ như Disks Drivers như ATA,
SCSI.
Trong một mạng lưu trữ, một máy chủ sử dụng một yêu cầu cho một gói dữ liệu
cụ thể hay một dữ liệu cụ thể, từ một đĩa lưu trữ và các yêu cầu được đáp ứng. Phương
pháp này được biết là block storage. Các thiết bị được làm việc như một thiết bị lưu trữ
bên trong máy chủ và được truy cập một cách bình thường thông qua các yêu cầu cụ
thể và quá trình đáp ứng bằng cách gửi các yêu cầu và nhận được trên môi trường
mạng mà thôi.
Theo truyền thống phương pháp truy cập vào file như SMB/CIFS hay NFS, một
máy chủ sử dụng các yêu cầu cho một file như một thành phần của hệ thống file trên
máy, và được quản lý bình thường với máy chủ. Quá trình điều khiển đó được quyết
định từ tầng vật lý của dữ liệu, truy cập vào nó như một ổ đĩa bên trong máy chủ và
được điều khiển và sử dụng trực tiếp trên máy chủ. Chỉ khác một điều dữ liệu bình
thường thông qua hệ thống bus còn SAN dựa trên nền mạng.
Các hệ thống lưu trữ mạng sử dụng giao thức SCSI cho quá trình truyền dữ liệu
từ máy chủ đến các thiết bị lưu trữ, không thông qua các Bus hệ thống. Cụ thể tầng vật
lý của SAN được sử dụng dựa trên các cổng quang để truyền dữ liệu: 1 Gbit Fiber
Channel, 2Gbit Fiber Channel, 4Gbit Fiber Channel, và 1Gbit iSCSI. Giao thức SCSI thông
tin được vận truyển trên một giao thức thấp dựa trên quá trình mapping layer. Hầu
hết các hệ thống SANs hiện hay đều sử dụng SCSI dựa trên hệ thống cáp quang để
truyền dữ liệu và quá trình chuyển đội (mapping layer) từ SCSI qua cáp quang và máy
chủ vẫn hiểu như SCSI là (SCSI over Fiber Channel) và FCP được coi là một chuẩn trong
quá trình chuyển đổi đó. iSCSI là một dạng truyển đổi tương tự với phương pháp thiết
kế mang các thông tin SCSI trên nền IP.
25
Tìm hiểu công nghệ ảo hóa
2.3.2 Lợi ích của Sans
Dễ dàng chia sẻ lưu trữ và quản lý thông tin, mở rộng lưu trữ dễ dàng thông
qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các thiết bị
như máy chủ hay các thiết bị lưu trữ hiện có. Ứng dụng cho các hệ thống Data centrer
và các Cluster. Và mỗi thiết bị lưu trữ trong mạng SAN được quản lý bởi một máy chủ
cụ thể. Trong quá trình quản lý của SAN sử dụng Network Attached Storage (NAS) cho
phép nhiều máy tính truy cập vào cùng một file trên một mạng. Và ngày nay có thể tích
hợp giữa SAN và NAS tạo nên một hệ thống lưu trữ thông tin hoàn thiện.
SANs được thiết kế dễ dàng cho tận dụng các tính năng lưu trữ, cho phép nhiều máy
chủ cùng chia sẻ một thiết bị lưu trữ.
Một ứng dụng khác của SAN là khả năng cho phép máy tính khởi động trực tiếp
từ SAN mà chúng quản lý. Điều này cho phép dễ dàng thay các máy chủ bị lỗi khi đang
sử dụng và có thể cấu hình lại cho phép thay đổi hay nâng cấp máy chủ một cách dễ
dàng và dữ liệu không hề ảnh hưởng khi máy chủ bị lỗi. Và quá trình đó có thể chỉ cần
nửa giờ để có một hệ thống Data Centers. Và được thiết kế với tốc độ truyền dữ liệu
cực lớn và độ an toàn của hệ thống được coi là vấn đề hàng đầu.
SAN cung cấp giải pháp khôi phục dữ liệu một cách nhanh chóng bằng cách
thêm và các thiết bị lưu trữ và có khả năng khôi phục cực nhanh dữ liệu khi một thiết
bị lưu trữ bị lỗi hay không truy cập được (secondary aray).
2.3.3 Các loại Sans
SANs được xây dựng với thiết kế dành riêng cho việc lưu trữ và truyền thông tin.
Nó cung cấp khả năng truyền dữ liệu với tốc độ lớn với độ an toàn cao hơn các giao
thức khác như NAS.
Hầu hết các công nghệ SAN là mạng cáp quang (Fiber Channel Networking) với
các thiết bị lưu trữ sử dụng các ổ địa SCSI. Một dạng cụ thể là FiBre Channel SAN được
xây dựng bởi Fibre Channel Switch được kết nối tới các thiết bị thông qua hệ thống cab
quang. Ngày nay hầu hết các hệ thống SAN đều sử dụng giải pháp định tuyến Fibre
Channel, và mang lại khả năng mở rộng lớn cho cấu trúc SAN cho phép kết hợp các hệ
thống SAN lại với nhau. Tuy nhiên hầu hết quá trình đó đều với mục đích dữ liệu tập
trung và truyền với tốc độ cực cao với khoảng cách xa hơn thông tầng vật lý là cáp
quang, switch quang.
Một dạng khác của SAN là sử dụng giao thức iSCSI nó sử dụng giao thức SCSI
trên nền tảng TCP/IP. Trong dạng này, các switch tương tự như Ethernet Switchs.
Chuẩn iSCSI được giới thiệu năm 2003 và được triển khai rộng lớn trong quá trình lưu
26