Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.92 MB, 94 trang )
12
1 CHƢƠNG 1: GIỚI THIỆU VỀ MẠNG LƢU TRỮ DỮ LIỆU
(STORAGE AREA NETWORK– SAN)
Trong những năm đầu của thập kỷ 80, các hệ thống lưu trữ dữ liệu đính kèm trực
tiếp (Direct – Attach Disk Storage) dựa trên công nghệ SCSI (Small Computer
Systems Interface) là chuẩn kết nối tiêu biểu giữa máy chủ và thiết bị lưu trữ. Cách
kết nối này giúp hệ thống máy chủ làm việc ổn định, kết nối với tủ đĩa với tốc độ và
hiệu suất cao.
Tuy nhiên, với sự ra tăng về tốc độ của các hệ thống máy tính và yêu cầu dung
lượng của thiết bị lưu trữ làm cho kiến trúc kết nối SCSI song song bắt đầu chạm phải
ngưỡng tối đa công suất và khoảng cách truyền dữ liệu. Đáp ứng lại yêu cầu này kênh
quang (fiber- channel) được phát triển. Kênh quang có khả năng hỗ trợ giao thức SCSI
cho thiết bị lưu trữ , hỗ trợ giao thức IP cho mạng máy tính và hỗ trợ giao diện ảo
(Virtual Interface) cho cluster. Kênh quang cho phép khoảng cách truyền xa đến 10km
với tốc độ truyền ở đơn vị gigabit. Với tất cả các tính năng này kênh quang hiện đang
được sử dụng trong hầu hết các thiết bị lưu trữ cấp cao (hi-end), với dung lượng lớn.
Nhờ các tính năng và sự chấp nhận của thị trường, kênh quang đang dần thay thế
các giao diện SCSI song song trong các thiết bị lưu trữ. Cũng dựa trên kênh quang
một kỹ thuật mới được sinh ra là Mạng lưu trữ dữ liệu kênh quang (Fibre Channel
Storage Area Network –SAN). SAN là một mạng gồm có thiết bị lưu trữ dữ liệu và
các thành phần của hệ thống ( ví dụ như máy chủ, card quang, switch…) SAN có khả
năng cung cấp đường kết nối có hiệu năng cao cho các thiết bị, cung cấp đường dự
phòng cho thiết bị lưu trữ, tăng tốc cho công tác sao lưu dữ liệu và hỗ trợ các hệ thống
cluster khả dụng cao (high- availability)
1.1 Tổng quan về SAN
Trong suốt những năm của thập niên 1980, cách thức kết nối truyền thống giữa
máy tính (host) với thiết bị lưu trữ là điểm tới điểm (point to point), hay còn gọi là gắn
trực tiếp vào máy tính (Direct- Attached) thông qua các chuẩn giao tiếp như IDE
(Integrated Drive Electronics) hoặc SCSI song song. Trong đó SCSI song song thường
có tốc độ truyền dẫn là 5 hoặc 10 Mbit/giây giữa host với thiết bị lưu trữ. Các hệ
thống lưu trữ trong thời gian này cũng đã cho phép kết nối nhiều đĩa tới một host
thông qua một giao diện duy nhất [1,4,5].
13
Hình 1.1 Bus kết nối SCSI song song
Với khả năng làm việc khá ổn định, tốc độ kết nối cao, và khả năng cho phép
người quản trị kết nối các thiết bị lưu trữ trong và ngoài một cách đơn giản. SCSI song
song đã đáp ứng được yêu cầu của thị trường trong những năm 1980. Tuy nhiên khi
dung lượng hệ thống lưu trữ ngày một lớn hơn, máy chủ có tốc độ xử lý ngày càng
nhanh hơn thì một vấn đề nảy sinh là các thiết bị lưu trữ ngoài (external storage device)
bắt đầu lớn lên. Các thiết bị lưu trữ dựa trên SCSI ngày càng yêu cầu tăng thêm dung
lượng. Khoảng cách giữa máy chủ với thiết bị lưu trữ cũng đòi hỏi ngày một xa hơn.
Tốc độ truy cập vào ra (I/O rate) cũng phải tăng lên. Để đáp ứng một phần các yêu cầu
này một số biến thể (variant) của chuẩn SCSI được phát minh để hỗ trợ khoảng cách
giữa máy chủ và thiết bị lưu trữ xa hơn. Tuy nhiên yêu cầu về tốc độ truyền dẫn luôn
gặp khó khăn với giao tiếp SCSI song song, để đáp ứng đầy đủ các yêu cầu này các
giải pháp dần dần được phát triển. Một trong hướng phát triển là xây dựng thiết bị lưu
trữ truyền dữ liệu nối tiếp với bộ truyền nhận tốc độ cao, kháng nhiễu, đơn giản trong
ghép nối, nhiều công ty đã tiến hành thí nghiệm việc truyền dẫn nối tiếp trên các môi
trường khác nhau và đã có nhiều mạch tốc độ cao cho phép tốc độ truyền dẫn lên đến
100Mbit/giây ra đời [1].
Công nghệ kênh quang được sử dụng lần đầu tiên vào kết nối thiết bị lưu trữ chỉ để
giải quyết việc tăng khoảng cách, đơn giản việc nối cáp. Việc tăng khoảng cách truyền
này đã căn bản thay thế các thiết bị sử dụng kết nối SCSI cũ bằng kênh truyền nối tiếp
quang tốc độ cao.
14
Hình 1.2 Sử dụng kênh quang để tăng khoảng cách
Kết nối kênh quang cung cấp các giao diện kết nối có tốc độ cao hơn, đơn giản về
việc đấu nối (cabling), có thể đấu nối server với các thiết bị lưu trữ ở xa đến 10km
hoặc 30km khi có hỗ trợ của thiết bị mở rộng.
Các thiết bị lưu trữ kênh quang ban đầu sử dụng giao thức Fibre Channel
Arbitrated Loop (FC-AL). Giao thức này cho phép các đĩa trong cùng một vòng tự
thỏa thuận địa chỉ với nhau trước khi trao đổi dữ liệu trên vòng kết nối. (Hình 1.3).
FC-AL giúp việc gắn nối, mở rộng các thiết bị lưu trữ trở nên đơn giản, giúp phân
cách thiết bị lưu trữ ra khỏi máy chủ. Việc ghép nối giữa máy chủ với thiết bị lưu trữ
còn linh hoạt hơn với sự trợ giúp của các thiết bị ghép nối như hub kênh quang
(Fiber- channel hub) hoặc switch kênh quang (Fiber – channel switch). Các thiết bị kết
nối làm giảm lỗi trên mạng và tăng cường tín hiệu trên đường truyền [4,5,6].
15
Hình 1.3 Vòng kết nối nhiều máy chủ với thiết bị lƣu trữ
Hình 1.4 Kết nối máy chủ với thiết bị lƣu trữ qua chuyển mạch kênh quang
Ngày nay mạng lưu trữ -SANcó cấu trúc giống như mạng máy tính. Các thiết bị cơ
sở hạ tầng bao gồm hub, switch, bridge và router cũng đóng vai trò chuyển tiếp hoặc
định hướng dữ liệu đi trên mạng. Giao diện giao tiếp giữa máy chủ với mạng lưu trữ
giờ được gọi là Host Bus Adapter- HBA[1].
16
Hình 1.5 Mô hình mạng lƣu trữ dữ liệu hiện đại
1.2 Lợi ích của lƣu trữ SAN
1.2.1 Đảm bảo tính sẵn sàng cao:
Dữ liệu số hóa, dữ liệu của các ứng dụng Internet, ngân hàng, điện lực
đều tăng theo hàm mũ với biến là thời gian. Có khá nhiều kỹ thuật cũng được
đưa ra để đáp ứng với sự gia tăng này như web caching, web load balancer,
distributed server cluster. Tuy nhiên các kỹ thuật này không thể áp dụng vào
cho các ứng dụng quan trọng như lưu trữ ảnh, email, cơ sở dữ liệu cho các ứng
dụng ngân hàng, tài chính hay thương mại điện tử. Các ứng dụng này đòi hỏi
phải đáp ứng khả năng cung cấp thông tin, giá cả trực tuyến. thông tin phải
trung thực, chính xác. Chính vì vậy độ khả dụng cao với những hệ thống này là
17
cực kỳ quan trọng, việc ngừng cung cấp dịch vụ của hệ thống trong khoảng
thời gian ngắn sẽ gây ra những tổn thất lớn lao.
Ví dụ: Với phần mềm email server nổi tiếng của microsoft là Exchange
Server, việc sử dụng lưu trữ SAN sẽ giúp cho Exchange có khả năng sử dụng
cơ sở dữ liệu có kích thước lớn, đáp ứng được sự gia tăng về số người dùng
cũng như dung lượng của từng hòm thư trong doanh nghiệp. Các lỗi tại một
điểm (single point of failure) được khắc phục bởi tính dự phòng toàn bộ của
SAN và các giải pháp Cluster ứng dụng của microsoft.
Các hệ thống có độ an toàn cao (HA- High availability) ngày này được sử dụng
phổ biến trong thiết kế đảm bảo khả năng kháng lỗi cho thiết bị lưu trữ.
Nhìn chung với tính sẵn sàng cao trong thiết bị lưu trữ, đường kết nối và
các thiết bị khác. SAN cho phép các máy chủ kết nối đến thiết bị lưu trữ bằng
nhiều đường khác nhau và cung cấp khả năng dự phòng cho từng đường, linh
hoạt, đơn gian hơn trong việc quản lý vùng lưu trữ.
1.2.2 Tập trung thiết bị lưu trữ
Dữ liệu của một hệ thống sẽ gia tăng cùng với thời gian, việc gia tăng
cũng gây khó khăn trong việc quản lý các thiết bị lưu trữ đơn lẻ được gắn cùng
server. Để quản lý được sự gia tăng vùng lưu trữ các nhà quản trị hệ thống bắt
đầu tập trung các thiết bị lưu trữ. Xu hướng sử dụng thiết bị lưu trữ lớn xuất
hiện nhiều hơn việc sử dụng các thiết bị lưu trữ cục bộ đơn lẻ.
Do các tính năng nổi bật của lưu trữ SAN các nhà quản trị hệ thống đã
nhận thấy rằng mặc dù nhu cầu của cơ quan, công ty mình hiện chưa cần
chuyển sang lưu trữ SAN nhưng cũng cho rằng việc triển khai SAN vào hệ
thống của mình là đúng lúc. Ví dụ : Web server đang thiếu vùng lưu trữ dữ
liệu trong khi một server bên cạnh – Database server lại còn trống hàng trăm
Gigabyte. Với các thiết bị lưu trữ cũ không có cách nào để giải quyết được yêu
cầu này nên nhiều trường hợp người sử dụng phải trả chi phí lớn cho việc dự
toán vùng lưu trữ không hợp lý.
1.2.3 Giảm nghẽn mạng khi sao lưu dữ liệu (backup)
Hầu hết các nhà quản trị hệ thống phải đối đầu với việc mạng tắc nghẽn
khi thực hiện sao lưu dữ liệu bởi đa số các phần mềm backup (như VERITAS
18
NetBackup, Legato NetWorker) đều chuyển dữ liệu qua giao thức Internet
Protocol (IP), vì vậy mỗi khi thực hiện backup đường mạng Ethernet sẽ dần
dần bị chậm đi. Mặc dù có cân nhắc đến thời gian backup vào thời điểm ít hoặc
không có người dùng trên mạng nhưng một số doanh nghiệp (Ngân Hàng, Tài
Chính, Viễn thông …) vẫn phải thực hiện backup thường xuyên để đáp ứng
được với sự thay đổi của nội dung dữ liệu.
Một trong những kỹ thuật cho phép loại bỏ nghẽn mạng khi backup là
dùng giao thức internet trên kênh quang (IP over Fibre channel). Khi IP được
truyền trên kênh quang sẽ không ảnh hưởng đến tải trên đường mạng và thừa
hưởng được các đặc tính ưu việt của kênh quang.
1.2.4 Giảm tải cho máy chủ khi sao lưu dữ liệu
Với phần mềm backup chạy trên giao thức internet đều phải nhờ đến
server khi sao lưu, dữ liệu cần sao lưu phải đi qua bộ nhớ của máy chủ, hơn
nữa máy chủ phải giành CPU để xử lý việc này.
Với sao lưu dữ liệu qua kênh quang, các phần mềm backup có thể điều
khiển dữ liệu chạy từ thiết bị lưu trữ đến kênh quang sau đó về thiết bị sao lưu
mà không qua máy chủ. Chính vì ưu điểm này nên đã có khá nhiều công ty,
doanh nghiệp đã mua thiết bị chuyển đổi từ kênh SCSI sang kênh quang để tận
dụng các ưu điểm của kênh quang, tối ưu lại việc sử dụng các thiết bị cũ hiện
đang có.
Intel, Microsoft và Compag đưa ra giao thức VI (Virtual Interface) nhằm
giảm sự điều khiển của CPU khi truyền dữ liệu qua đường mạng. Giao thức
này cũng được sử dụng rộng rãi trong các phần mềm cluster của HP và IBM.
VI giảm sự phức tạp của IP bằng cách sử dụng DMA (Direct Memory Access)
của các thiết bị phần cứng. Chuẩn FC- VI là việc triển khai của chuẩn VI
( Virtual Interface cho Ethernet) trên giao thức FC. FC-VI cung cấp đường
truyền với tốc độ trễ thấp (low- latency) cho các ứng dụng cluster [1].
1.2.5 Tăng tốc độ truy cập dữ liệu
Truyền dữ liệu từ máy chủ đến thiết bị lưu trữ qua kênh quang được đánh
giá là kỹ thuật có tốc độ nhanh và hiệu quả nhất hiện nay. Một số công ty đã
dùng công nghệ lưu trữ dựa trên nền tảng IP cũng có xu hướng chuyển công
19
nghệ mạng Ethernet hiện tại lên Gigabit Ethernet, tuy nhiên có cùng tốc độ là
Gigabit nhưng hiệu năng của Gigabit Ethernet không thể bằng hiệu năng của
kênh quang.
1.2.6 Đảm bảo khả năng kháng cự với sự cố:
Một trong những ưu điểm của kênh quang là hiệu năng cao, khả năng
truyền xa. Ban đầu công nghệ SAN được sử dụng để kéo dài khoảng cách giữa
các tòa nhà hoặc các khu với nhau. Tuy nhiên gần đây công nghệ SAN được sử
dụng để cung cấp giải pháp kháng sự cố: đảm bảo an toàn cho hoạt động ngay
cả khi có sự cố với cơ sở hạ tầng thiết bị. Khác với mạng LAN, SAN có thể
cung cấp rất nhiều tính năng cho các hệ thống đòi hỏi khả năng dự phòng cao
như phân chia tải (load sharing), đường dự phòng (stanby path).
20
2 CHƢƠNG 2: CƠ BẢN VỀ KÊNH QUANG
Cơ sở hạ tầng của SAN được xây dựng trên các công nghệ mới, nó là kết quả kế
thừa của một số công nghệ như SCSI, IP. Giống như các chuẩn mạng máy tính khác
FC cũng có các tầng giao thức (từ FC0 đến FC4). Mỗi tầng của giao thức xác định các
chức năng làm việc khác nhau của giao thức FC.
2.1 Kiến trúc của SAN và các thuật ngữ căn bản:
Mục đích chính của SAN là cung cấp cơ sở hạ tầng cho các hệ thống có lượng lớn
dữ liệu cần trao đổi từ máy chủ đến thiết bị lưu trữ (tủ đĩa, tủ tape…). Ngoài ra SAN
còn cho phép chia sẻ các thiết bị lưu trữ trên mạng SAN khi có nhiều máy chủ có yêu
cầu truy cập đến cùng một thiết bị lưu trữ.
Thiết bị lưu trữ SAN (SAN Storage) cho phép tập trung các thiết bị lưu trữ đơn lẻ
thành một mạng riêng hoặc tham gia vào mạng đã tồn tại, cung cấp tốc độ truy cập
giữa các khối trong mạng nhanh, hầu hết các giao thức được triển khai trong SAN là
giao thức kênh quang. Giao thức này hoạt động chủ yếu ở tốc độ 1 Gbits/giây hoặc 2
Gbits/giây. Một số thiết bị hiện đại đã cho phép tốc độ truyền lên đến 10Gbits/giây.
SAN cung cấp thiết bị lưu trữ cho máy chủ khác với mô hình thiết bị lưu trữ đính
kèm server – DAS (Direct Attached Storage), SAN tránh được nghẽn cổ chai khi có
nhiều server gửi dữ liệu đến thiết bị lưu trữ (Hình 2.1 và hình 2.2 ). Giảm được chi phí
khi mở rộng hoặc giảm bớt các thiết bị trên SAN.
Khi nói đến SAN, chúng ta thường liên tưởng đến việc truyền tải dữ liệu SCSI
qua kênh quang. Mặc dù đây là ví dụ phổ biến của SAN, kênh quang còn hỗ trợ nhiều
giao thức khác như HiPPI (High- Performance Parallel Interface ), IP (Internet
Protocol), FDDI (Fiber Distributed Data Interface), VI (Virtual Interface) và ATM.
Trong đó có IP, SCSI, VI được sử dụng phổ biến [1]