1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Công nghệ thông tin >

CHƯƠNG 1: GIỚI THIỆU VỀ MẠNG LƢU TRỮ DỮ LIỆU (STORAGE AREA NETWORK– SAN)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.92 MB, 94 trang )


12



1 CHƢƠNG 1: GIỚI THIỆU VỀ MẠNG LƢU TRỮ DỮ LIỆU

(STORAGE AREA NETWORK– SAN)

Trong những năm đầu của thập kỷ 80, các hệ thống lưu trữ dữ liệu đính kèm trực

tiếp (Direct – Attach Disk Storage) dựa trên công nghệ SCSI (Small Computer

Systems Interface) là chuẩn kết nối tiêu biểu giữa máy chủ và thiết bị lưu trữ. Cách

kết nối này giúp hệ thống máy chủ làm việc ổn định, kết nối với tủ đĩa với tốc độ và

hiệu suất cao.

Tuy nhiên, với sự ra tăng về tốc độ của các hệ thống máy tính và yêu cầu dung

lượng của thiết bị lưu trữ làm cho kiến trúc kết nối SCSI song song bắt đầu chạm phải

ngưỡng tối đa công suất và khoảng cách truyền dữ liệu. Đáp ứng lại yêu cầu này kênh

quang (fiber- channel) được phát triển. Kênh quang có khả năng hỗ trợ giao thức SCSI

cho thiết bị lưu trữ , hỗ trợ giao thức IP cho mạng máy tính và hỗ trợ giao diện ảo

(Virtual Interface) cho cluster. Kênh quang cho phép khoảng cách truyền xa đến 10km

với tốc độ truyền ở đơn vị gigabit. Với tất cả các tính năng này kênh quang hiện đang

được sử dụng trong hầu hết các thiết bị lưu trữ cấp cao (hi-end), với dung lượng lớn.

Nhờ các tính năng và sự chấp nhận của thị trường, kênh quang đang dần thay thế

các giao diện SCSI song song trong các thiết bị lưu trữ. Cũng dựa trên kênh quang

một kỹ thuật mới được sinh ra là Mạng lưu trữ dữ liệu kênh quang (Fibre Channel

Storage Area Network –SAN). SAN là một mạng gồm có thiết bị lưu trữ dữ liệu và

các thành phần của hệ thống ( ví dụ như máy chủ, card quang, switch…) SAN có khả

năng cung cấp đường kết nối có hiệu năng cao cho các thiết bị, cung cấp đường dự

phòng cho thiết bị lưu trữ, tăng tốc cho công tác sao lưu dữ liệu và hỗ trợ các hệ thống

cluster khả dụng cao (high- availability)



1.1 Tổng quan về SAN

Trong suốt những năm của thập niên 1980, cách thức kết nối truyền thống giữa

máy tính (host) với thiết bị lưu trữ là điểm tới điểm (point to point), hay còn gọi là gắn

trực tiếp vào máy tính (Direct- Attached) thông qua các chuẩn giao tiếp như IDE

(Integrated Drive Electronics) hoặc SCSI song song. Trong đó SCSI song song thường

có tốc độ truyền dẫn là 5 hoặc 10 Mbit/giây giữa host với thiết bị lưu trữ. Các hệ

thống lưu trữ trong thời gian này cũng đã cho phép kết nối nhiều đĩa tới một host

thông qua một giao diện duy nhất [1,4,5].



13



Hình 1.1 Bus kết nối SCSI song song

Với khả năng làm việc khá ổn định, tốc độ kết nối cao, và khả năng cho phép

người quản trị kết nối các thiết bị lưu trữ trong và ngoài một cách đơn giản. SCSI song

song đã đáp ứng được yêu cầu của thị trường trong những năm 1980. Tuy nhiên khi

dung lượng hệ thống lưu trữ ngày một lớn hơn, máy chủ có tốc độ xử lý ngày càng

nhanh hơn thì một vấn đề nảy sinh là các thiết bị lưu trữ ngoài (external storage device)

bắt đầu lớn lên. Các thiết bị lưu trữ dựa trên SCSI ngày càng yêu cầu tăng thêm dung

lượng. Khoảng cách giữa máy chủ với thiết bị lưu trữ cũng đòi hỏi ngày một xa hơn.

Tốc độ truy cập vào ra (I/O rate) cũng phải tăng lên. Để đáp ứng một phần các yêu cầu

này một số biến thể (variant) của chuẩn SCSI được phát minh để hỗ trợ khoảng cách

giữa máy chủ và thiết bị lưu trữ xa hơn. Tuy nhiên yêu cầu về tốc độ truyền dẫn luôn

gặp khó khăn với giao tiếp SCSI song song, để đáp ứng đầy đủ các yêu cầu này các

giải pháp dần dần được phát triển. Một trong hướng phát triển là xây dựng thiết bị lưu

trữ truyền dữ liệu nối tiếp với bộ truyền nhận tốc độ cao, kháng nhiễu, đơn giản trong

ghép nối, nhiều công ty đã tiến hành thí nghiệm việc truyền dẫn nối tiếp trên các môi

trường khác nhau và đã có nhiều mạch tốc độ cao cho phép tốc độ truyền dẫn lên đến

100Mbit/giây ra đời [1].

Công nghệ kênh quang được sử dụng lần đầu tiên vào kết nối thiết bị lưu trữ chỉ để

giải quyết việc tăng khoảng cách, đơn giản việc nối cáp. Việc tăng khoảng cách truyền

này đã căn bản thay thế các thiết bị sử dụng kết nối SCSI cũ bằng kênh truyền nối tiếp

quang tốc độ cao.



14



Hình 1.2 Sử dụng kênh quang để tăng khoảng cách



Kết nối kênh quang cung cấp các giao diện kết nối có tốc độ cao hơn, đơn giản về

việc đấu nối (cabling), có thể đấu nối server với các thiết bị lưu trữ ở xa đến 10km

hoặc 30km khi có hỗ trợ của thiết bị mở rộng.

Các thiết bị lưu trữ kênh quang ban đầu sử dụng giao thức Fibre Channel

Arbitrated Loop (FC-AL). Giao thức này cho phép các đĩa trong cùng một vòng tự

thỏa thuận địa chỉ với nhau trước khi trao đổi dữ liệu trên vòng kết nối. (Hình 1.3).

FC-AL giúp việc gắn nối, mở rộng các thiết bị lưu trữ trở nên đơn giản, giúp phân

cách thiết bị lưu trữ ra khỏi máy chủ. Việc ghép nối giữa máy chủ với thiết bị lưu trữ

còn linh hoạt hơn với sự trợ giúp của các thiết bị ghép nối như hub kênh quang

(Fiber- channel hub) hoặc switch kênh quang (Fiber – channel switch). Các thiết bị kết

nối làm giảm lỗi trên mạng và tăng cường tín hiệu trên đường truyền [4,5,6].



15

Hình 1.3 Vòng kết nối nhiều máy chủ với thiết bị lƣu trữ



Hình 1.4 Kết nối máy chủ với thiết bị lƣu trữ qua chuyển mạch kênh quang



Ngày nay mạng lưu trữ -SANcó cấu trúc giống như mạng máy tính. Các thiết bị cơ

sở hạ tầng bao gồm hub, switch, bridge và router cũng đóng vai trò chuyển tiếp hoặc

định hướng dữ liệu đi trên mạng. Giao diện giao tiếp giữa máy chủ với mạng lưu trữ

giờ được gọi là Host Bus Adapter- HBA[1].



16



Hình 1.5 Mô hình mạng lƣu trữ dữ liệu hiện đại



1.2 Lợi ích của lƣu trữ SAN

1.2.1 Đảm bảo tính sẵn sàng cao:

Dữ liệu số hóa, dữ liệu của các ứng dụng Internet, ngân hàng, điện lực

đều tăng theo hàm mũ với biến là thời gian. Có khá nhiều kỹ thuật cũng được

đưa ra để đáp ứng với sự gia tăng này như web caching, web load balancer,

distributed server cluster. Tuy nhiên các kỹ thuật này không thể áp dụng vào

cho các ứng dụng quan trọng như lưu trữ ảnh, email, cơ sở dữ liệu cho các ứng

dụng ngân hàng, tài chính hay thương mại điện tử. Các ứng dụng này đòi hỏi

phải đáp ứng khả năng cung cấp thông tin, giá cả trực tuyến. thông tin phải

trung thực, chính xác. Chính vì vậy độ khả dụng cao với những hệ thống này là



17



cực kỳ quan trọng, việc ngừng cung cấp dịch vụ của hệ thống trong khoảng

thời gian ngắn sẽ gây ra những tổn thất lớn lao.

Ví dụ: Với phần mềm email server nổi tiếng của microsoft là Exchange

Server, việc sử dụng lưu trữ SAN sẽ giúp cho Exchange có khả năng sử dụng

cơ sở dữ liệu có kích thước lớn, đáp ứng được sự gia tăng về số người dùng

cũng như dung lượng của từng hòm thư trong doanh nghiệp. Các lỗi tại một

điểm (single point of failure) được khắc phục bởi tính dự phòng toàn bộ của

SAN và các giải pháp Cluster ứng dụng của microsoft.

Các hệ thống có độ an toàn cao (HA- High availability) ngày này được sử dụng

phổ biến trong thiết kế đảm bảo khả năng kháng lỗi cho thiết bị lưu trữ.

Nhìn chung với tính sẵn sàng cao trong thiết bị lưu trữ, đường kết nối và

các thiết bị khác. SAN cho phép các máy chủ kết nối đến thiết bị lưu trữ bằng

nhiều đường khác nhau và cung cấp khả năng dự phòng cho từng đường, linh

hoạt, đơn gian hơn trong việc quản lý vùng lưu trữ.

1.2.2 Tập trung thiết bị lưu trữ

Dữ liệu của một hệ thống sẽ gia tăng cùng với thời gian, việc gia tăng

cũng gây khó khăn trong việc quản lý các thiết bị lưu trữ đơn lẻ được gắn cùng

server. Để quản lý được sự gia tăng vùng lưu trữ các nhà quản trị hệ thống bắt

đầu tập trung các thiết bị lưu trữ. Xu hướng sử dụng thiết bị lưu trữ lớn xuất

hiện nhiều hơn việc sử dụng các thiết bị lưu trữ cục bộ đơn lẻ.

Do các tính năng nổi bật của lưu trữ SAN các nhà quản trị hệ thống đã

nhận thấy rằng mặc dù nhu cầu của cơ quan, công ty mình hiện chưa cần

chuyển sang lưu trữ SAN nhưng cũng cho rằng việc triển khai SAN vào hệ

thống của mình là đúng lúc. Ví dụ : Web server đang thiếu vùng lưu trữ dữ

liệu trong khi một server bên cạnh – Database server lại còn trống hàng trăm

Gigabyte. Với các thiết bị lưu trữ cũ không có cách nào để giải quyết được yêu

cầu này nên nhiều trường hợp người sử dụng phải trả chi phí lớn cho việc dự

toán vùng lưu trữ không hợp lý.

1.2.3 Giảm nghẽn mạng khi sao lưu dữ liệu (backup)

Hầu hết các nhà quản trị hệ thống phải đối đầu với việc mạng tắc nghẽn

khi thực hiện sao lưu dữ liệu bởi đa số các phần mềm backup (như VERITAS



18



NetBackup, Legato NetWorker) đều chuyển dữ liệu qua giao thức Internet

Protocol (IP), vì vậy mỗi khi thực hiện backup đường mạng Ethernet sẽ dần

dần bị chậm đi. Mặc dù có cân nhắc đến thời gian backup vào thời điểm ít hoặc

không có người dùng trên mạng nhưng một số doanh nghiệp (Ngân Hàng, Tài

Chính, Viễn thông …) vẫn phải thực hiện backup thường xuyên để đáp ứng

được với sự thay đổi của nội dung dữ liệu.

Một trong những kỹ thuật cho phép loại bỏ nghẽn mạng khi backup là

dùng giao thức internet trên kênh quang (IP over Fibre channel). Khi IP được

truyền trên kênh quang sẽ không ảnh hưởng đến tải trên đường mạng và thừa

hưởng được các đặc tính ưu việt của kênh quang.

1.2.4 Giảm tải cho máy chủ khi sao lưu dữ liệu

Với phần mềm backup chạy trên giao thức internet đều phải nhờ đến

server khi sao lưu, dữ liệu cần sao lưu phải đi qua bộ nhớ của máy chủ, hơn

nữa máy chủ phải giành CPU để xử lý việc này.

Với sao lưu dữ liệu qua kênh quang, các phần mềm backup có thể điều

khiển dữ liệu chạy từ thiết bị lưu trữ đến kênh quang sau đó về thiết bị sao lưu

mà không qua máy chủ. Chính vì ưu điểm này nên đã có khá nhiều công ty,

doanh nghiệp đã mua thiết bị chuyển đổi từ kênh SCSI sang kênh quang để tận

dụng các ưu điểm của kênh quang, tối ưu lại việc sử dụng các thiết bị cũ hiện

đang có.

Intel, Microsoft và Compag đưa ra giao thức VI (Virtual Interface) nhằm

giảm sự điều khiển của CPU khi truyền dữ liệu qua đường mạng. Giao thức

này cũng được sử dụng rộng rãi trong các phần mềm cluster của HP và IBM.

VI giảm sự phức tạp của IP bằng cách sử dụng DMA (Direct Memory Access)

của các thiết bị phần cứng. Chuẩn FC- VI là việc triển khai của chuẩn VI

( Virtual Interface cho Ethernet) trên giao thức FC. FC-VI cung cấp đường

truyền với tốc độ trễ thấp (low- latency) cho các ứng dụng cluster [1].

1.2.5 Tăng tốc độ truy cập dữ liệu

Truyền dữ liệu từ máy chủ đến thiết bị lưu trữ qua kênh quang được đánh

giá là kỹ thuật có tốc độ nhanh và hiệu quả nhất hiện nay. Một số công ty đã

dùng công nghệ lưu trữ dựa trên nền tảng IP cũng có xu hướng chuyển công



19



nghệ mạng Ethernet hiện tại lên Gigabit Ethernet, tuy nhiên có cùng tốc độ là

Gigabit nhưng hiệu năng của Gigabit Ethernet không thể bằng hiệu năng của

kênh quang.

1.2.6 Đảm bảo khả năng kháng cự với sự cố:

Một trong những ưu điểm của kênh quang là hiệu năng cao, khả năng

truyền xa. Ban đầu công nghệ SAN được sử dụng để kéo dài khoảng cách giữa

các tòa nhà hoặc các khu với nhau. Tuy nhiên gần đây công nghệ SAN được sử

dụng để cung cấp giải pháp kháng sự cố: đảm bảo an toàn cho hoạt động ngay

cả khi có sự cố với cơ sở hạ tầng thiết bị. Khác với mạng LAN, SAN có thể

cung cấp rất nhiều tính năng cho các hệ thống đòi hỏi khả năng dự phòng cao

như phân chia tải (load sharing), đường dự phòng (stanby path).



20



2 CHƢƠNG 2: CƠ BẢN VỀ KÊNH QUANG

Cơ sở hạ tầng của SAN được xây dựng trên các công nghệ mới, nó là kết quả kế

thừa của một số công nghệ như SCSI, IP. Giống như các chuẩn mạng máy tính khác

FC cũng có các tầng giao thức (từ FC0 đến FC4). Mỗi tầng của giao thức xác định các

chức năng làm việc khác nhau của giao thức FC.



2.1 Kiến trúc của SAN và các thuật ngữ căn bản:

Mục đích chính của SAN là cung cấp cơ sở hạ tầng cho các hệ thống có lượng lớn

dữ liệu cần trao đổi từ máy chủ đến thiết bị lưu trữ (tủ đĩa, tủ tape…). Ngoài ra SAN

còn cho phép chia sẻ các thiết bị lưu trữ trên mạng SAN khi có nhiều máy chủ có yêu

cầu truy cập đến cùng một thiết bị lưu trữ.

Thiết bị lưu trữ SAN (SAN Storage) cho phép tập trung các thiết bị lưu trữ đơn lẻ

thành một mạng riêng hoặc tham gia vào mạng đã tồn tại, cung cấp tốc độ truy cập

giữa các khối trong mạng nhanh, hầu hết các giao thức được triển khai trong SAN là

giao thức kênh quang. Giao thức này hoạt động chủ yếu ở tốc độ 1 Gbits/giây hoặc 2

Gbits/giây. Một số thiết bị hiện đại đã cho phép tốc độ truyền lên đến 10Gbits/giây.

SAN cung cấp thiết bị lưu trữ cho máy chủ khác với mô hình thiết bị lưu trữ đính

kèm server – DAS (Direct Attached Storage), SAN tránh được nghẽn cổ chai khi có

nhiều server gửi dữ liệu đến thiết bị lưu trữ (Hình 2.1 và hình 2.2 ). Giảm được chi phí

khi mở rộng hoặc giảm bớt các thiết bị trên SAN.

Khi nói đến SAN, chúng ta thường liên tưởng đến việc truyền tải dữ liệu SCSI

qua kênh quang. Mặc dù đây là ví dụ phổ biến của SAN, kênh quang còn hỗ trợ nhiều

giao thức khác như HiPPI (High- Performance Parallel Interface ), IP (Internet

Protocol), FDDI (Fiber Distributed Data Interface), VI (Virtual Interface) và ATM.

Trong đó có IP, SCSI, VI được sử dụng phổ biến [1]



Xem Thêm
Tải bản đầy đủ (.pdf) (94 trang)

×