LƯU TRỮ VÀ XỬ LÝ THAO TÁC TRÊN MÔ HÌNH ĐIỆN TOÁN ĐÁM MÂY
Minh Nhật - Thái Cường
1. Giới thiệu
Ngày nay, đối với các công ty, doanh nghiệp, việc quản lý tốt, hiệu quả dữ liệu của riêng công ty cũng như dữ liệu khách hàng, đối tác là một trong những bài toán được ưu tiên hàng đầu và đang không ngừng gây khó khăn cho họ. Để có thể quản lý được nguồn dữ liệu đó, ban đầu các doanh nghiệp phải đầu tư, tính toán rất nhiều loại chi phí như chi phí cho phần cứng, phần mềm, mạng, chi phí cho quản trị viên, chi phí bảo trì, sửa chữa, … Ngoài ra họ còn phải tính toán khả năng mở rộng, nâng cấp thiết bị; phải kiểm soát việc bảo mật dữ liệu cũng như tính sẵn sàng cao của dữ liệu.
Từ một bài toán điển hình như vậy, chúng ta thấy được rằng nếu có một nơi tin cậy giúp các doanh nghiệp quản lý tốt nguồn dữ liệu đó, các doanh nghiệp sẽ không còn quan tâm đến cơ sở hạ tầng, công nghệ mà chỉ tập trung chính vào công việc kinh doanh của họ thì sẽ mang lại cho họ hiệu quả và lợi nhuận ngày càng cao hơn.
Thuật ngữ “điện toán đám mây” ra đời bắt nguồn từ một trong những hoàn cảnh như vậy.
Thuật ngữ “điện toán đám mây” còn được bắt nguồn từ ý tưởng đưa tất cả mọi thứ như dữ liệu, phần mềm, tính toán, … lên trên mạng Internet. Chúng ta sẽ không còn trông thấy các máy PC, máy chủ của riêng các doanh nghiệp để lưu trữ dữ liệu, phần mềm nữa mà chỉ còn một số các “máy chủ ảo” tập trung ở trên mạng. Các “máy chủ ảo” sẽ cung cấp các dịch vụ giúp cho doanh nghiệp có thể quản lý dữ liệu dễ dàng hơn, họ sẽ chỉ trả chi phí cho lượng sử dụng dịch vụ của họ, mà không cần phải đầu tư nhiều vào cơ sở hạ tầng cũng như quan tâm nhiều đến công nghệ. Xu hướng này sẽ giúp nhiều cho các công ty, doanh nghiệp vừa và nhỏ mà không có cơ sở hạ tầng mạng, máy chủ để lưu trữ, quản lý dữ liệu tốt.
Vậy “điện toán đám mây” là gì ? Nó có thể giải quyết bài toán trên như thế nào và có những đặc điểm nổi bật gì ? Chúng ta sẽ đi qua các phần sau để nắm rõ vấn đề này.
Điện toán đám mây là một gợi ý cho tương lai, là thời điểm chúng ta không tính toán trên các máy tính cục bộ mà thực hiện tính toán trên các tiện ích tập trung được điều hành bởi thành phần thứ ba (third party). Từ giữa những thập niên 90, thuật ngữ Grid đã được xem xét để mô tả các công nghệ cho phép người tiêu thụ lấy về sức mạnh tính toán theo yêu cầu. Ian Foster và các cộng sự thừa nhận rằng “Bằng việc chuẩn hóa các giao thức được sử dụng để yêu cầu sức mạnh tính toán họ có thể thúc đẩy quá trình tạo ra Grid Computing tương tự như lưới điện”. Kết quả của ý tưởng này là các nhà nghiên cứu đã cho ra đời các hệ thống liên kết khả mở rộng theo nhiều khuynh hướng khác nhau như: TeraGrid, Open Science Grid, caBIG, EGEE, Earth System Grid, chúng không chỉ cung cấp sức mạnh tính toán mà còn cả dữ liệu và phần mềm theo nhu cầu.
Bắt đầu từ thập niên 1980, các bộ vi xử lý bán dẫn với năng lực xử lý ngày càng tăng và giá thành cũng như tiêu thụ năng lượng ngày càng giảm , song song với các công nghệ truyền thông với thông lượng thông tin ngày một lớn, đã thúc đẩy một cuộc cách mạng công nghệ thông tin trên phạm vi toàn cầu. Nhân loại đã chứng kiến sự bùng nổ của các thiết bị tính toán và truyền thông tin cá nhân, đặc biệt khi chúng được kết nối trên các mạng lưới có dây và không dây.
Việt Nam là một quốc gia có dân số nằm trong 20 nước đông dân nhất thế giới, với độ tuổi trung bình trẻ, và trong vùng ảnh hưởng văn hóa Đông Á và Đông Nam Á, với truyền thống hiếu học. Tuy nhiên, thu nhập trung bình đầu người và chỉ số phát triển con người thuộc loại thấp trên thế giới, dầu cho các chỉ số này có xu hướng cải thiện. Đa số nhân lực hoạt động trong lĩnh vực nông nghiệp.
Trong thập niên đầu thế kỷ 21, đầu tư cho nghiên cứu phát triển ở Việt Nam chiếm dưới 1% tổng sản phẩm quốc nội (trung bình vài đô la Mỹ / đầu người / năm), thuộc vào loại thấp trên thế giới, trong đó chiếm phần lớn từ ngân sách nhà nước. Trong số hơn 1000 Viện và Trung tâm đăng ký hoạt động trong nghiên cứu và phát triển ở Việt Nam, có hơn 800 đơn vị hoạt động chủ yếu bằng nguồn kinh phí quốc gia. Với đầu tư nhỏ và ít xuất phát từ nhu cầu doanh nghiệp, số lượng và chất lượng các công trình nghiên cứu khoa học và công nghệ của Việt Nam thuộc loại yếu, và ít đóng góp trực tiếp cho sự phát triển bền vững của kinh tế. Số lượng các bài báo quốc tế hàng năm đóng góp bởi lực lượng nghiên cứu trong nước là vào khoảng hơn 100 và số lượng các bằng sáng chế được cấp bởi chính quyền cho người Việt hằng năm là khoảng 20-30 , nhỏ so với nhiều nước trong khu vực. Theo một đánh giá , với tốc độ tăng trưởng hiện tại, cần 60 năm nữa thì Việt Nam mới đuổi kịp Thái Lan về thành tích nghiên cứu khoa học cơ bản, chưa nói đến nghiên cứu ứng dụng.
Tuy nhiên chính sách của quốc gia có khuyến khích hoạt động nghiên cứu phát triển, đặc biệt là nghiên cứu được cấp vốn bởi doanh nghiệp. Ví dụ Luật thuế thu nhập doanh nghiệp có điều khoản quy định doanh nghiệp được trích tới 10% lợi nhuận trước thuế để lập quỹ phát triển khoa học công nghệ
Trong xu hướng toàn cầu hóa của nghiên cứu, Việt Nam đã và đang thu hút được một phần hoạt động nghiên cứu từ các nước đã phát triển. Ví dụ, Honda đã mở chi nhánh nghiên cứu phục vụ cho phát triển sản phẩm và thương mại sản phẩm xe máy tại Việt Nam. Thực tế, đa phần các công trình khoa học cơ bản công bố trên các tạp chí quốc tế bởi các nhà nghiên cứu Việt Nam là đứng tên cùng với các đồng nghiệp nước ngoài và có sự trợ giúp nhiều từ các cơ sở nghiên cứu nước ngoài .Việc hợp tác với cộng đồng nghiên cứu thế giới giúp các đơn vị nghiên cứu Việt Nam bù đắp những yếu kém được phân tích kỹ hơn bên dưới.
2. Các khái niệm về điện toán đám mât
Điện toán đám mây có thể được định nghĩa là một kiểu tính toán mới trong đó sự cân bằng động và các tài nguyên ảo hóa được cung cấp như dịch vụ trên Internet. Điện toán đám mây đã trở thành một khuynh hướng công nghệ quan trọng, nhiều chuyên gia kỳ vọng điện toán đám mây sẻ định hình lại các quy trình công nghệ thông tin và thị trường công nghệ. Với điện toán đám mây, người dùng có thể dùng các thiết bị như: PCs, laptops, smartphones, PDAs(Professional Development Approval System), hay thiết bị di động để truy nhập các chương trình, các nền tảng lưu trữ và triển khai ứng dụng trên Internet thông qua các dịch vụ được các nhà cung cấp điện toán đám mây hỗ trợ.
Hình 1.1: Mọi thứ đều tập trung vào đám mây
Đám mây là một tập hợp của phần cứng, mạng, các thiết bị lưu trữ, dịch vụ và giao diện cho phép các ứng dụng tính toán như một dịch vụ.
Thuật ngữ “điện toán đám mây” bắt nguồn từ ứng dụng điện toán lưới trong thập niên 1980, tiếp theo là điện toán theo nhu cầu (utilitycomputing) và phần mềm dịch vụ (SaaS). Sáu giai đoạn của mô hình điện toán hay có thể gọi là sáu mô hình điện toán bao gồm:
· Giai đoạn 1: nhiều người dùng chia sẻ mainframes công suất cao thông qua các thiết bị đầu cuối giả (dummy terminals).
· Giai đoạn 2: chỉ một PC cũng đã đủ sức mạnh để đáp ứng nhu cầu tính toán của người dùng.
· Giai đoạn 3: máy tính cá nhân và các servers được kết nối vào mạng cục bộ để chia sẻ tài nguyên và nâng cao hiệu năng.
· Giai đoạn 4: mạng cục bộ này được kết nối với mạng cục bộ khác tạo thành một mạng toàn cầu như Internet để sử dụng các ứng dụng và tài nguyên từ xa.
· Giai đoạn 5: điện toán lưới (grid computing) cung cấp năng lực tính toán và năng lực lưu trữ dùng chung thông qua một hệ thống tính toán phân tán.
Giai đoạn 6: điện toán đám mây cung cấp các tài nguyên dùng chung trênInternet theo một cách đơn giản và cân bằng
3. Tính chất cơ bản của điện toán đám mây
Điện toán đám mây có năm tính chất nổi bật so với mô hình truyền thống.
Mỗi khi có nhu cầu, người dùng chỉ cần gửi yêu cầu thông qua trang web cung cấp dịch vụ, hệ thống của nhà cung cấp sẽ đáp ứng yêu cầu của người dùng. Người dùng có thể tự phục vụ yêu cầu của mình như tăng thời gian sử dụng server, tăng dung lượng lưu trữ… mà không cần phải tương tác trực tiếp với nhà cung cấp dịch vụ, mọi nhu cầu về dịch vụ đều được xử lý trên môi trường web (internet).
Cloud Computing cung cấp các dịch vụ thông qua môi trường internet. Do đó, người dùng có kết nối internet là có thể sử dụng dịch vụ. Hơn nữa, Cloud Computing ở dạng dịch vụ nên không đòi hỏi khả năng xử lý cao ở phía client, vì vậy người dùng có thể truy xuất bằng các thiết bị di dộng như điện thoại, PDA, laptop… Với Cloud Computing người dùng không còn bị phụ thuộc vị trí nữa, họ có thể truy xuất dịch vụ từ bất kỳ nơi nào, vào bất kỳ lúc nào có kết nối internet.
Hình 1.2. NIST Visual Model of Cloud Computing Definition
3.3. Dùng chung tài nguyên (Resource pooling)
Tài nguyên của nhà cung cấp dịch vụ được dùng chung, phục vụ cho nhiều người dùng dựa trên mô hình “multi-tenant”. Trong mô hình “multi-tenant”, tài nguyên sẽ được phân phát động tùy theo nhu cầu của người dùng. Khi nhu cầu của một khách hàng giảm xuống, thì phần tài nguyên dư thừa sẽ được tận dụng để phục vụ cho một khách hàng khác. Ví dụ như khách hàng A thuê 10 CPU mỗi ngày từ 7 giờ đến 11 giờ, một khách hàng B thuê 10 CPU tương tự mỗi ngày từ 13 giờ đến 17 giờ thì hai khách hàng này có thể dùng chung 10 CPU đó.
Cloud Computing dựa trên công nghệ ảo hóa, nên các tài nguyên da phần là tài nguyên ảo. Các tài nguyên ảo này sẽ được cấp phát động theo sự thay đổi nhu cầu của từng khách hàng khác nhau. Nhờ đó nhà cung cấp dịch vụ có thể phục vụ nhiều khách hàng hơn so với cách cấp phát tài nguyên tĩnh truyền thống.
Hình 1.3. Nhiều khách hàng dùng chung tài nguyên
Đây là tích chất đặc biệt nhất, nổi bật nhất và quan trọng nhất của Cloud Computing. Đó là khả năng tự động mở rộng hoặc thu nhỏ hệ thống tùy theo nhu cầu của người dùng. Khi nhu cầu tăng cao, hệ thống sẽ tự mở rộng bằng cách thêm tài nguyên vào. Khi nhu cầu giảm xuống, hệ thống sẽ tự giảm bớt tài nguyên.
Ví dụ: khách hàng thuê một Server gồm 10 CPU. Thông thường do có ít truy cập nên chỉ cần 5 CPU là đủ, khi đó hệ thống quản lý của nhà cung cấp dịch vụ sẽ tự ngắt bớt 5 CPU dư thừa, khách hàng không phải trả phí cho những CPU dư thừa này (những CPU này sẽ được cấp phát cho các khách hàng khác có nhu cầu). Khi lượng truy cập tăng cao, nhu cầu tăng lên thì hệ thống quản lý của nhà cung cấp dịch vụ sẽ tự “gắn” thêm CPU vào, nếu nhu cầu tăng vượt quá 10 CPU thì khách hàng phải trả phí cho phần vượt mức theo thỏa thuận với nhà cung cấp.
Khả năng co giãn giúp cho nhà cung cấp sử dụng tài nguyên hiệu quả, tận dụng triệt để tài nguyên dư thừa, phục vụ được nhiều khách hàng. Đối với người sử dụng dịch vụ, khả năng co giãn giúp họ giảm chi phí do họ chỉ trả phí cho những tài nguyên thực sự dùng.
Hệ thống Cloud Computing tự động kiểm soát và tối ưu hóa việc sử dụng tài nguyên (dung lượng lưu trữ, đơn vị xử lý, băng thông…). Lượng tài nguyên sử dụng có thể được theo dõi, kiểm soát và báo cáo một cách minh bạch cho cả hai phía nhà cung cấp dịch vụ và người sử dụng.
4. Mô hình tổng quát của điện toán đám mây
Theo định nghĩa, các nguồn điện toán khổng lồ như phần mềm, dịch vụ ... sẽ nằm tại các máy chủ ảo (đám mây) trên Internet thay vì trong máy tính gia đình và văn phòng (trên mặt đất) để mọi người kết nối và sử dụng mỗi khi họ cần.
Hình 1.4: Minh họa về cloud computing
Hiện nay, các nhà cung cấp đưa ra nhiều dịch vụ của cloud computing theo nhiều hướng khác nhau, đưa ra các chuẩn riêng cũng như cách thức hoạt động khác nhau. Do đó, việc tích hợp các cloud để giải quyết một bài toán lớn của khách hàng vẫn còn là một vấn đề khó khăn. Chính vì vậy, các nhà cung cấp dịch vụ đang có xu hướng tích hợp các cloud lại với nhau thành “sky computing”, đưa ra các chuẩn chung để giải quyết các bài toán lớn của khách hàng.
Hình 1.5: Mô hình tổng quan của cloud computing
Điện toán đám mây thường được phân loại làm ba loại đám mây chính, theo vị trí của đám mây là: đám mây công cộng (public cloud), đám mây riêng (private cloud), đám mây lai (hybrid cloud).
Hình 1.6 Các loại hình điện toán đám mây
Đám mây công cộng là những đám mây mở cho người dùng mà ứng dụng lưu trữ, các nguồn tài nguyên khác có sẵn và được cung cấp bởi một số nhà cung cấp dịch vụ thông qua mạng Internet. Một số các nhà cung cấp dịch vụ như: Google, Amazon, Microsoft…
Các đám mây công cộng cung cấp tiềm năng tốt nhất về hiệu quả chi phí, nhưng vấn đề bảo mật dữ liệu chỉ cung cấp trên danh nghĩa dựa vào các phần hỗ trợ sẵn có. Đám mây công cộng thường tính lệ phí sử dụng hàng tháng cho mỗi sử dụng kết hợp với phí chuyển băng thông, người dùng có thể mở rộng lưu trữ theo yêu cầu và sẻ không tốn chi phí mua phần cứng lưu trữ.
Hình 1.7. Mô hình Public Cloud
Đám mây cục bộ còn được gọi là: “điện toán đám mây nội bộ” hay “đám mây riêng” là thế hệ tiếp theo của ảo hóa. Trong đám mây cục bộ cơ sở hạ tầng điện toán đám mây chỉ hoạt động cho một tổ chức duy nhất không chia sẻ cho các tổ chức khác cho dù quản lý nội bộ hoặc bởi một bên thứ ba và lưu trữ trên máy nội bộ hay bên ngoài. Đám mây cục bộ tương tự như ảo hóa ở mức độ máy chủ, máy trạm và ứng dụng, điện toán đám mây cục bộ có tính năng nâng cao, thu hút nhiều doanh nghiệp. Điển hình là mô hình dịch vụ đám mây riêng của Google và Amazon.
Hình 1.8. Private Cloud và Public Cloud
Điện toán đám mây lai là một thành phần của hai hoặc nhiều đám mây (cục bộ, hoặc công cộng) với nhiều nhà cung cấp nội bộ/ bên ngoài, do đó chúng thừa kế được lợi ích và các tính năng cốt lõi của cả hai loại hình đám mây.
Ngoài ra, gần đây có thêm một mô hình điện toán đám mây cộng đồng (Community Cloud).Mô hình này thực chất là các đám mây riêng có hạ tầng, cấu hình hoàn toàn giống nhau được kết nối với nhau.
Hình 1.9.Đám mây lai
(còn tiếp )
» Tin mới nhất:
» Các tin khác: