Phân tích dữ liệu lớn thường bắt đầu với thu thập và phân tích “dữ liệu có cấu trúc” nội bộ được lưu trong cơ sở dữ liệu của công ti cho nên các kĩ năng bạn cần là: Quản trị cơ sở dữ liệu, học máy, và khai phá dữ liệu (những kĩ năng này thường được dạy trong chương trình Quản lí hệ thông tin). Bước tiếp là thu thập và phân tích dữ liệu “phi cấu trúc” bên ngoài từ các nguồn khác như Internet. Bởi vì những dữ liệu này là phi cấu trúc và không được xác định, bạn không thể dùng các công cụ hiện có của cơ sở dữ liệu và khai phá dữ liệu mà cần công nghệ khác được thiết kế để giải quyết chúng như cơ sở dữ liệu NoSQL database, Hadoop và MapReduce.
» Tin mới nhất:
» Các tin khác: