Site logo
Tác giả
  • avatar Nguyễn Đức Xinh
    Name
    Nguyễn Đức Xinh
    Twitter
Ngày xuất bản
Ngày xuất bản

AWS Snow Family & Snowball: Chuyển dữ liệu khối lượng lớn và xử lý tại Edge

1. Giới thiệu

Trong thời đại dữ liệu bùng nổ, nhiều doanh nghiệp cần di chuyển hàng chục terabyte đến hàng petabyte dữ liệu lên AWS để phục vụ phân tích, lưu trữ, backup hoặc Migrate hệ thống.
Việc upload trực tiếp qua Internet đôi khi:

  • Mất nhiều ngày hoặc vài tuần
  • Bị giới hạn băng thông
  • Không đảm bảo ổn định
  • Có rủi ro gián đoạn dịch vụ

AWS Snowball ra đời để giải quyết vấn đề này.

AWS Snowball là thiết bị phần cứng do AWS cung cấp, cho phép doanh nghiệp chuyển dữ liệu lớn vào/ra AWS bằng đường vật lý, nhanh hơn và an toàn hơn nhiều so với upload qua mạng.

Hiểu đơn giản:
AWS gửi cho bạn một hộp Snowball → bạn copy dữ liệu vào → gửi lại cho AWS → AWS nhập dữ liệu vào S3.

Snow family

⚠️ Cập nhật trạng thái quan trọng (2024–2025):
Khi bạn vào AWS Console → Snow FamilyCreate Job, bạn có thể gặp thông báo:
"AWS Snowball Edge is no longer available to new customers. New customers should explore AWS DataSync for online transfers, AWS Data Transfer Terminal for secure physical transfers, or AWS Partner solutions. For edge computing, explore AWS Outposts."

Nghĩa là AWS đang dừng nhận khách hàng mới cho Snowball Edge và định hướng sang các dịch vụ thay thế. Tuy nhiên, AWS Snow Family vẫn xuất hiện trong đề thi chứng chỉ (Cloud Practitioner, Solutions Architect Associate/Professional). Vì vậy bài viết này vẫn rất cần thiết để hiểu khái niệm và làm bài thi, đồng thời nắm được các dịch vụ thay thế hiện đạiphần 6.4phần 8.

1.1. AWS Snow Family gồm những gì?

AWS Snow Familynhóm thiết bị phần cứng (physical devices) giúp di chuyển dữ liệu vào/ra AWS và xử lý dữ liệu tại edge (biên) ở những nơi mạng kém hoặc không có Internet. Họ thiết bị này gồm 3 thành viên chính, phân theo dung lượng và khả năng tính toán:

Thiết bị Dung lượng tiêu biểu Edge compute Đối tượng sử dụng
AWS Snowcone 8 TB (HDD) / 14 TB (SSD) Nhẹ (2 vCPU, 4 GB RAM) Nhỏ gọn, di động, cầm tay, IoT, drone
AWS Snowball Edge 42 TB – 210 TB Mạnh (EC2 + Lambda, có tùy chọn GPU) Doanh nghiệp vừa & lớn, migrate hàng loạt
AWS Snowmobile tới 100 PB / container Không Tập đoàn siêu lớn (exabyte-scale)

📌 Ghi nhớ cho kỳ thi: thứ tự dung lượng tăng dần là Snowcone → Snowball Edge → Snowmobile. Khi đề thi hỏi "dữ liệu vài chục TB ở vùng không có Internet" → Snowball/Snowcone; "hàng chục petabyte trở lên" → Snowmobile; "dữ liệu nhỏ + edge + di động" → Snowcone.

Snowball Edge lại có 2 biến thể:

  • Snowball Edge Storage Optimized – tối ưu lưu trữ (~80 TB dùng được), hợp với migrate dữ liệu thuần.
  • Snowball Edge Compute Optimized – ~42 TB nhưng mạnh về tính toán (nhiều vCPU, tùy chọn GPU), hợp với xử lý/AI tại edge.

🛈 Snowmobile là xe container 45 feet (xe tải 18 bánh) kéo theo, dùng cho dự án di chuyển petabyte → exabyte. Đây cũng là dịch vụ đã được AWS thu hẹp; trong thi cử chỉ cần nhớ "Snowmobile = exabyte-scale, dùng xe tải".

2. Các tính năng nổi bật của AWS Snowball

2.1 Thiết bị phần cứng chống va đập, bảo mật cao

Snowball được thiết kế theo chuẩn công nghiệp:

  • Chống bụi, chống nước, chịu được môi trường khắc nghiệt
  • Hỗ trợ giao diện 10Gbps và 40Gbps
  • Dữ liệu mã hóa AES-256
  • Khóa mã hóa lưu trong AWS KMS, không nằm trong thiết bị
  • Nếu thiết bị bị phá, dữ liệu vẫn an toàn

2.2 Dung lượng lớn: 80 TB – 210 TB

Có hai loại thiết bị:

  • Snowball Edge Storage Optimized – tối ưu lưu trữ, ~80 TB dùng được
  • Snowball Edge Compute Optimized – ~42 TB, thêm khả năng chạy EC2 & Lambda tại edge

Đủ cho phần lớn nhu cầu di chuyển dữ liệu lớn.

2.3 Hỗ trợ Edge Computing (tính toán tại biên)

Snowball Edge có thể:

  • Chạy EC2 instance
  • Chạy AWS Lambda Functions
  • Lưu trữ cục bộ

Ứng dụng trong môi trường không kết nối Internet hoặc môi trường biên (edge).

2.4 Tương thích với S3 và file system

Snowball hỗ trợ:

  • S3-compatible API
  • File interface (NFS)

Giúp DevOps và developer dễ dàng upload dữ liệu từ server, hệ thống backup, hoặc data lake.

2.5 Tự động theo dõi và quản lý

Bạn có thể theo dõi:

  • Tình trạng đơn hàng
  • Vị trí vận chuyển
  • Trạng thái thiết bị
  • Tiến độ import/export dữ liệu

qua AWS Console hoặc Snowball API.

3. Các Use Case thông dụng

3.1 Di chuyển dữ liệu khối lượng lớn lên AWS (Data Migration)

Khi doanh nghiệp Migrate:

  • kho dữ liệu (data warehouse)
  • hệ thống lưu trữ nội bộ
  • log server
  • multimedia files (ảnh, video, audio)

Snowball giúp rút ngắn thời gian chuyển từ vài tuần → vài ngày.

3.2 Backup dữ liệu lớn

Thay vì sao lưu qua mạng Internet:

  • Các trung tâm nghiên cứu
  • Công ty sản xuất video 4K/8K
  • Doanh nghiệp cần lưu trữ cold data

có thể backup lên Snowball và gửi về AWS.

3.3 Chuyển dữ liệu từ vùng xa hoặc hạn chế kết nối

Tại:

  • Giàn khoan dầu
  • Nhà máy sản xuất
  • Tàu biển
  • Khu vực núi rừng
  • Nông trại IoT
  • Sự kiện lưu động

Snowball Edge cho phép:

  • thu thập dữ liệu
  • xử lý tại chỗ
  • đồng bộ về AWS sau

3.4 Machine Learning / Analytics tại Edge

Snowball Edge Compute Optimized hỗ trợ EC2 + GPU, dùng cho:

  • Phân tích video tại hiện trường
  • AI/ML inference
  • Xử lý IoT real-time

Trước khi đồng bộ kết quả về AWS.

4. Best Practices khi sử dụng AWS Snowball

4.1 Lập kế hoạch băng thông nội bộ

Mặc dù tốc độ Internet bị loại bỏ, bạn vẫn cần:

  • mạng nội bộ (LAN) đủ nhanh
  • cáp 10Gbps hoặc 40Gbps
  • phân bổ thời gian copy hợp lý

4.2 Nén và tổ chức dữ liệu trước

Tối ưu thời gian & dung lượng:

  • Loại bỏ file trùng
  • Nén dữ liệu (ZIP, TAR)
  • Gom file lớn thay vì hàng triệu file nhỏ

4.3 Sử dụng AWS CLI hoặc S3 API

Tránh copy thủ công.
Dùng:

aws s3 cp
aws s3 sync

hoặc Snowball client để tăng tốc.

4.4 Theo dõi trạng thái thiết bị

Luôn kiểm tra:

  • đèn tín hiệu
  • thông tin vận chuyển
  • logs của Snowball client

4.5 Mã hóa & quyền truy cập

Dữ liệu luôn được mã hóa tự động, nhưng vẫn cần:

  • Quản lý keys trong AWS KMS
  • Phân quyền IAM hợp lý
  • Giới hạn quyền người thao tác thiết bị

4.6 Kiểm tra Integrity trước khi gửi lại

AWS Snowball hỗ trợ checksum để đảm bảo dữ liệu không bị lỗi.

5. Pricing (Chi phí)

Chi phí Snowball bao gồm:

Hạng mục Mô tả
Thiết bị Snowball Edge Phí thuê theo từng thiết bị
Phí vận chuyển Tùy quốc gia/khu vực
Phí import/export dữ liệu Miễn phí khi nhập vào S3
Phí lưu trữ S3 sau khi upload Tính theo mức giá của S3
Ngày sử dụng thiết bị tại chỗ (usage days) Tính phí sau một số ngày miễn phí

Lưu ý:

  • Snowball rẻ hơn rất nhiều so với upload hàng trăm TB qua Internet, đặc biệt khi băng thông hạn chế.
  • AWS miễn phí import dữ liệu vào S3, nhưng export thì có phí.

6. So sánh AWS Snowball với các dịch vụ tương tự

6.1 Snowball vs Snowmobile

Tiêu chí Snowball Snowmobile
Dung lượng 80–210 TB mỗi thiết bị 45 PB mỗi container
Đối tượng Doanh nghiệp vừa & lớn Tập đoàn siêu lớn
Hình thức Thiết bị nhỏ gọn Xe container 18 bánh

Snowmobile dành cho dự án over petabytes đến exabytes.

6.2 Snowball vs AWS DataSync

Tiêu chí Snowball DataSync
Loại Chuyển dữ liệu qua thiết bị vật lý Chuyển dữ liệu qua mạng Internet
Tốc độ Nhanh, không phụ thuộc Internet Tùy thuộc băng thông
Use case Rất nhiều TB → PB Dữ liệu vài TB hoặc liên tục

DataSync dùng cho chuyển dữ liệu online, không phù hợp cho dữ liệu quá lớn.

6.3 Snowball vs Direct Connect

Tiêu chí Snowball Direct Connect
Mục đích Transfer một lần, khối lượng lớn Kết nối mạng chuyên dụng, ổn định lâu dài
Chi phí Thấp hơn khi chuyển lượng lớn Cao hơn, phù hợp kết nối liên tục

6.4 Snow Family vs Data Transfer Terminal (dịch vụ thay thế mới)

AWS Data Transfer Terminal là dịch vụ mới được AWS giới thiệu để thay thế cho luồng "chuyển dữ liệu vật lý" của Snow Family với khách hàng mới. Thay vì AWS gửi thiết bị về cho bạn, bạn mang ổ cứng/thiết bị của mình đến một địa điểm vật lý của AWS (terminal) và upload trực tiếp vào AWS qua kết nối tốc độ cao tại đó.

Tiêu chí Snow Family (Snowball/Snowcone) Data Transfer Terminal
Mô hình AWS gửi thiết bị → bạn copy → gửi lại Bạn mang dữ liệu đến điểm AWS upload
Khách hàng mới Không còn nhận (Snowball Edge) Có — đây là hướng thay thế
Tốc độ upload Phụ thuộc vận chuyển thiết bị Rất cao tại terminal (đường truyền AWS)
Phù hợp Vùng xa, edge computing Khi có thể di chuyển dữ liệu đến terminal

🧭 Cây quyết định nhanh (decision tree):

  • Dữ liệu online, băng thông ổn → AWS DataSync.
  • Cần upload vật lý tốc độ cao và có thể tới điểm AWS → Data Transfer Terminal.
  • Cần edge computing tại chỗ → AWS Outposts (hoặc Snowball Edge nếu là khách hàng cũ).
  • Dữ liệu exabyte-scale → liên hệ AWS Partner solutions.

7. Kết luận

AWS Snowball là giải pháp lý tưởng cho các doanh nghiệp cần chuyển lượng dữ liệu rất lớn vào hoặc ra khỏi AWS mà không thể dựa vào Internet.
Với thiết bị an toàn, bền bỉ, tốc độ copy cao và khả năng hỗ trợ edge computing, Snowball giúp rút ngắn thời gian Migrate dữ liệu từ vài tuần → vài ngày, đồng thời đảm bảo bảo mật tuyệt đối.

Snowball đặc biệt phù hợp cho:

  • Migrate hệ thống lớn
  • Backup dữ liệu
  • Dự án tại môi trường không có Internet
  • Machine learning tại biên
  • Edge computing công nghiệp

8. Cập nhật 2024–2025 — Lựa chọn thay thế và tips thi chứng chỉ

8.1 Vì sao bài viết vẫn quan trọng dù Snowball Edge ngừng nhận khách mới?

AWS đã dừng nhận khách hàng mới cho Snowball Edge và thu hẹp Snowmobile, nhưng:

  • Snow Family vẫn nằm trong syllabus của các kỳ thi: AWS Certified Cloud Practitioner (CLF-C02), Solutions Architect – Associate (SAA-C03), và Professional. Đề thi vẫn hỏi tình huống "migrate petabyte dữ liệu khi băng thông hạn chế".
  • Khách hàng đang sử dụng (existing customers) vẫn tiếp tục dùng được dịch vụ.
  • Hiểu Snow Family giúp bạn so sánh và chọn đúng giữa các dịch vụ migration của AWS — đây chính là dạng câu hỏi phổ biến nhất trong đề thi.

8.2 Bảng các dịch vụ thay thế chính thức

Khi tạo job mới, AWS gợi ý các hướng thay thế sau:

Nhu cầu Dịch vụ thay thế được AWS khuyến nghị
Online transfer (qua mạng) AWS DataSync
Physical transfer an toàn AWS Data Transfer Terminal
Edge computing AWS Outposts
Quy mô rất lớn / nhu cầu đặc thù AWS Partner solutions

8.3 Những điểm dễ "bẫy" trong đề thi

  • Snowball vs DataSync: từ khóa quyết định là băng thông Internet. Băng thông tốt và cần đồng bộ liên tục → DataSync; băng thông yếu / dữ liệu cực lớn / one-time → Snowball.
  • Snowball vs Snowmobile: ranh giới ở ~10 PB. Dưới ~10 PB thường dùng nhiều Snowball; trên đó (hàng chục PB → EB) mới cân nhắc Snowmobile.
  • Snowcone: nhớ đây là thiết bị nhỏ nhất, di động (portable), có thể chạy bằng pin, hợp drone/IoT/xe di động — khác với Snowball Edge cồng kềnh hơn.
  • Edge computing: Snowball Edge Compute Optimized chạy được EC2 + Lambda ngay tại chỗ khi không có kết nối AWS — đây là khác biệt then chốt so với DataSync (vốn cần mạng).
  • Bảo mật: dữ liệu luôn mã hóa AES-256, khóa quản lý trong AWS KMS (không lưu trên thiết bị) — câu hỏi bảo mật hay xoáy vào điểm này.

8.4 Checklist ôn nhanh trước ngày thi

  • [ ] Thuộc thứ tự dung lượng: Snowcone < Snowball Edge < Snowmobile.
  • [ ] Phân biệt Storage Optimized (lưu trữ) vs Compute Optimized (tính toán/edge).
  • [ ] Nhớ Snow Family = offline/physical, DataSync = online.
  • [ ] Nhớ mã hóa AES-256 + KMS.
  • [ ] Nhớ các dịch vụ thay thế: DataSync, Data Transfer Terminal, Outposts, Partner.

Tham khảo thêm