Overview
Amazon Athena is an interactive, serverless query service that lets you analyze data directly in Amazon S3 using standard SQL. You don’t need to set up or manage any infrastructure, and you only pay for the queries you run.
Amazon Athena là dịch vụ truy vấn tương tác, không cần máy chủ, giúp bạn phân tích dữ liệu trực tiếp trên Amazon S3 bằng SQL chuẩn. Bạn không cần thiết lập hoặc quản lý cơ sở hạ tầng nào, và chỉ phải trả phí dựa trên số lượng truy vấn mà bạn chạy.
Key Features
- Serverless, zero administration: không cần quản lý máy chủ hoặc cluster – Athena tự động quản lý tài nguyên.
- Standard SQL querying: sử dụng Presto / Trino để chạy truy vấn SQL ANSI với join, window function, mảng, …
- Support for many data formats: hỗ trợ CSV, JSON, ORC, Avro, Parquet, …
- Federated query: có connector để truy vấn dữ liệu từ nhiều nguồn (như Redshift, DynamoDB, các nguồn on-prem hoặc đám mây khác) mà không cần di chuyển dữ liệu.
- Pay-per-query pricing: chỉ trả tiền cho lượng dữ liệu scan mỗi truy vấn, hoặc sử dụng mô hình capacity-based nếu muốn kiểm soát concurrency.
- Fast performance: thực thi truy vấn song song, tối ưu hoá cho S3 để có đáp ứng nhanh ngay cả với dataset lớn.
- Highly available & durable: sử dụng nhiều vùng khả dụng, dữ liệu lưu trên S3 có độ bền cao.
- Secure: kiểm soát truy cập qua IAM, S3 bucket policy, ACL; hỗ trợ dữ liệu mã hóa và kết quả mã hóa.
- Integrated with AWS Glue: dùng Glue Data Catalog để quản lý metadata, phân vùng, và schema bảng.
- Machine learning in SQL: có thể gọi mô hình SageMaker ngay trong truy vấn SQL để chạy inference.
- Built-in Spark support: Athena hỗ trợ Apache Spark để chạy phân tích tương tác nếu bạn cần xử lý phức tạp hơn.
- Data sources
- SQL queries
- Notebooks
- Workflows
- Workgroups
Links
Related Services
Amazon VPC
Network isolation and security
Elastic Load Balancing
Distribute incoming traffic
Amazon EBS
Persistent block storage volumes
