Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/kyopark2014/aws-athena
It decribes how to use aws athena for data analytics
https://github.com/kyopark2014/aws-athena
aws aws-athena query sql
Last synced: 4 days ago
JSON representation
It decribes how to use aws athena for data analytics
- Host: GitHub
- URL: https://github.com/kyopark2014/aws-athena
- Owner: kyopark2014
- Created: 2022-08-13T01:58:09.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2022-08-13T03:41:20.000Z (over 2 years ago)
- Last Synced: 2024-04-08T16:19:00.097Z (10 months ago)
- Topics: aws, aws-athena, query, sql
- Homepage:
- Size: 31.3 KB
- Stars: 2
- Watchers: 3
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# AWS Athena
Athena는 서버리스 환경에서 Data Lake를 위한 interative query를 제공합니다.
![image](https://user-images.githubusercontent.com/52392004/184464605-c71155b2-b466-42e1-86e7-a17358322b25.png)
## 특징
#### Simplicity
- serverless이므로 초기 설정이나 인프라 비용이 발생하지 않습니다.
- SQS를 이용해 S3와 저장된 데이터를 query할 수 있습니다.
- JDBC/ODBC driver들을 제공합니다.#### Pay per query
- 데이터를 scan할때에만 비용이 발생합니다.
- 압축을 통해 30-90%의 query비용을 절감할 수 있습니다.#### Decouple storage and compute
- 데이터저장소와 Query를 위한 인프라가 분리되어 있습니다.
- S3, Data warehouse와 database에 대한 Query를 제공합니다.
- 다양한 custom 데이터나 포맷에 호환가능합니다.#### Security
- 전송(Transit)에서 암호화합니다.
- AWS IAM 및 SALv2에 대한 인증을 제공합니다.
- AWS PrivateLinke를 지원합니다.## 일반적인 사용 패턴
[Common Patterns](https://github.com/kyopark2014/aws-athena/blob/main/common-patterns.md)에서는 Athena를 사용하는 패턴에 대해 설명합니다.
## Federated Query
[Federated Query](https://github.com/kyopark2014/aws-athena/blob/main/federated-query.md)에서는 Athena를 통해 S3와 같은 AWS service뿐 아니라, on-premise나 다른 cloud 데이터 소스를 query 하는 방법에 대해 소개합니다.
## Simple pricing
- DDL operations - Free
- SQL operations - Free
- Query concurrency - Free
- Data scanned - $5 / TB## 지원하는 데이터 포맷
ANSI SQL을 지원하는 Presto engine을 이용하여 SQL query를 수행하며, 지원하는 포맷은 아래와 같습니다.
- CSV
- Apache Weblogs
- JSON
- Parquet
- ORC## Reference
[Amazon Athena](https://aws.amazon.com/athena/?nc1=h_ls&whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc)
[MakeMyTrip: Leveraging Athena Federated Query to break data silos], Reinvent 2021 ANA301
[How to use SQL to Query S3 files with AWS Athena | Step by Step Tutorial](https://www.youtube.com/watch?v=M5ptG0YaqAs)
[Amazon Athena에 대해 알아보기](https://www.youtube.com/watch?v=MAgd-zeB4QU)