๐คทโ๏ธ About This Article
ํด๋น ์ํฐํด์ ์๋ 2020๋ 12์, 2021๋ ์ ๊ฒฝ์์ ๋ต๊ณผ 2020๋ ์ ํ๊ณ ๋ฅผ ํ์๋ ์ค๋์ ์์ ํค๋ ธํธ๋ฅผ ๋ฆฌ๋ทฐํฉ๋๋ค. ์ ํธ์ด ๊ถ๊ธํ์ ๋ถ์ ์๋ ๋งํฌ๋ฅผ ์ฐธ๊ณ ํด ์ฃผ์ธ์.
https://it-ist.tistory.com/231
์ ํ ์๊ฐ๋ฅผ ํ๋ฉฐ ๊ณ ๊ฐ ์ธ์ฌ์ดํธ๋ ์๊ฒฌ, ํ์ฌ ๊ณ ๊ฐ๋ค์ด ๋น๋ฉดํ๋ IT ๋ฆฌ์์ค ๊ด๋ฆฌ ๋ฐ ๊ฐ๋ฐ์์์ ์๋ก์ฌํญ๋ค์ ๋จผ์ ์๊ฐํ๊ณ ๊ทธ๋ฅผ ํด๊ฒฐํ๋ Problem-Solution ํ์์ผ๋ก ์ ํ์ ์๊ฐํ๋ค๋ ๊ฒ. Amazon์ ์ 1 ๋ฆฌ๋์ญ ์์น์ธ Customer obsession์ด ๊ฐํ๊ฒ ๋ น์์ ธ ์๋ ์คํผ์น์ ๋๋ค. ์ค๋ ์ ์์ ์ ํ ๋ฐํ๊ฐ ํ๋์ฉ ๋๋ ๋๋ง๋ค ์ฒญ์ค์ ๋ฐ์๋ AWS์ ์ ์ ํ
โ Summary (Cont.)
2) Reinventing Data Stores
io2 Block Express
- Problem: SAN ์คํ ๋ฆฌ์ง๋ฅผ ํด๋ผ์ฐ๋ ํ๊ฒฝ์์ ์ฌ์ฉํ๊ณ ์ถ์
- Solution: io2 Block Express, SAN ์คํ ๋ฆฌ์ง๋ฅผ ํด๋ผ์ฐ๋ ์์์ ์ฌ์ฉ ๊ฐ๋ฅ(์ ๊ณ ์ต์ด์ ํ), SAN ์คํ ๋ฆฌ์ง๋ฅผ ๋น์ฉ์ด๋ ๊ด๋ฆฌ ๋ฑ์ ๋ค์ด๊ฐ๋ ๋ณ๋์ ๊ณ ๋ฏผ์์ด ๊ฐํธํ๊ฒ ์ด์ฉ ๊ฐ๋ฅ, ๊ธฐ์กด ์ ํ ๋๋น 4๋ฐฐ ์ด์์ IOPS(256,000, 4,000MB/s) ์ง์
Amazon Aurora
- Problem: ์จํ๋ ๋ฏธ์ค ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ๊ตฌ์ถ, ์ด์ํ๊ณ ํจ์น ๋ฐ fault tolerance ๋ฑ์ ๊ด๋ฆฌํ๋ ค๋ฉด ์๋ง์ ์ธ๋ ฅ์ ๊ณ ์ฉํด์ผํ๋ ์ํฌ๋ก๋ ๋ฐ์, AWS๊ฐ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์๋น์ค๋ฅผ ์ถ์ํ์ผ๋ ์ค๋๋ ์๋ ๋๋ถ๋ถ์ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์ค๋ผํด ๋ฐ MS SQL ๊ณผ ๊ฐ์ incumbent relational databases๋ฅผ ์จํ๋ ๋ฏธ์ค ํ๊ฒฝ์์ ์ด์ํ๊ณ ์๊ณ ๊ณ ๊ฐ์ ์ด์ ๋น์ฉ ๋ฐ์
์ฌ๊ธฐ์ ๋ง์ดํฌ๋ก์ํํธ๊ฐ MS SQL ์๋ฒ๋ฅผ MS ํด๋ผ์ฐ๋ ํ๊ฒฝ์์๋ง ์ด์ฉํ ์ ์๊ฒ ์ค์ ํด๋์ ๊ฒ์ "๊ธฐ์ ์๊ฒ ์ ๋ฆฌํ๊ณ ๊ณ ๊ฐ์๊ฒ ์ ๋ฆฌํ์ง ์์ ํํ"๋ผ๊ณ ์์ฌ์ ๊ณ ๊ฐ์ค์ฌ์ ์ ํ๊ฐ๋ฐ ๋ฐฉ์๊ณผ ๋น๊ตํ๋๋ฐ ์ฌ์ค ๊ฐ์ธ์ ์ผ๋ก ๊ณต์ ์ธ ์๋ฆฌ์์ ์ ๋๋ผํ ๋น๊ต๋ฅผ ํด์ ๊น์ง ๋๋ ใ ใ
AWS๋ ํ์ฌ ๋๋น ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก long-term ์์ ๊ณ ๊ฐ๊ณผ ๊ด๊ณ๋ฅผ ์ค์ ํ๊ณ ์ ํ๋ฉฐ ๊ณ ๊ฐ์ด ๋ ๋ฎ์ ๋น์ฉ์ผ๋ก ํจ์จ์ ์ผ๋ก ์ ํ์ ์ฌ์ฉํ๊ฒ๋ ๋๋ ํ์ฌ๋ผ๋ ๊ฒ์ ๊ฐ์กฐ.
- Solution: ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์๋น์ค Amazon Aurora, MySQL๊ณผ PostgreSQL๊ณผ ์ํธํธํ ๊ฐ๋ฅํจ, ํ์ฌ์ ํ ๋๋น 10๋ถ์ 1 ์ ๋ ๊ฐ๊ฒฉ์ผ๋ก ์ด์ฉ ๊ฐ๋ฅ, ์์คํธ๋ก์ ๋ค์นด, ๋ฒ๋ผ์ด์ฆ, ์์ด๋น์๋น, ์ด๋๋น, ์ผ์ฑ, ํ๋ฃจ, ๋ ๋ง, ์๋, ์ ๋ฐ์คํฌ, ํฌ์ผ๋ชฌ๊ณ ๋ฑ์ด ์๋ง์กด ์ค๋ก๋ผ๋ฅผ ์ฌ์ฉํจ
- Amazon Aurora Serverless: ์๋ง์กด ์ค๋ก๋ผ๋ฅผ Auto-scaling configuration ์ง์, ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ธ์คํด์ค๋ฅผ ๊ด๋ฆฌํ ํ์ ์์ผ๋ฉฐ 5-50์ด ์ด๋ด๋ก ์ค์ผ์ผ ์์ฒญ ์ฒ๋ฆฌ
- Amazon Aurora Serverless v2: ํผํฌ ์ํ์์ ์๋ง์กด ์ค๋ก๋ผ๋ฅผ ์ด์ํ๋ ๊ฒ ๋๋น ํด๋น ์ ํ ๋์ ์ 90% ๋น์ฉ ์ ๊ฐ
Babelfish for Amazon Aurora Postgres
- Problem: ์ต๊ทผ ๋ช๋ ๋์ 350,000 ์ฌ๊ฐ์ ๋ฐ์ดํฐ ๋ฐฐ์ด์ค๊ฐ AWS๋ก ๋ง์ด๊ทธ๋ ์ด์ ํจ, ์ด ๊ณผ์ ์์ AWS์ database migration service๋ฅผ ์ด์ฉํ๋๋ฐ ๊ณผ๊ฑฐ ํ์ฌ ์ ํ์ ์ค๋๋ ์๊ตฌ DB์ ์ข ์๋ ์ฝ๋๋ฅผ ์ฒ๋ฆฌํ๋๋ฐ ๊ณ ๊ฐ๋ค์ ์ด๋ ค์ ๋ฐ์
- Solution T-SQL๊ณผ MS Postgres ์คํค๋ง๋ฅผ ์ดํดํ๋ ๋ฐ๋ฒจํผ์๋ฅผ ์ด์ฉํด์ ์ฌ์ฉํ๋ ์ฝ๋๋ฅผ ๊ฑฐ์ ์์ ์์ด Amazon Aurora๋ก ์ด์ ๊ฐ๋ฅํจ.
- Babelfish for PotgreSQL (์คํ์์ค) : ์ํ์น 2.0 ๋ผ์ด์ผ์ค ์ด์ฉ, ๊ธฐ์กด ์๊ตฌ SQL ์๋ฒ๋ก๋ถํฐ ์คํ์์ค๋ก ์ด์ ํ๋๋ฐ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋จ
AWS Glue Elastic Views
- Problem: THE RIGHT TOOL FOR THE RIGHT JOB๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ํญ์ ๋ต์ธ๊ฒ๋ง์ ์๋, ์ฉ๋์ ๋ฐ๋ผ ๋ค๋ฅธ ๋ฐ์ดํฐ ๋ฒ ์ด์ค(DynamicDB, Redshift ๋ฑ)๊ฐ ํ์ํ ๋๊ฐ ์์.์ด๋ฌํ ์ฌ๋ฌ DB ๊ฐ Data movement๊ฐ ์ฝ์ง ์์
- ์ฌ๋ฌ ์ธต์์ ๋ฐ์ดํฐ๊ฐ ์์ด๋ ํ์ฌ์ ๊ฒฝ์ฐ ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋๋ฌด ๋ณต์กํ๊ณ , ๋น์ธ๊ณ , ์ ์ ํ ํผํฌ๋จผ์ค๋ฅผ ๋ด์ง ๋ชปํจ.
- Solution: AWS Glue Elastic views, ์ฌ๋ฌ ๋ฐ์ดํฐ ์ ์ฅ์์์ ๋ฐ์ดํฐ ๊ด๋ฆฌ, ๋ฐ์ดํฐ๋ฅผ ํฉ์น๊ณ ๋ณต์ ํ๋ ๊ฒ์ด ์์ ๋ก์์ง
SQL ๋ช ๋ น์ด๋ฅผ ์ ๋ ฅํ์ฌ ๋ฒ์ถ์ผ ํ ์ด๋ธ์ ๋ง๋ค๊ณ ํ๊ฒ ๋ฐ์ดํฐ ์คํ ์ด๋ก ๋ณต์
๊ฐ์ธ์ ์ผ๋ก ์ด ํค๋ ธํธ์์ ์ ์ผ ํ๋ณด๊ณ ์ถ๊ณ ์๋ ๊ฒ ๊ฐ๋ค๊ณ ์๊ฐํ ์ ํ!
์ด์ ํ์ฌ์์ ๋ฐ์ดํฐ ๋ ์ดํฌ ๋ฐ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถํ ๋ ๊ฐ ๊ณ ๊ฐ์ฌ์ ์จํ๋ DB ์ ๋ฐ๋ผ ๊ต์ฅํ ๊ตฌ์ฑ์ด ์ ํ๋๊ณค ํ์๊ธฐ ๋๋ฌธ์ด๋ค.
์ด ์ ํ์ด ์์ผ๋ฉด ๋ฐ์ดํฐ ๋ ์ดํฌ ๊ตฌ์ฑ์ ์์ด์ ์์ฒญ ์ ์ฐํ๊ฒ ์ต์ ์ ์ ํํ ์ ์์๋ฏ
3) Reinventing Machine Learning
- Amazon SageMaker๋ ํ ์ํ๋ก์ฐ์๋ง ์ง์คํ๋ ํ์ฌ์ ๋ฌ๋ฆฌ TensorFlow, Pytouch, MXNET ๋ชจ๋ ํ๋ ์์ํฌ์ ์ต์ ํ๋์ด ์์
- SageMaker Studio๋ ๋ ธํธ๋ถ, ๋๋ฒ๊ฑฐ, ์คํ ํ์ผ๋ฟ ๋ฑ ๋จธ์ ๋ฌ๋ ๊ฐ๋ฐ ํ๊ฒฝ ์ผ์ฒด์ ๊ธฐ๋ฅ์ ์ง์ํจ
Amazon SageMaker Data Wrangler
- Problem: ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ(๋ฐ์ดํฐ ์ค๋น)๊ฐ ๋๋ฌด ์ด๋ ค์, ์๋ก ๋ค๋ฅธ ํฌ๋งท์ ์ค๊ตฌ๋๋ฐฉ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌ(Featuer engineering)ํ๋๋ฐ ๋ง์ ์๊ฐ์ด ๋ค์ด๊ฐ
- Solution(SageMaker Data Wrangler): ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ฅผ ๋น ๋ฅด๊ฒ ํ ์ ์์, ์ธํ ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ์ธ์ํ์ฌ ๋ชจ๋ธ ํ๋ จ์ ์ ํฉํ๋๋ก ์ ์ ํ ๋ณํ ๋๋ ๋ณํ ์ถ์ฒ
Amazon SageMaker Feature Store
- A New Repository for data used for ML predictions and inference
- ๋ฐ์ดํฐ ์ ์ฅ, ์ ๋ฐ์ดํธ, ML ํผ์ฒ๋ฅผ ๊ณต์ ํ๋๋ฐ ์ต์ ํ
- SageMaker Studio์์ ์ ๊ทผ ๊ฐ๋ฅ
- ์ด์ ์ง์ฐ์ผ๋ก ์ค์๊ฐ ์ถ๋ก ๋ฐ ์์ธก ์์ ์ด ๊ฐ๋ฅํจ
Amazon SageMaker Pipleline
- ML ์์ ์ ํนํ๋ CI/CD ์๋น์ค(Continuous integration and continuous delivery)
- end-to-end ML workflow, ๋ชจ๋ ์์ ๊ณผ์ ์ ํธ๋ํนํ๊ณ ์ค๋ง์ ๋๋ฆฌ๊ธฐ๋๋ฌธ์ troubleshooting์ด ์ฌ์์ง
Amazon DevOps Guru
- ML์ ์ฌ์ฉํด ํฅํ ๊ณ ๊ฐ์๊ฒ ์ํฅ์ ๋ฏธ์น ๋งํ ์ด์์์ ์ด์๋ฅผ ์์ธกํ๊ณ ์๋ณํจ
- SMS, Slack, Cloudwatch ๋ฑ์ผ๋ก ์๋ฆผ์ ์ค
- ๋ ๋ง์ ์ธํ์ ๋ฃ์์๋ก ์์ธก ๊ฒฐ๊ณผ๋ ์ ๊ตํ๋จ
Amazon Quicksight Q
- ์๋ฒ๋ฆฌ์ค BI Amazon Quicksight๋ฅผ ์์ฐ์ด ๋ช ๋ น์ผ๋ก ์ฌ์ฉํ ์ ์์
- ๊ฒ์๋์ ์์ฐ์ด๋ก ๋น์ฆ๋์ค ๋ฌธ์ ์ ๊ดํ ๋ช ๋ น์ ์ ๋ ฅํ๋ฉด ๊ด๋ จ๋ ์ธ์ฌ์ดํธ๊ฐ ๋ช์ด ๋ด๋ก ๋์ถ ๊ฐ๋ฅ (์: X์ Y ์ ํ์ ๋งค์ถ์ 12๊ฐ์ ๋ด ์งํ๋ก ๋น๊ตํด์ค)
- ๋ฅ๋ฌ๋, ์์ฐ์ด์ฒ๋ฆฌ, ์คํค๋ง ์ดํด, semantic parsing of SQL code generation์ ์ฌ์ฉ
- ์ฌ์ฉ์๋ ML์ ๋ํ ์ง์์ด ์์ด๋ ๋จ (ML ์์ฒด๋ฅผ ์ํ ์ ํ์ด ์๋ ๊ณ ๊ฐ์ ๋น์ฆ๋์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์ ํ)Reinventing Data Stores
- Problem: SAN ์คํ ๋ฆฌ์ง๋ฅผ ํด๋ผ์ฐ๋ ํ๊ฒฝ์์ ์ฌ์ฉํ๊ณ ์ถ์
- Solution: io2 Block Express, SAN ์คํ ๋ฆฌ์ง๋ฅผ ํด๋ผ์ฐ๋ ์์์ ์ฌ์ฉ ๊ฐ๋ฅ(์ ๊ณ ์ต์ด์ ํ), SAN ์คํ ๋ฆฌ์ง๋ฅผ ๋น์ฉ์ด๋ ๊ด๋ฆฌ ๋ฑ์ ๋ค์ด๊ฐ๋ ๋ณ๋์ ๊ณ ๋ฏผ์์ด ๊ฐํธํ๊ฒ ์ด์ฉ ๊ฐ๋ฅ, ๊ธฐ์กด ์ ํ ๋๋น 4๋ฐฐ ์ด์์ IOPS(256,000, 4,000MB/s) ์ง์