/users
/posts
/slides
/apps
/books
mysetting
/users
/posts
/slides
/apps
/books
12:31 5/31
www.kwangsiklee.com
12:31
www.kwangsiklee.com
KWANGSIK LEE’s log
http://www.kwangsiklee.com/
자바 스프링 성능을 다루는 블로그
저작도구: https://wordpress.org/?v=4.6.1
최종 피드 수집: 2024-11-12 19:47
전체 (94)
6d
AWS S3 사용 비용 튜닝하기
개요 최근 회사에서 S3 사용 비용이 꽤 많이 나와서 원인 분석 및 대응을 위해 진행해본 문제해결 과정을 정리해둔다. S3 발생 비용, 카테고리 구분 S3 비용은 크게 2가지로 나눌 수 있다. 사용 환경에 따라 종류별 비용의 비율
AWS
aws
finops
+ 더보기
s3
사용비용
0
0
0
읽기모드
8d
보험사에 3년간 데이터 엔지니어로 근무해본 후기
개요 필자는 보험사에 만 3년 동안 재직을 하였다가 이번에 이직을 하려고 한다. 이에 따라 3년간 무엇을 했는지 정리를 하고자 한다. 주로 한일은 AWS 기반으로 데이터 레이크를 1인 개발로써 완성하였는데 속도, 핵심기술력확보,
AWS
amazon
aws
+ 더보기
cloud
re:invent
summit
리인벤트
서밋
아마존
클라우드
0
0
0
읽기모드
1M
Dockerfile 빌드해서 ECR에 올리기
개요 Dockerfile을 직접 작성하여 AWS ECR에 등록하는 방법을 정리해둔다. Dockerfile FROM python:3.9 RUN pip install scikit-learn pandas baram ENTRYPOINT
ECR
Dockerfile
ecr
+ 더보기
registry
도커
0
0
0
읽기모드
3M
개요 AWS SNS를 통해 Slack 알림을 보낼일이 생겼다. 이방법을 찾아 본 뒤 막힐만한 부분만 따로 정리한다. 개념 요약 SNS Topic -> Lambda Function -> Slack Web hook 으로 알림 전송 슬
Slack
amazon
aws
+ 더보기
slack
sns
webhook
0
0
0
읽기모드
6M
AWS에서 Baram을 써보자.
개요 시중에 파이썬 코드로 AWS 서비스를 다루는 SDK로 boto3라는 훌륭한 패키지가 있다. 그러나 엔터프라이즈 환경에서 작업을 하려면 vanilla API만으로는 부족하고 추가적인 작업을 위한 코드 스니펫이 필요하였다. 이런
AWS
aws
baram
+ 더보기
cloud
Python
아마존
클라우드
파이썬
0
0
0
읽기모드
6M
Airflow Metastore 클렌징 하기
개요 필자는 Airflow를 AWS환경에서 MWAA 환경으로 사용중이다. MWAA 사용 기간이 늘어남에 따라 자연스럽게 Dag 생성/삭제가 반복 되었는데 문제는 소스코드 상에서는 분명히 지워졌는데 Web UI에서는 계속 dag c
AirFlow
airflow
aws
+ 더보기
cloud
mwaa
므와
아마존
아마존웹서비스
에어플로우
클라우드
0
0
0
읽기모드
9M
poetry로 pypi에 publish 시 token 인증 사용하는 법
개요 기존에 poetry로 pypi에 wheel을 업로드 할때 id/password 방식을 사용했는데 이제 token 방식만을 지원한다. 이에 따라 token으로 업로드 하는 방법을 찾아 본 뒤 정리해둔다. # poetry tok
Poetry
poetry
pypi
+ 더보기
0
0
0
읽기모드
11M
Data Lake 구축: Airflow 설계 및 기술적 특징
개요 데이터 레이크에서 MWAA를 이용하여 Airflow를 구축하면서 수립한 아키텍처와 기술적 특징에 대해 정리해본다. 아키텍처 구축하는 데이터 레이크는 On-Prem에서 데이터를 옮긴 뒤 클라우드 S3를 data lake로 삼고
AirFlow
airflow
amazon
+ 더보기
aws
cloud
data lake
mwaa
데이터레이크
아마존
클라우드
0
0
0
읽기모드
11M
Data Lake 구축: Glue ETL 설계 및 기술적 특징
개요 data lake에 있어 어떤 기술로 ETL을 수행하는지는 편의성, 신뢰성, 성능 등과 관련이 있고 한번 정하면 다시 되돌리기 어렵기 때문에 신중한 선택이 필요한 영역이라 생각한다. 오버뷰 글에 이어 이번 시간에는 Glue와
Glue
amazon
aws
+ 더보기
cloud
glue
pandas
spark
wrangler
스파크
아마존
클라우드
0
0
0
읽기모드
11M
[공유] 금융사에서 클라우드 기반 Data Lake 만든 후기
1. 개요 약 2년간 구축한 금융권 데이터 레이크를 회고해 보고자 한다. 간단히 어떤 목표로 구성을 하였으며 어떤 기술적인 특징이 있는지 알아 본 뒤 얻은점과 아쉬운 점을 나열해보고자 한다. 2. 요구사항 및 현황 요구사항은 매우
AWS
amazon
athena
+ 더보기
aws
cloud
data lake
glue
quick sight
s3
sagemaker
데이터 레이크
데이터레이크
아마존
클라우드
0
0
2
읽기모드
1y
apache iceberg 특징 정리
개요 Athena에 Table Format으로 iceberg를 적용하기 위해 조사한 내용을 정리해둔다. 주요 특징 schema evolution 스키마 add, drop, update, rename 가능 hidden partiti
Iceberg
apache iceberg
aws athena
+ 더보기
0
0
0
읽기모드
1y
Data Lake Naming Convention 정하기
개요 데이터 레이크를 구축하며 전체적인 디렉토리/파일명, 각종 Job 명의 Naming Convention을 정의할 필요가 생겨 이를 정리해둔다. 배경 Phase(운영환경)는 beta와 prod로 이원화 되어있다. On-Prem에
AWS
amazon
aws
+ 더보기
cloud
naming convention
네이밍 컨벤션
아마존
클라우드
0
0
0
읽기모드
1y
[개념정리] AWS Transfer Family
개요 AWS Transfer Family는 AWS에 일반적으로 많이 쓰는 프로토콜을 활용해 AWS 스토리지 서비스로 파일을 전송할 수 있는 보안 전송 서비스이다. 예를 들어 On-Prem에서 SCP나 FTP로 Transfer Fa
AWS
amazon
aws
+ 더보기
cloud
transfer family
아마존
클라우드
0
0
17
읽기모드
1y
Kinesis Agent를 다뤄보자
개요 Kinesis Agent를 이용한 Data Streams, Firehose 전송을 테스트 해본 뒤 기록해둔다. agent 설치방법 github 코드로 직접 아래 스크립트로 설치했다. sudo ./setup --install
AWS
amazon
aws
+ 더보기
cloud
data streams
firehose
kinesis
아마존
클라우드
0
0
0
읽기모드
1y
[문제해결] PyCharm 특정 라이브러리 자동완성 안되는 현상
개요 aws cdk 를 쓰는 중에 aws_ec2 패키지만 유독 자동완성 및 코드 점프가 안되어 원인 및 해결 방법을 찾아본 뒤 정리해둔다. 해결방법 코드 파일 크기가 default 크기인 약 2MB를 넘어가서 불러오지 못하는 현상
Pycharm
auto_complete
aws
+ 더보기
cdk
pycharm
자동완성
0
0
0
읽기모드
1y
AWS MWAA private mode에서 웹 접속주소 알아내기
개요 회사에서 MWAA를 private VPC 모드로 운영하려 하고 있다. 이때 접속할 수 있는 주소를 얻고자 할때 방법을 정리해둔다. 방법 아래와 같이 명령어를 수행하면 접속할 수 있는 web url이 획득된다. $ aws mw
AWS
a
airflow
+ 더보기
aws
mwaa
에어플로우
0
0
0
읽기모드
1y
[내용정리] DSBA 04-6 GBM에 대해 알아보자.
04-6 Gradient Boosting Machine (GBM) 개요 ****04-6: Ensemble Learning – Gradient Boosting Machine (GBM)** 강의를 보고 내용을 정리해둔다. 내용정리 G
MachineLearning
gbm
gradient boosting machine
+ 더보기
machine laerning
머신러닝
0
0
0
읽기모드
1y
[내용정리] Ensemble Learning
개요 Ensemble Learning 자료를 보고 정리해둔다. 내용 정리 만능의 최적의 알고리즘이 존재하는가? 모든 데이터에 대한 만능 알고리즘은 존재하지 X, 공짜 점심은 없음 모든 알고리즘이 최소 2개 이상의 데이터셋에서 be
MachineLearning
ensemble learning
machine learning
+ 더보기
ml
기계학습
앙상블
0
0
0
읽기모드
1y
Ada Boost에 대해 알아보자.
개요 Ada Boost에 대해 알아 본 뒤 정리해둔다. 컨셉 strong model vs weak model weak 모델은 랜덤 추측보다 조금 더 잘하는것 weak 모델은 strong model 까지 부스팅 될 수 있음 boos
MachineLearning
ada boost
boosting tree
+ 더보기
machine learning
머신러닝
부스팅
0
0
0
읽기모드
1y
Sagemaker Studio에 커스텀 이미지 등록하기
개요 Sagemaker Studio에 전용 도커 이미지를 등록하는 방법을 정리해둔다. 전제 ECR에 이미 Docker 이미지는 Push되어 있다고 가정한다. Custom Image 등록방법 Images 란을 클릭한다. Create
Sagemaker
amazon
aws
+ 더보기
cloud
Docker
image
machine learning
sagemaker studio
머신러닝
아마존
클라우드
0
0
0
읽기모드
About
Badge
Contact
Activity
Terms of service
Privacy Policy