유윤식 - mysetting

12:20 5/31

brunch.co.kr

mobile screenshot relative

12:20

brunch.co.kr

mobile screenshot

유윤식
https://brunch.co.kr/@yysttong

포트폴리오로 활용하기 위한 기술블로그를 작성하고 있습니다.

저작도구: Kakao Brunch

최종 피드 수집: 2026-06-19 04:45

전체 (80)

7M

PySpark : 스칼라 번들 버전 확인 - #PySpark #Scala #Version #Opensearch

PySpark with Opensearch PySpark 버전과 Scala 버전을 확인해야 하는데, >> echo $SPARK_HOME 해보면 아마도 /opt/spark 에 위치하고 있을 것 같고 >> ls /opt/spar

000

7M

Python: PySail#02 - #PySail #PySpark #Bench #GroupBy

PySpark Vs. PySail 비교해보기 여전히 순수한 PySpark 에 좀 더 애정이 있지만 새로운 실험(?)을 하는 것 같아서 재미있게 비교를 해보려고 조금은 복잡한 쿼리를 통해 진행. ( spark.read.parqu

002

7M

Python: PySail#01 - #PySpark #PySail #SparkConnect #Intro

PySpark 를 더 빠르게! Rust Engine 으로 기존 JVM 을 제거하여 GC Overhead 로 부터 자유로워진 성능을 느낄 수 있음 메모리 효율은 당연히 따라오는 결과! uv 환경으로 패키지를 설치 패키지 버전 관

002

1y

Python: Maturin#04 - #serde_json #dict

너무 큰 JSON 을 파이썬에서 처리할 때 고민. 너무 느리다. 메모리를 너무 많이 먹는다. 그래서 orjson 라이브러리를 사용하곤 하는데 결국 json 데이터를 핸들링하는 주체는 파이썬이고 키-값 데이터를 loop 하면서

0054

1y

Python: Maturin#03 - #orjson #그냥json

간단한 기록. Python Json 모듈에서 dumps 함수를 사용하면 '문자열' 을 반환한다. 근데, Rust 로 만들어진 orjson 모듈은 같은 dumps 함수를 통해서 '바이트 문자열' 을 반환한다. 그래서 o

002

1y

Polars #11 - #NATIVE #PYTHON #POLARS

지난번 포스팅에 이어서, 어떻게 Native API 로 변경할 수 있는지? 또한 그렇게 되었을 때 성능변화는 어떠한지? 에 대해서 알아보려고 한다. group_by 이후에 map_gorups 로 각각 처리하던 방식을 Nativ

002

1y

Polars #10 - #전처리 #1억ROW

100,000,000 이라는 숫자는 빅데이터를 하다보면 별로 큰 숫자도 아닌 것처럼 보인다. 그래서 Spark 를 통해서 분산처리를 하곤 한다. 특히, 복잡한 전처리 / 후처리 로직을 붙이면 메모리는 기하급수적으로 늘어나고 S

002

1y

Python : 1 / 8145060 (6) - #예측실패 #내돈

신중하게 골랐지만 결국 실패했다. 이번주(2024. 07. 27) 행운의 로또 당첨번호는 해당 번호는 어떤 위치에 존재하는가? >> Lotto(7473568 : 1130) 전체 조합의 수에서 7,473,568 번째에 위치했

001

1y

Python : 1 / 8145060 (5) - #2.2M #5.8M #로또희망

이제 로또 번호를 정확히 찍을 수 있다는 욕심은 버렸다. 위 동영상은 이번 회차(1129회차) 까지의 모든 로또 당첨번호의 index 위치를 100_000 으로 나눠서 Agg 한 결과를 Counter 를 통해서 업데이트해본 결과

001

1y

Python : 1 / 8145060 (4) - #노답로또 #고민된다 #어느것을고를까요

로또 분석을 이어가는 와중에 한가지 문제가 발생했다. 우선 지난번 코드를 살짝 고쳐봤다. import numpy as np # all_combinations # 총 조합 개수: 8145060, 모든 조합의 리스트 # histo

003

1y

Python : 1 / 8145060 (3) - #로또 #당첨번호위치 #자동원리 #당첨기원

이전 포스팅에서 로또 당첨번호 히스토리 정보를 읽어오고 내용을 확인했다. 1회차 ~ 1129회차 까지 모두 가져왔다. 간단하게 1129회차 당첨번호는 모든 조합 내에서 몇번째에 위치하는걸까? 그리고 모든 당첨번호들은 몇번째에

002

1y

Python : 1 / 8145060 (2) - #로또1등 #당첨번호

이제 당첨번호를 모조리 긁어와서 데이터를 만들어본다. 어떤 번호가 당첨이 되는 번호일까? 사실 이 부분은 별로 호기심이 생기지는 않는다. 내 목표는 어떤 순번(즉 모든 경우의 수를 나열했을 때 index 위치가 중요함) 일지가

002

1y

Python : 1 / 8145060 - #로또확률 #긴여정 #파이썬과로또

오늘부터 일주일에 천원씩 로또를 사기로 결심했다. 좋은 뜻에서 시작하는 것으로 일단 포장을 하고, 이왕 한다면 1 / 8,145,060 확률을 뚫어 낼 수 있는 로또번호 생성기를 만들기로! 모든 로또 번호를 조합하고 이쁘게 정

001

1y

Rust : collect() - #Arr2Vec #collect함수

1부터 100까지 숫자로 구성된 배열을 만들 때, 생각보다 귀찮은 방식을 사용해야 한다. let mut x = { let mut arr = [0; 75]; for i in 1..75 { arr[i] = i + 1; } arr }

002

1y

Rust : 참조 & 역참조 - #Ref #DeRef

맨날 아리송하게 기억하는 참조 & 역참조 간단하게 String 을 활용해서 참조 & 역참조를 비교해보자. fn main() { let s1 = String::from("hello"); let s2 = s1; // s1의 소유

001

1y

PyTorch 쓰세요(6). - #GEOMETRIC #REC_SYSTEM

추천시스템에 Geometric 을 활용해보자. USER : 1000 ITEM : 5000 으로 각각 세팅하고 Dummy 데이터를 만들고, import torch import numpy as np from torch_geomet

008

1y

PyTorch 쓰세요(5). - #VAE #CONV #MNIST

MNIST 데이터셋을 활용 CONV2D 를 결합한 VAE 작성 예제 28 X 28 사이즈의 데이터를 VAE를 활용해 복원 import torch import torch.nn as nn import torch.optim as o

002

1y

Python: DuckDB(5) - #Postgresql #Plugin

DuckDB 에서 Posgresql 에 연결된 Database, DB, Table 에 접근하고 바로 쿼리를 날려볼 수 있다. https://duckdb.org/docs/guides/database_integration/postgr

007

2y

Polars #09 - #List #Concat

이번엔 각 컬럼들을 모아서 list 로 만드는 방법! 저번 기록과 같은 Dummy 데이터를 가지고 %%time import polars as pl pl.Config(fmt_table_cell_list_len=10) gt =

002

2y

Polars #08 - #Struct #구조체 #vs.Pandas

간단한 DataFrame 을 만들고 그 안에서 기존 컬럼들을 조합해서 Dict 타입의 새로운 컬럼을 생성해보자. - struct 키워드를 알아야 한다. - with_columns 함수를 사용한다. - pandas 문법과 성능을

000