/users
/posts
/slides
/apps
/books
mysetting
/users
/posts
/slides
/apps
/books
12:20 5/31
brunch.co.kr
12:20
brunch.co.kr
유윤식
https://brunch.co.kr/@yysttong
포트폴리오로 활용하기 위한 기술블로그를 작성하고 있습니다.
저작도구: Kakao Brunch
최종 피드 수집: 2025-07-01 14:16
전체 (77)
10M
Python: Maturin#04 - #serde_json #dict
너무 큰 JSON 을 파이썬에서 처리할 때 고민. 너무 느리다. 메모리를 너무 많이 먹는다. 그래서 orjson 라이브러리를 사용하곤 하는데 결국 json 데이터를 핸들링하는 주체는 파이썬이고 키-값 데이터를 loop 하면서
0
0
0
읽기모드
10M
Python: Maturin#03 - #orjson #그냥json
간단한 기록. Python Json 모듈에서 dumps 함수를 사용하면 '문자열' 을 반환한다. 근데, Rust 로 만들어진 orjson 모듈은 같은 dumps 함수를 통해서 '바이트 문자열' 을 반환한다. 그래서 o
0
0
0
읽기모드
11M
Polars #11 - #NATIVE #PYTHON #POLARS
지난번 포스팅에 이어서, 어떻게 Native API 로 변경할 수 있는지? 또한 그렇게 되었을 때 성능변화는 어떠한지? 에 대해서 알아보려고 한다. group_by 이후에 map_gorups 로 각각 처리하던 방식을 Nativ
0
0
0
읽기모드
11M
Polars #10 - #전처리 #1억ROW
100,000,000 이라는 숫자는 빅데이터를 하다보면 별로 큰 숫자도 아닌 것처럼 보인다. 그래서 Spark 를 통해서 분산처리를 하곤 한다. 특히, 복잡한 전처리 / 후처리 로직을 붙이면 메모리는 기하급수적으로 늘어나고 S
0
0
0
읽기모드
11M
Python : 1 / 8145060 (6) - #예측실패 #내돈
신중하게 골랐지만 결국 실패했다. 이번주(2024. 07. 27) 행운의 로또 당첨번호는 해당 번호는 어떤 위치에 존재하는가? >> Lotto(7473568 : 1130) 전체 조합의 수에서 7,473,568 번째에 위치했
0
0
0
읽기모드
11M
Python : 1 / 8145060 (5) - #2.2M #5.8M #로또희망
이제 로또 번호를 정확히 찍을 수 있다는 욕심은 버렸다. 위 동영상은 이번 회차(1129회차) 까지의 모든 로또 당첨번호의 index 위치를 100_000 으로 나눠서 Agg 한 결과를 Counter 를 통해서 업데이트해본 결과
0
0
0
읽기모드
11M
Python : 1 / 8145060 (4) - #노답로또 #고민된다 #어느것을고를까요
로또 분석을 이어가는 와중에 한가지 문제가 발생했다. 우선 지난번 코드를 살짝 고쳐봤다. import numpy as np # all_combinations # 총 조합 개수: 8145060, 모든 조합의 리스트 # histo
0
0
0
읽기모드
11M
Python : 1 / 8145060 (3) - #로또 #당첨번호위치 #자동원리 #당첨기원
이전 포스팅에서 로또 당첨번호 히스토리 정보를 읽어오고 내용을 확인했다. 1회차 ~ 1129회차 까지 모두 가져왔다. 간단하게 1129회차 당첨번호는 모든 조합 내에서 몇번째에 위치하는걸까? 그리고 모든 당첨번호들은 몇번째에
0
0
1
읽기모드
11M
Python : 1 / 8145060 (2) - #로또1등 #당첨번호
이제 당첨번호를 모조리 긁어와서 데이터를 만들어본다. 어떤 번호가 당첨이 되는 번호일까? 사실 이 부분은 별로 호기심이 생기지는 않는다. 내 목표는 어떤 순번(즉 모든 경우의 수를 나열했을 때 index 위치가 중요함) 일지가
0
0
0
읽기모드
11M
Python : 1 / 8145060 - #로또확률 #긴여정 #파이썬과로또
오늘부터 일주일에 천원씩 로또를 사기로 결심했다. 좋은 뜻에서 시작하는 것으로 일단 포장을 하고, 이왕 한다면 1 / 8,145,060 확률을 뚫어 낼 수 있는 로또번호 생성기를 만들기로! 모든 로또 번호를 조합하고 이쁘게 정
0
0
0
읽기모드
11M
Rust : collect() - #Arr2Vec #collect함수
1부터 100까지 숫자로 구성된 배열을 만들 때, 생각보다 귀찮은 방식을 사용해야 한다. let mut x = { let mut arr = [0; 75]; for i in 1..75 { arr[i] = i + 1; } arr }
0
0
0
읽기모드
11M
Rust : 참조 & 역참조 - #Ref #DeRef
맨날 아리송하게 기억하는 참조 & 역참조 간단하게 String 을 활용해서 참조 & 역참조를 비교해보자. fn main() { let s1 = String::from("hello"); let s2 = s1; // s1의 소유
0
0
0
읽기모드
11M
PyTorch 쓰세요(6). - #GEOMETRIC #REC_SYSTEM
추천시스템에 Geometric 을 활용해보자. USER : 1000 ITEM : 5000 으로 각각 세팅하고 Dummy 데이터를 만들고, import torch import numpy as np from torch_geomet
0
0
0
읽기모드
11M
PyTorch 쓰세요(5). - #VAE #CONV #MNIST
MNIST 데이터셋을 활용 CONV2D 를 결합한 VAE 작성 예제 28 X 28 사이즈의 데이터를 VAE를 활용해 복원 import torch import torch.nn as nn import torch.optim as o
0
0
0
읽기모드
1y
Python: DuckDB(5) - #Postgresql #Plugin
DuckDB 에서 Posgresql 에 연결된 Database, DB, Table 에 접근하고 바로 쿼리를 날려볼 수 있다. https://duckdb.org/docs/guides/database_integration/postgr
0
0
5
읽기모드
1y
Polars #09 - #List #Concat
이번엔 각 컬럼들을 모아서 list 로 만드는 방법! 저번 기록과 같은 Dummy 데이터를 가지고 %%time import polars as pl pl.Config(fmt_table_cell_list_len=10) gt =
0
0
0
읽기모드
1y
Polars #08 - #Struct #구조체 #vs.Pandas
간단한 DataFrame 을 만들고 그 안에서 기존 컬럼들을 조합해서 Dict 타입의 새로운 컬럼을 생성해보자. - struct 키워드를 알아야 한다. - with_columns 함수를 사용한다. - pandas 문법과 성능을
0
0
0
읽기모드
1y
Python: DuckDB(4) - #DB_API #맘대로SQL #쓰던대로SQL
DB 처럼 사용하기. 이번엔 WITH 도 사용해보고 MONTH, COUNT, ARRAY_AGG, STRFTIME, RANK OVER PARTITION, GROUP BY ALL 등등을 SQL 문장에서 이용해본다. 자세한 설명은
0
0
3
읽기모드
1y
Python: DuckDB(3) - #Relational_API #DuckDBPyRelation #Lazy
DuckDB 를 관계형 API 로 다루는 방법. ** 참고 https://duckdb.org/docs/api/python/relational_api 이전 포스팅에 이어서 nyc 데이터를 활용해보면 import duckdb
0
0
1
읽기모드
1y
Python: DuckDB(2) - #Basic #NYCDB
간단하게 DUCKDB 에서 paruet 파일 읽어서 SQL 하나 날려본다. https://duckdb.org/docs/data/parquet/overview 읽는 방법은 여기서 확인하고, import duckdb conn =
0
0
1
읽기모드
About
Badge
Contact
Activity
Terms of service
Privacy Policy