파이썬(9)
-
224~349p
XGBoost(extreme gradient boosting) 트리 기반의 앙상블 학습에서 가장 각광받고 있는 기법 GBM의 단점인 느린 수행시간, 과적합 규제 부재 등의 문제를 해결 xgboost의 대표적인 장점 분류와 회귀에서의 뛰어난 예측 성능 GBM대비 빠른 수행 시간 과적합 규제 tree pruning 자체 내장된 교차검증-교차검증을 통해 평가데이터셋의 평가값이 최적화되면 반복을 중간에 멈출 수 있는 early stopping 기능 존재 결손값 자체 처리 파이썬 래퍼 xgboost 모듈 & 사이킷런 래퍼 xgboost 모듈 파이썬 래퍼 xgboost 모듈 : 초기의 독자적인 xgboost 프레임워크 기반의 xgboost 사이킷런 래퍼 xgboost 모듈 : 사이킷런과 연동되는 모듈 파이썬 래퍼 ..
2023.12.16 -
주변 인프라가 상권활성화에 미치는 영향
https://github.com/1282saa/commercial-area-nearby-infra
2023.12.16 -
오징어 게임 파이썬 구현
https://github.com/1282saa/squidgame/blob/main/squid_game_20231211.ipynb 개발 배경 : 최근 넷플릭스에서 인기를 끌고 있는 한국 드라마 "오징어 게임"은 긴장감 넘치는 이야기와 독특한 게임 형식으로 많은 이들에게 화제를 모으고 있다. 이에 따라, 이 게임을 파이썬 프로그래밍 언어를 활용하여 구현하는 프로젝트를 시작하게 되었다. 최대한 많은 게임을 구현해보려고 노력했다. 이 프로젝트에서 진행한 게임은 무궁화 꽃이 피었습니다, 달고나 게임, 징검다리 게임, 줄다리기이다. 1.무궁화 꽃이 피었습니다 import random class Runner: def __init__(self, runner_id): self.runner_id = runner_id s..
2023.12.16 -
정규 표현식 정리 [• . ^ $ * + ? { } [ ] \ | ( ) ]
expression = ^b...s$ : 'b'로 시작하고 's'로 끝나는 다섯 글자 문자열과 일치 함 match or no match? basvs : match babcds : no match (글자 수 오류) bsssa : no match (끝나는 문자 오류 -> ^b...a$의 표현은 match 가능 Blaws : no match (대소문자 구분 오류) bn ans : no match (공백도 카운팅) [정규식 syntax] 메타 문자 : RegEx 엔진에 의해 특별한 방식으로 해석되는 문자 • . ^ $ * + ? { } [ ] \ | ( ) 대괄호 : [] 일치시키려는 문자 집합을 지정 expression : [qwer] match or no match? q : 1match qw : 2match..
2023.11.30 -
linear regression(ridge & lasso) coding implementation
to_numpy를 활용하면 행렬 연산이 가능한 형태로 변화 x의 feature는 5개 matmul은 행렬곱 함수(전치x 곱하기 x) 위의 w변수의 각각의 계수와 데이터프레임의 각 첫번째 행을 곱하기.(w곱하기 x_train) predicted_y_train 은 위에 수기로 계산한 것과 동일한 계산 값들임.(w계수와 train_x를 곱한것) 첫번째 값이 23.07245881로 동일한 것을 알 수 있음 잔차는 관측값 - 예측값 -> 그것을 제곱하기 -> 잔차의 평균을 구함 마찬가지로 y_test에 대해 잔차를 구하는 과정 선형회귀 모델을 만들고 fit을 이용해 학습시키기 (X_train, y_train)사용 절편 확인 mes값 구하기 \ & 결정계수 구하는 벙법 quiz! # 1. Student_Perfor..
2023.11.22 -
[파이썬] t-test와 Anova
1. t-test(t 검정) - t-test는 두 집단의 평균에 통계적으로 유의한 차이가 있는지 알아볼 때 사용하는 통계 분석 기법 - one sample t-test와 two sample t-test가 있음 - t-test를 하기 위해 기본적으로 scipy 패키지로부터 stats라는 모듈을 불러와야 함 - 한 개의 집단을 가지고 t-test를 하는 것 - 한 집단의 평균값이 내가 생각한 값과 다른지 비교할 때 시행하는 것 - stats.ttest_1samp()를 활용 - 두 개의 집단을 가지고 t-test를 하는 것 - 두 집단의 평균 비교를 통해, 두 집단 간의 차이가 통계적으로 유의한지 유의하지 않은지를 확인할 수 있음 - stats.ttest_ind()를 활용 2. Anova 검정 - 세 개 이상..
2023.11.15