[에이블런] [AI 스타트업 유니버시티] 0717 TIL

2024. 7. 18. 14:10대외활동/ai 유니버시티

 

<자료 : 노코드 머신러닝 강의안,에이블런>

 

 

데이터를 통해 이 사람의 특징을 파악해본다면?

스타벅스에서 매번 같은 메뉴를 주문한다(6300원) -> 인사이트 : 해당 메뉴에 대한 할인 쿠폰, 기프티콘 행사를 진행하는 것이 효과적

 

 

- 직관에 의한 의사결정보다 나은 의사결정 가능 -> 기업의 성장 및 고객 만족도 향상

 

<AI 데이터분석 프로그램>

 

ai 리터러시 = ai 기술 평가 / ai와 소통 / ai 툴 활용

 

AI 사례

 

AI 사례

 

 

 

[생성형 AI]

연관 규칙 분석 = 장바구니 분석

 

########################################################################################

- 연관 분석에 대하여 -

 

 

 

https://practical-data.tistory.com/92

 

상품 추천 알고리즘 - 협업 필터링 vs. 연관분석

이커머스의 추천 알고리즘 앞서 추천 알고리즘을 소개하면서 아마존에서 상품 기반 협업 필터링을 이용해 관련 상품을 추천하는 것을 소개하였다. 아마존의 상품 기반 협업 필터링은 무려 25년

practical-data.tistory.com

 

<연관분석의 3가지 빈도계산 방식>

https://practical-data.tistory.com/118

 

장바구니 분석(연관분석)의 구조와 활용 방법

확률로만 계산하는 연관분석 연관분석은 협업 필터링과 달리 유사도 기반 함수를 이용하지 않고 대상 품목의 빈도를 기반으로 확률을 계산하기 때문에 분석하기 쉽다는 장점을 가지고 있다. 그

practical-data.tistory.com

########################################################################################

 

 

 

 

 

*<강화학습 관련 자료>

https://ropiens.tistory.com/category/sinanju06/%EB%94%A5%EB%9F%AC%EB%8B%9D%20%EB%85%BC%EB%AC%B8%20%EB%A6%AC%EB%B7%B0?page=2

 

'sinanju06/딥러닝 논문 리뷰' 카테고리의 글 목록 (2 Page)

당황했습니까? 휴먼

ropiens.tistory.com

 

 

[추천시스템]

 

 

 

AI 

초기의 AI 시스템 : 인간이 사전에 정의한 명시적인 규칙에 따라 동작하는 규칙 기반 시스템 중심으로 구성 

규칙 기반 시스템 : 변수가 늘어나면 오류 발생 확률 증가 

 

머신러닝 

기계가 코드로 명시하지 않은 작업을 데이터로부터 학습하여 실행가능한 알고리즘을 개발하는 연구 분야. 

머신러닝 알고리즘 생성 방식 

 

머신러닝 알고리즘 생성 방식 : 대규모 데이터셋에서 패턴과 상관관계를 찾고, 분석을 토대로 최적의 의사결정과 예측을 수행하도록 훈련

 

딥러닝

인간 뇌의 신경 구조를 모방한 인공 신경망(ANN)을 사용하여 더 복잡하고 추상화된 특징을 학습

 

딥러닝은 형태가 일정하지 않은 데이터를 대상으로 학습 가능 

 

인공 신경망 

입력 계층

- 외부 세계의 정보가 인공 신경망으로 입력

- 입력 노드는 데이터를 처리하여 분석 또는 분류한 후 다음 계층으로 전달 

 

숨겨진 계층 

- 숨겨진 계층은 입력 계층이나 다른 숨겨진 계층에서 정보를 입력 받음

- 각 숨겨진 계층은 이전 계층의 출력을 분석하여 다음 계층으로 전달

 

출력 계층 

- 출력 계층은 인공 신경망이 처리하는 모든 데이터의 최종 결과를 제공 

 

심층 신경망(DNN)

- 은닉층을   2개이상 지닌 학습 방법 : 컴퓨터가 스스로 분류레이블을 만들어 내고 공간을 왜곡하고 데이터를 구분짓는 과정을 반복하여 최적의 구분선을 도출 

- 가중치는 한 노드(뉴런)와 다른 노드(뉴런) 간의 연결을 나타냄.  가중치 값이 높은(연결이 많은) 노드는 다른 노드에 더 많은 영향을 미침 

- 정확한 결과 값을 위해서는 수백만 개의 훈련 데이터 예제가 필요 (DNN을 응용한 알고리즘 : CNN, RNN, LSTM, GRU 등) 

 

 

머신러닝 학습 방법 

지도학습 : 기계에게 답을 알려 주고 소스로 공식을 깨우치도록 하여 학습 시키는 방식(분류, 회귀)

비지도 학습 : 기계에게 답을 주지 않은 채 데이터를 제공해 주고 답을 찾도록 학습시키는 방식 (군집화, 이상탐지)

강화학습 : 기계를 특정 환경에 두고, 답도 문제도 주지 않은 채 피드백만으로 학습 시키는 방식 알파고, 벽돌깨기 등)

 

[지도 학습 알고리즘]

회귀 분석, 분류, 의사결정나무, 랜덤 포레스트, 신경망 등 

 

[비지도 학습 알고리즘]

k-means clustering, pca

 

[강화 학습 구성요소]

agent : 강화학습에서 의사 결정을 수행하는 주체 

environment : 에이전트가 학습하는 무대

action : 에이전트가 의사 결정을 통해 환경에 대해 가하기로 선택한 변화

reward : 에이전트가 특정 행동을 취했을 때 받는 신호 

 

<지도학습>

* 선형 회귀(linear regression): 지도학습 중 출력이 수치형 값을 가지 경우를 회귀라 하며, 회귀에 선형 함수를 이용하는 것을 선형 회귀라고 함.

* 로지스틱 회귀(logistic regression): 지도학습 중 출력이 범주형 값을 가지는 경우를 분류 라 하며, 로지스틱 회귀는 로지스틱 함수를 이용하는 분류 방법.

 

서포트 벡터 머신 

- 서포트 벡터는 결정 경계(즉, 분류를 결정하는 경계선 또는 평면)를 정의하는 데 사용되는 데이터 포인트를 의미

- 데이터를 분류할 수 있는 다양한 경계선이 존재하는데 그 중 최적의 라인을 찾아내는 원리 

- 명확하게 분류할 수 있는 데이터 집단에서 뛰어난 성능을 보이며, 고차원 공간에서도 효과적으로 사용이 가능

예) 특정 인물의 얼굴 이미지를 픽셀 데이터로 학습시켜 픽셀 밝기를 기준으로 사각형 경계를 만들어 이미지를 분류

 

<비지도학습>

잠재 변수 모델 

- 표현된 데이터 속에 내재되어 있는 정보가 관측되지 않은 상태에서 z라는 내재되어 있는 변수를 찾아냄 

예) topic modeling : 주어진 문서에 존재하는 단어의 분포를 통해 주제별로 분류하고 해당 단어가 그 주제에 얼마나 기여하는지 알아냄