본문 바로가기

ML engineer/ML(Machine Learning)3

[추천시스템] 행렬 분해 1. 행렬 분해 1.1. 행렬 분해란? 다차원의 매트릭스를 저차원 매트릭스로 분해하는 기법으로 SVD(Singular Vector Decomposition), PCA(Principal component analysis), LDA(Linear Discriminant Analysis), NMF(Non-Negative Matrix Factorization) 등이 있다. 분해에서 나온 Factorization은 우리말로 하면 '인수분해'를 말한다. 즉, 행렬 분해를 통해 복잡한 행렬을 단순한 행렬의 곱으로 나타낸다고 보면 된다. (명백히 PCA, LDA 는 행렬 분해라기 보다는 차원 축소의 개념으로 보아야한다. 차원 축소 중 행렬로 분리하는 것을 행렬 분해 라고 본다) 1.1.1. SVD 다양한 분야에서 사용되.. 2023. 3. 30.
[추천시스템] 추천시스템이란? ※ 해당 포스팅은 머신러닝 완벽가이드 및 SKK KDT를 수강 후 내용을 요약하기 위함입니다. 1. 추천시스템이란? 2. 추천시스템의 유형 1. 추천시스템이란 추천 시스템은 사용자와 아이템(상품, 컨텐츠 등) 간 데이터의 활용, 사용자의 취향을 고려한 아이템(컨텐츠)를 추천하는 시스템을 통칭한다. 사용자의 선호도 및 과거 행동을 바탕으로 사용자가 흥미를 가질만한 콘텐츠를 제공하는 것 등의 의미를 뜻한다. 2. 추천 시스템의 유형 추천 시스템은 크게 정보 필터링, 연관성 분석, 기타 등으로 분류 할 수 있고 이때 정보 필터링은 콘텐츠 기반 필터링(Content based filtering) 과 협업 필터링(Collaborative Filtering) 방식으로 나뉜다. 기타 방식에는 통계 기반(Best Se.. 2023. 3. 28.
[ML] Machine Learning 워밍업 ※ 해당 포스팅은 이제 막 머신러닝을 공부하는 개인이 공부를 위해 작성되었으며, 오탈자 및 잘못된 지식을 바로잡는 댓글을 환영합니다. 다만 조금 부드럽게 부탁드립니다. 이번 포스팅에서는 머신러닝을 공부하기에 앞서 머신러닝 하기 위해 전반적으로 어떠한 과정을 거치게 되는지를 검토하려고 한다. 크게 7단계로 나뉜다. 1. 데이터 탐색(EDA) 2. 데이터 전처리(Preprocessing) 3. 데이터 분할(Data split) 4. 모델 구축(Buliding) 5. 학습(Training) 6. 검증(Validation) 7. 배포 1. 데이터 탐색(EDA) 좋은 머신러닝 결과를 얻기 위해서는 데이터의 성격을 파악하는 과정을 선행하여 어떠한 모델을 선택할지 결정해야 한다. 따라서 데이터 값의 분포, 결측값의 .. 2023. 3. 14.