추천시스템
[Intro] 추천 시스템
수보리조쉬
2024. 1. 12. 18:05
안녕하세요 조쉬입니다!
이번 글에서는 추천시스템의 개요를 설명하겠습니다.
추천시스템 서적의 요약본이며 공부한 내용을 정리하였습니다.
개요
- neighborhood model이 베이스 모델로 사용
- 사용자와 아이템 사이에 의존성이 존재
- collaborative filtering으로 발전
추천 시스템의 기본 모델
- (1) 사용자 - 아이템 간의 조합에 대한 평가값을 예측
- (2) 특정 사용자에게 노출할 상위 n개의 아이템을 선택 (랭킹)
- 보통 (1)을 통해 (2)를 생성
운영 기술적 목표
관련성
- 사용자와 관련 있는 아이템을 추천
- 흥미를 느끼는 아이템을 더 많이 소비할 가능성이 있음
참신성
- 사용자가 이전에 보지 못했던 아이템을 추천
- 인기 있는 상품의 반복적인 추천은 다양한 구매 기회를 저하 시킴
의외성
- 잠재적 관심을 자극
- 판매 다양성 증진, 새로운 관심의 시작
증가된 추천 다양성
- 상위 n개에 다른 유형의 아이템을 랜덤 하게 추가
협업 필터링 모델
개요
- 발견된 평점은 사용자와 아이템의 명확한 상관관계를 나타냄
- 이를 통해 발견되지 않은 평점을 예측하기 위함
- 기본 아이디어는 사용자가 관심을 갖고 과거에 평가했거나 조회한 아이템의 속성을 기준으로 모델링할 수 있다는 것을 의미
메모리 기반 방법
- 사용자 기반 협업 필터링
- 방식
- 타겟 사용자 A와 유사한 성향을 가진 사용자들의 평점 결과로 A의 추천을 진행
- A와 유사한 사용자 그룹의 평점과 후처리 작업을 통해 A의 미관측치를 예측
- 방식
- 아이템 기반 협업 필터링
- 방식
- 타겟 아이템 A와 유사한 성향을 가진 아이템 그룹의 평점 결과로 A의 평가치를 예측
- 방식
- 장 : 적용이 간단하고 결과에 대한 설명력이 명확함
- 단 : 모든 아이템에 대한 평가치를 커버할 수는 없음 (실 관측치의 부족)
모델 기반 방법론
- decision tree
- rule based model
- bayesian methods
- latent factor model
- 장 : 메모리 방식 대비 커버리지가 확실히 증가함
- 단 : 다소 결과가 인위적일 수 있으며, 결과 해석이 명확하지 않을 수 있음
- 평점의 종류
- 평점 추적 시스템에 영향
- 평점의 종류는 여려가지가 있을 수 있음 (-10 ~ 10 / 동의, 비동의 / 0, 1)
- 명시적 평점 vs 암시적 평점
- 명시적 평점은 이항 평점이 아닌 사용자의 명확한 좋고 싫음이 표현된 평점
- 암시적 평점은 이항 평점과 같이 사용자의 암시적인 선호도를 표현
- 평점 추적 시스템에 영향
- 결측치 보정
- 암시적인 평점의 경우 결측치와 비 선호 간의 유사성이 커질 수 있다는 위험성이 존재
- 협업 필터링에서는 필연적으로 대부분의 데이터가 결측치이기 때문에 결측치 분석 방법에 대한 고민이 필요함
- 분류 및 회귀 모델과의 관계
- 협업 필터링은 분류 및 회귀 모델의 일반화된 버전으로 생각할 수 있음
- 큰 차이점은 학습 & 검증 세트 간의 차이가 협업 필터링에서는 존재하지 않음
- 독립 변수와 종속 변수 간의 구별이 없음
- 표본에 누락된 마이너 그룹의 아이템의 경우에는 예측이 어려우나 귀납적 학습에 의해 예측할 수 있도록 디자인되기도 한다고 함
지식 기반 추천 시스템
- 자주 구매하지 않는 아이템에 유용 (부동산[호갱노노], 명품[매치스패션])
- 트렌드가 빠르게 변화하거나 평점 및 속성의 조합을 추출하기 어려운 경우에 사용
- 사용자가 원하는 요구사항과 아이템의 속성 간의 유사도를 활용
- 상호작용 방식에 의한 분류
- 제약 기반 추천 시스템
- 요구 사항과 제한 내용을 아이템 속성에 사용자가 직접 기입
- 사례 기반 추천 시스템
- 대화형 시스템
- 검색 기반 시스템
- 탐색 기반 추천
- 효용 기반 추천 시스템
- 제약 기반 추천 시스템
상위 방식 간의 유사성
- 콘텐츠 기반과 지식 기반 모두 아이템의 속성에 전적으로 의존함
- 콘텐츠 기반은 사용자의 과거 패턴을 통해 학습 및 예측
- 지식 기반은 사용자의 요구 사항을 기반으로 추천 (추천이라기 보단 검색에 가깝다고 보임?)
효용 기반 추천 시스템
- 사용자가 특정 아이템을 선호할 확률을 계산하기 위해 사용됨
- 지식 기반 추천에서 아이템의 순위를 정할 때 사용하기도 함
인구 통계학적 추천 시스템
- 사용자의 정보를 통해 보다 큰 그룹의 사용자들의 평균 평점 및 구매 성향을 예측할 때 사용
- 분류 모델로 주로 사용됨
- 단일로 사용되기보단 하이브리드 등의 고도화된 방식의 구성요소로 활용됨
하이브리드 방식
- 추후 설명