추천시스템

[Intro] 추천 시스템

수보리조쉬 2024. 1. 12. 18:05

안녕하세요 조쉬입니다!

이번 글에서는 추천시스템의 개요를 설명하겠습니다.

추천시스템 서적의 요약본이며 공부한 내용을 정리하였습니다.

개요

  • neighborhood model이 베이스 모델로 사용
    • 사용자와 아이템 사이에 의존성이 존재
  • collaborative filtering으로 발전

추천 시스템의 기본 모델

  • (1) 사용자 - 아이템 간의 조합에 대한 평가값을 예측
  • (2) 특정 사용자에게 노출할 상위 n개의 아이템을 선택 (랭킹)
  • 보통 (1)을 통해 (2)를 생성

운영 기술적 목표

쿠팡 추천 페이지 예시 : 내가 검색하거나 구매한 상품과 관련이 있는 아이템을 추천함

 관련성

  • 사용자와 관련 있는 아이템을 추천
  • 흥미를 느끼는 아이템을 더 많이 소비할 가능성이 있음 

네이버 지도와 스포티파이 음악 추천 : 내가 아직 체험해보지 못한 아이템이지만 관련이 있을 경우 추천

참신성

  • 사용자가 이전에 보지 못했던 아이템을 추천
  • 인기 있는 상품의 반복적인 추천은 다양한 구매 기회를 저하 시킴

의외성

  • 잠재적 관심을 자극
  • 판매 다양성 증진, 새로운 관심의 시작

쿠팡과 네이버 : 나랑 관련은 없어도 많이 소비되는 상위 아이템을 추천에 추가

증가된 추천 다양성

  • 상위 n개에 다른 유형의 아이템을 랜덤 하게 추가

협업 필터링 모델

개요

  • 발견된 평점은 사용자와 아이템의 명확한 상관관계를 나타냄
  • 이를 통해 발견되지 않은 평점을 예측하기 위함
  • 기본 아이디어는 사용자가 관심을 갖고 과거에 평가했거나 조회한 아이템의 속성을 기준으로 모델링할 수 있다는 것을 의미

 

메모리 기반 방법

  • 사용자 기반 협업 필터링
    • 방식
      • 타겟 사용자 A와 유사한 성향을 가진 사용자들의 평점 결과로 A의 추천을 진행
      • A와 유사한 사용자 그룹의 평점과 후처리 작업을 통해 A의 미관측치를 예측
  • 아이템 기반 협업 필터링
    • 방식
      • 타겟 아이템 A와 유사한 성향을 가진 아이템 그룹의 평점 결과로 A의 평가치를 예측
  • 장 : 적용이 간단하고 결과에 대한 설명력이 명확함
  • 단 : 모든 아이템에 대한 평가치를 커버할 수는 없음 (실 관측치의 부족)

모델 기반 방법론

  • decision tree
  • rule based model
  • bayesian methods
  • latent factor model
  • 장 : 메모리 방식 대비 커버리지가 확실히 증가함
  • 단 : 다소 결과가 인위적일 수 있으며, 결과 해석이 명확하지 않을 수 있음
  • 평점의 종류
    • 평점 추적 시스템에 영향
      • 평점의 종류는 여려가지가 있을 수 있음 (-10 ~ 10 / 동의, 비동의 / 0, 1)
    • 명시적 평점 vs 암시적 평점
      • 명시적 평점은 이항 평점이 아닌 사용자의 명확한 좋고 싫음이 표현된 평점
      • 암시적 평점은 이항 평점과 같이 사용자의 암시적인 선호도를 표현
  • 결측치 보정
    • 암시적인 평점의 경우 결측치와 비 선호 간의 유사성이 커질 수 있다는 위험성이 존재
    • 협업 필터링에서는 필연적으로 대부분의 데이터가 결측치이기 때문에 결측치 분석 방법에 대한 고민이 필요함
  • 분류 및 회귀 모델과의 관계
    • 협업 필터링은 분류 및 회귀 모델의 일반화된 버전으로 생각할 수 있음
    • 큰 차이점은 학습 & 검증 세트 간의 차이가 협업 필터링에서는 존재하지 않음
    • 독립 변수와 종속 변수 간의 구별이 없음
    • 표본에 누락된 마이너 그룹의 아이템의 경우에는 예측이 어려우나 귀납적 학습에 의해 예측할 수 있도록 디자인되기도 한다고 함

지식 기반 추천 시스템

  • 자주 구매하지 않는 아이템에 유용 (부동산[호갱노노], 명품[매치스패션])
  • 트렌드가 빠르게 변화하거나 평점 및 속성의 조합을 추출하기 어려운 경우에 사용
  • 사용자가 원하는 요구사항과 아이템의 속성 간의 유사도를 활용
  • 상호작용 방식에 의한 분류
    • 제약 기반 추천 시스템
      • 요구 사항과 제한 내용을 아이템 속성에 사용자가 직접 기입
    • 사례 기반 추천 시스템
      • 대화형 시스템
      • 검색 기반 시스템
      • 탐색 기반 추천
    • 효용 기반 추천 시스템

상위 방식 간의 유사성

  • 콘텐츠 기반과 지식 기반 모두 아이템의 속성에 전적으로 의존함
  • 콘텐츠 기반은 사용자의 과거 패턴을 통해 학습 및 예측
  • 지식 기반은 사용자의 요구 사항을 기반으로 추천 (추천이라기 보단 검색에 가깝다고 보임?)

효용 기반 추천 시스템

  • 사용자가 특정 아이템을 선호할 확률을 계산하기 위해 사용됨
  • 지식 기반 추천에서 아이템의 순위를 정할 때 사용하기도 함

인구 통계학적 추천 시스템

  • 사용자의 정보를 통해 보다 큰 그룹의 사용자들의 평균 평점 및 구매 성향을 예측할 때 사용
  • 분류 모델로 주로 사용됨
  • 단일로 사용되기보단 하이브리드 등의 고도화된 방식의 구성요소로 활용됨

하이브리드 방식

  • 추후 설명