협업 시스템은 추천을 만들기 위해 사용자의 평점 패턴의 상관관계를 이용한다.
한편으로 이러한 방법은 예측을 계산할 때 아이템의 속성을 이용하지 않는다. 상관관계를 이용하는 것은 낭비처럼 보일 수도 있다.
EX. 만약 Alice가 어바웃타임을 좋아한다면 비슷한 장르의 로맨스 영화인 라라랜드를 좋아할 가능성이 높다.
이런 경우, 다른 사용자의 평가가 필요하지 않을 필요가 있다.
협업필터링(CF) 추천 시스템
-평점 행렬 내 상관관계를 이용하여 추천
-유사도
피어 그룹 내의 상관 관계 기반
콘텐츠 기반(Content-Based) 추천 시스템
-아이템이 포함된 설명력이 있는 속성 활용
-사용자 자신의 평점과 아이템에 대한 상호작용을 활용
-신규 아이템 또는 평점이 드문 경우에 유용
-유사도
사용자가 좋아하는 아이템의 속성 기반(다른 사용자의 역할이 거의 없음)
콘텐츠 기반 시스템의 데이터 소스
-아이템에 대한 콘텐츠 성격의 설명
ex. 상품에 대한 설명서
-피드백을 가공한 사용자의 프로파일
ex. 사용자가 평점을 매긴 아이템의 설명 문서/ 또는 이를 활용한 분류 모델
설명문서는 feature, 평점이 target(label)
사용자가 직접 관심 키워드를 입력한 내용(지식 기반 추천 시스템과 유사)
다른 사용자의 평점을 이용하지는 않음
-장점: 콜드 스타트 문제
신규 아이템이라도 사용자 평점의 정보가 어느 정도 있다면 평점 예측
신규 사용자에 대한 추천은 여전히 어려움
-단점: 다양성(Diversity), 참신성(novelty) 감소
유사한 속성을 가진 아이템 위주의 추천이기 때문
콘텐츠 기반 시스템이 유망한 영역
-아이템의 속성 정보가 매우 많은 경우
-풍부한 텍스트/ 비구조화된 도메인
이커머스에서의 상품 설명, 웹페이지
하이브리드 추천 시스템
-협업필터링, 콘텐츠 기반, 지식 기반 시스템들의 결합
4장 구성
-콘텐츠 기반 시스템의 구성 요소
-피처 추출
-사용자 프로파일링 학습 및 추천
-시스템 비교 및 융합