호랭이 분석가

#1. 추천 시스템 주요 알고리즘 본문

Python/Recommend

#1. 추천 시스템 주요 알고리즘

데이터호랑이 2022. 9. 7. 00:52
반응형

1. 협업 필터링 ( Collaborative Filtering : CF )

  • 협업 필터링이란?
    구매 / 소비한 제품에 대한 각 소비자의 평가를 받아서 평가 패턴이 비슷한 소비자를 한 집단으로 보고
       그 집단에 속한 소비자들의 취향을 활용하는 기술입니다.
       즉, A집단의 사람들이 좋아하는 제품 중에서 A집단에 속한 A1이 아직 접하지 않은 제품을 골라내어 제시하는 기술입니다.
  • 한계점 
    - 구매 이후 후기, 평점 등을 작성하지 않는 소비자들도 많기 때문에 평가 정보가 제한적입니다.
  • 극복 방안
    - 간접 정보 사용 : 검색, 장바구니, 클릭 데이터 등 클릭스트림 분석을 통해서 소비자의 취향이나 니즈를 알아낼 수 있습니다.
  • 대표적인 예 
    - 아마존 제품 추천 시스템
    - 넷플릭스 영화 추천 시스템

2. 내용 기반 필터링 ( Content-Based Filtering : CB )

  • 내용 기반 필러팅이란?
    - 제품의 내용을 분석해서 추천하는 기술입니다.
      특히 소비하는 제품 중 텍스트 정보가 많은 제품(뉴스, 책 등)을 분석하여 추천할 때 많이 이용되는 기술로
      소비자가 현재 관심이 있는 것으로 보이는 책이나 뉴스의 키워드를 추려내고 다른 책이나 뉴스 중에서
      비슷한 키워드를 가진 책 또는 뉴스를
    찾아내서 추천을 하는 방식입니다.
  • 내용 기반 필터링 추천 절차
    - 각 아이템 간의 유사도를 계산
    - 추천 대상이 되는 사용자가 선호하는 제품을 선정
    - 위에서 선정된 아이템과 가장 유사도가 높은 N개의 제품을 찾아 추천

3. 지식 기반 필터링 ( Knowledge-Based Filtering : KB )

  • 지식 기반 필터링이란?
    - 특정 분야(도메인) 전문가의 도움을 받아 전체적인 지식 구조를 만들어서 활용하는 방법으로 
      일반적으로는 체계도를 만들어 활용합니다.
  • 장점
    - 전체적인 구조를 알 수 있음
    - 특정 분야의 지식이 중요한 경우(교육, 와인, 커피 등)에 효과가 좋다.
  • 단점
    - 특정 분야 전문가를 필요로 하고, 전문가가 있더라도 모든 세세한 분야까지 적용하기 힘들다 

4. 딥러닝 추천 ( Deep Learning : DL )

  • AI 알고리즘인 딥러닝 방법을 사용하는 방식으로 사용자와 제품의 특징 값(Feature)을 사용하고
    각 제품에 대한 각 사용자의 예상 선호도를 출력으로 얻어 예상 선호도가 높은 제품을 추천하는 방식입니다.
  • 장점
    - 다양한 입력 변수를 사용할 수 있다
  • 단점
    - 연속 값으로 표시되는 제품 특징에 대해 딥러닝을 사용할 경우 정확도가 높지 않다

5. 하이브리드 ( Hybird )

  • 두 가지 이상의 추천 기술을 혼합해서 사용하는 하이브리드 형태의 추천 시스템으로
    대부분 하이브리드 형태로 추천 시스템을 구축합니다.
  • 아마존 제품 추천 시스템
    - 협업 필터링이 주가 되는 기술이지만 그 외의 다양한 기술이 같이 사용됩니다.
  • 각 기술의 장단점을 보완할 수 있도록 결합하면 좋은 효과를 볼 수 있습니다.

'Python > Recommend' 카테고리의 다른 글

#0. 추천 시스템 정확도 측정 지표  (0) 2022.08.11
Comments