【논문】추천 시스템을 위한 그래프 신경망: 과제, 방법 및 방향

여기에 이미지 설명 삽입
기사 링크: https://arxiv.org/pdf/2109.12843.pdf

이 기사는 Tsinghua University의 Li Yong과 China University of Science and Technology의 He Xiangnan이 최근 추천한 GNN에 대한 요약입니다.

추천 시스템의 역사

얕은 모델

초기 추천 모델은 주로 상호작용의 유사도를 계산하여 시너지 신호를 포착했지만, 이후 넷플릭스 경쟁에서 행렬 분해 모델이 성공하면서 추천 시스템은 표현 학습 문제로 전환되었습니다.

신경망 모델

얕은 모델은 복잡한 사용자 행동과 많은 양의 데이터 입력을 모델링하기에 충분하지 않습니다.신경 협력 필터링 NCF 및 심층 분해 기계 DeepFM으로 대표되는 신경망 방법이 개발되었습니다.

그래프 신경망 모델

기존의 신경망은 데이터에서 고차 구조 정보를 학습하는 것이 어려운 반면 그래프 신경망 GNN은 메시지 전달 메커니즘을 사용하여 이웃 정보를 통합하고 노드가 다층 스택을 통해 고차 이웃 정보에 액세스할 수 있도록 합니다. 따라서 그래프 신경망 모델은 최근 몇 년 동안 추천 시스템에서 널리 사용되었으며 최첨단 방법이 되었습니다.

GNN

  1. 그래프 구성
  • 단 하나의 동형 그래프 가장자리 및 노드 클래스가 있습니다.
  • 이기종 그래프 에지 및 노드에는 여러 유형이 있습니다.
  • 하이퍼그래프의 에지는 여러 지점을 연결할 수 있습니다.
  1. 그래프 신경망 모델링, 메시지 전달 집계 메커니즘
    여기에 이미지 설명 삽입

  2. 최적화 방법

  • 링크 예측: BPRloss
  • 노드 분류: Logloss
  1. GNN이 추천 시스템에 적합한 이유
  • 구조화된 데이터

추천 시스템은 많은 데이터와 다양한 유형(인터랙션, 사용자 초상화, 제품 속성 등)을 가지고 있으며 그래프를 함께 통합하여 고품질 임베딩을 얻을 수 있습니다.

  • 고차 협회

GNN 레이어를 쌓으면 자연스럽게 고차원 연결을 도입하고 협업 필터링 신호를 향상시킬 수 있습니다.

  • 감독 신호

희소한 수의 상호 작용과 같은 감독 신호. GNN은 표현 학습에서 준지도 신호를 활용하여 지도 신호가 거의 없는 문제를 완화합니다.

  1. 추천 시스템에 GNN을 적용할 때 고려해야 할 몇 가지 문제

구성 -> 메시지 전달 집계 메커니즘 -> 모델 최적화 -> 교육 및 추론 효율성

추천 시스템의 분류

여기에 이미지 설명 삽입

추천 시스템의 다양한 단계에 따라

여기에 이미지 설명 삽입

  1. 일치 매칭 단계: 첫 번째 추천 단계에서는 매우 큰 항목 풀에서 수백 개의 후보 항목을 일치시킵니다. 이 단계는 데이터 규모가 큰 것이 특징이며 온라인 서비스의 지연으로 인해 일반적으로 모델이 비교적 단순합니다. 또한 실제 산업의 추천 시스템은 일반적으로 정보의 다양한 측면을 개별적으로 고려하기 위해 여러 매칭 채널을 포함합니다.
  2. 순위 정렬 단계: 두 번째 추천 단계는 서로 다른 채널의 여러 매칭 결과를 목록으로 통합하여 정렬하고 상위 순위 항목을 선택합니다. 이 단계의 입력 규모가 작기 때문에 시스템은 정확도를 위해 복잡한 알고리즘을 사용하고 여러 기능을 고려할 수 있습니다. 동시에 여러 기능과 상호 작용하는 방법도 이 단계의 핵심 과제가 되었습니다.
  3. Re-ranking re-ranking 단계: 이전 단계의 최적화 목표는 주로 추천 정확도이지만 추천 시스템은 정확성 외에도 신선도, 다양성, 공정성 등의 문제도 고려해야 합니다. 이 단계에서는 서로 다른 Item 간의 여러 관계를 고려해야 하며 순서를 삭제하거나 변경하는 등의 작업을 수행해야 합니다.

다양한 권장 시나리오에 따라

  1. 소셜 추천
    여기에 이미지 설명 삽입

사용자-아이템 상호 작용 외에도 사용자의 사회적 관계를 활용하여 추천 효과를 높입니다.
주요 과제: 사회적 요인을 포착하는 방법, 사회적 정보와 상호 작용 행동을 결합하는 방법
최근 개발:
여기에 이미지 설명 삽입

  1. 시퀀스 추천

여기에 이미지 설명 삽입
사용자의 과거 상호 작용 시퀀스를 사용하여 사용자의 관심을 추출하여 다음 항목을 예측합니다.

주요 과제: 시퀀스에서 가능한 한 많은 효과적인 정보를 추출하는 방법

최근 개발:

여기에 이미지 설명 삽입

  1. 세션 추천

여기에 이미지 설명 삽입
사용자 프로필과 장기간의 과거 상호 작용은 사용할 수 없으며 익명 사용자의 짧은 세션 데이터만 권장 사항에 사용됩니다.

주요 과제: 세션 데이터에서 항목의 변경 패턴을 모델링하는 방법과 노이즈 데이터에서 사용자의 핵심 요구 사항을 추출하는 방법

최근 개발:

여기에 이미지 설명 삽입

  1. 번들 추천

여기에 이미지 설명 삽입

사용자에게 개별 항목 대신 묶음(항목 집합) 추천

주요 과제: 번들에 대한 사용자의 결정은 항목의 소속을 고려해야 하고, 사용자와 번들 간의 상호 작용은 더 희박하며, 상위 연관 모델링을 고려해야 합니다.

최근 개발:
여기에 이미지 설명 삽입

  1. 교차 도메인 추천

여기에 이미지 설명 삽입
여러 도메인에서 사용자의 과거 상호 작용을 사용하여 콜드 스타트 ​​및 데이터 희소 문제를 완화합니다.

주요 과제: 서로 다른 도메인의 정보를 통합하고 활용하는 방법

최근 개발:

여기에 이미지 설명 삽입

  1. 다중 조치 추천

여기에 이미지 설명 삽입
여러 동작에서 상호 작용을 사용하여 데이터 희소성 문제를 완화하기 위한 권장 사항을 만듭니다.

주요 과제: 여러 동작과 대상 동작 간의 관계를 모델링하는 방법과 동작을 통해 항목의 의미 정보를 모델링하는 방법.

최근 개발:
여기에 이미지 설명 삽입

다른 권장 목표에 따라

  1. 다양성

중복을 줄이기 위해 사용자에게 다양한 유형의 항목을 추천합니다.

주요 과제: 열등한 대상의 신호를 향상시키는 방법과 다양성과 정확성 사이에서 균형을 유지하는 방법.

최근 개발:

여기에 이미지 설명 삽입

  1. 해석가능성

이 항목이 이 사용자에게 권장되는 이유를 설명하십시오.

주요 과제: 세분화된 해석 방법

최근 개발:

여기에 이미지 설명 삽입

  1. 공평

다양한 사용자에 대한 추천 결과의 편향을 제거합니다.

주요 과제: 추천에서 차별과 사회적 편향을 줄이는 방법

최근 개발:

여기에 이미지 설명 삽입

앞으로의 방향

  1. GNN이 깊어지면 CNN 심화 성능이 좋아집니다.GNN 심화는 고차 연관을 포착할 수 있지만 과도하게 평활화되는 등의 문제가 있습니다.동시에 GNN 심화 과정에서 계산량이 수용 가능해야 합니다.
  2. 동적 GNN 추천의 경우 애플리케이션 시나리오의 많은 그래프가 항상 동적으로 변경됩니다.추천 시스템을 시간 변화에 적응시키는 방법은 실질적인 의미가 큽니다.
  3. 지식 맵으로 강화된 GNN 추천은 지식 맵을 사용하여 더 많은 외부 지식을 도입하고 추천의 품질을 향상시키며 더 많은 다양성 및 공정성 지표를 고려합니다.
  4. 대규모 산업 시스템의 효율성 및 확장성, 효율성 및 대용량 데이터.
  5. 데이터 희소성 문제를 완화하기 위해 자체 감독을 사용하는 자체 감독 GNN.
  6. 대화 추천, 채팅 중에 추천하기.
  7. 적응형 GNN 추천, 일반적인 GNN 추천 시스템을 생성하기 위해 Auto ML 및 기타 기술을 결합하는 방법, 추천에 대한 많은 시나리오가 있습니다.

추천

출처blog.csdn.net/weixin_45884316/article/details/124485736