AI 프로그래밍

KKBox's Music Recommedndation Challenge 분석

애라니라니 2023. 4. 25. 10:34

- 2023.04.25


음악 추천 프로그램

 

https://tinyurl.com/5f6bb4ed

 

WSDM - KKBox's Music Recommendation Challenge | Kaggle

 

www.kaggle.com

 

WSDM 2018 과제 : KKBox에서 제공한 데이터를 바탕으로 음악을 추천해주는 모델 만들기

: train.csv / test.csv

songs.csv, members.csv, song_extra_info.csv 는 노래와 사용자에 대한 세부 정보 보관

--> 총 6개의 파일

 

 

 

데이터 파악하기

 

  • train.csv
  • msno (user_id)
    song_id
    source_system_tab (모바일 기능)
    source_screen_name (사용자가 보는 화면)
    source_type (모바일에서의 접근점)
    target (1 = 반복되는 청취 이벤트 O, 0 = 한 달 이내에 트리거 되지 않음)

 

 

  • test.csv
  • msno (user_id)
    song_id
    source_system_tab
    source_screen_name
    source_type

 

 

  • sample_submission.csv
  • id, target

 

 

  • songs.csv
  • song_id, song_length, genre_ids, artist_name, composer, lyricist, language

 

 

  • members.csv
  • msno
    city
    bd (이상 값이 포함될 수 있음)
    gender
    registed_via (등록 방법)
    registration_init_time (시간)
    expiration_data (날짜)

 

 

  • song_extra_info.csv
  • song_id, name, isrc (International Standard Recording Code) 

 

 

특징

 

  • train.csv
  • source_type, source_system_tab, source_screen_name에 대한 plot

 

 

  • songs.csv
  • registered_via / language plot

 

train-validation-split

 

train.csv에 데이터를 train / validation으로 구분