2020년 상반기 중 '빅데이터를 통한 데이트코스 추천 시스템 개발' 프로젝트를 진행한 적이 있습니다. 데이트 코스를 정하기 힘들어하는 사람들을 위해 맛집, 데이트 명소, 볼만한 영화를 한꺼번에 추천해주는 시스템이며, 단순히 사람들이 좋아하는 장소가 아닌 본인의 취향을 고려한 장소를 추천하는 시스템입니다.
저를 포함해 총 3명의 팀원이 진행을 했으며, 어느 한 사람이 역할을 맡기보단 위에서 언급한 맛집, 데이트명소, 영화 3가지 분야로 나누어 python을 통한 데이터 수집 및 전처리부터 모델링까지 모든 과정을 수행했습니다. 저는 그중 '맛집' 분야의 데이터 수집, 전처리, 모델링 과정을 수행하고, Neural Collaborative Filtering 모델을 리서치함과 동시에 적용할 수 있는 코드를 작성했습니다.
추천시스템은 저를 포함해 다른 팀원들도 처음 개발해보는 상황이었으며, 관련 지식은 전무했습니다. 그 때문에 처음 한달간은 거의 자료 수집 및 리서치에 시간을 투자하여 시간이 많이 부족한 상태였습니다. 공개된 추천 시스템들이 정말 다양하고 고도화되어있기 때문에 처음 접해본 저희로썬 바로 적용해보기가 힘들었습니다. 때문에 리서치에 상당한 시간이 걸려 처음 계획한 프로젝트 일정을 소화해내기가 힘들었습니다.
기존의 어려웠던 알고리즘을 적용하는 계획과는 다르게 좀 더 단순화 시켜서 파이프라인을 새로 만들었습니다. 해당 컨텐츠(맛집, 데이트명소, 영화)에 기록된 평점과 리뷰를 두가지 방향으로 나누었습니다. 리뷰 데이터 clustering을 통해 사람들의 취향을 묶어주는 하나의 방법과, Neural Collaborative Filtering을 통한 평점 예측 결과를 합쳐 Hybrid 추천 시스템을 개발하기로 결정한 뒤, 각자 파트를 나눠 개발을 진행하였고, 결국 최종 마감시간 전에 무사히 개발을 마칠 수 있었습니다.
물론 직접 서비스로 배포할 정도의 퀄리티는 아니었지만, 처음부터 끝까지의 과정을 빠르게 개발해보는 것을 통해 결과를 내보는 것까지 성공을 했습니다. 이렇게 어떤 시스템을 처음부터 끝까지 개발해보는 것은 처음이라 무척 보람이 있었고, 가장 기억에 남는 프로젝트 중 하나로 남았습니다.
깃허브에 자세한 내용이 담겨있으니 궁금하신분은 살펴보시기 바랍니다!
https://github.com/DAC-KHUPID/seoul-date-course-recommendation
사용된 패키지
'Project' 카테고리의 다른 글
한국 ETF 시각화 플랫폼 개발 (0) | 2021.03.22 |
---|---|
얼굴인식기반 실시간 교육 플랫폼 KHU-FaceID (0) | 2020.08.23 |