Search

개인의 입맛에 맞는 빵집들을 추천해주는 추천 서비스

프로젝트 주제 & 개요

내 취향의 빵을 판매하는 유명한 빵 맛집을 재미있고, 쉽고, 편하게, 찾을 수 있는 추천 시스템 제작 MBTI 테스트 유형을 차용하여 이용자의 빵 입맛 유형을 알아보고 빵집 추천

주요 역할

데이터 수집 및 가공, 데이터 전처리, 데이터 분석 및 시각화, 서비스 페이지 제작

데이터 분석

서비스 제작에 사용한 데이터의 범위

인스타그램 최근 3개월(22.07~22.10)언급량 순위 반영헤 트렌디한 18 종류의 빵 선정 서울 내의 빵집으로 한정하여, 빵 종류 마다 네이버 플레이스 영수증 리뷰 500개 이상의 인기 빵집만을 선별

마켓컬리 베이커리 카테고리 상품 설명과 네이버 플레이스 빵집 리뷰를 텍스트분석

네이버 플레이스 빵집 리뷰 텍스트 분석을 통해, 빵집의 특성(e.g. 인기 많은, 선물 하기 좋은) 추출 및 그룹핑
K-means 군집분석을 활용하여, 추출된 빵 특성(e.g. 달달, 바삭, 짭짤, 꾸덕)에 따라 그룹핑

분석과정 더욱 자세히 살펴보기

특성 별 분석 절차

빵 특성 데이터 분석 절차

형태소 분석 > 빈도 분석 > 토큰화 및 분류작업 > 키워드 수치화 작업 > 군집 분석
형태소 분석 > 빈도 분석 > 토큰화 및 분류작업 > 키워드 수치화 작업
마켓컬리 웹페이지에서 스크래핑한 빵 설명 데이터를 파이썬 kiwi 형태소 분석기를 활용하여 진행 빈도 분석 및 어미어간 제거를 통해 각 종류 별로 빵의 특성을 나타내는 키워드만을 뽑아 분석 18개의 빵 데이터에서 빵의 특성을 나타내는 키워드 선별 후 출현 여부에 따라 0과 1로 코드화
군집 분석
계층군집화 및 k-means 분석
다른 군집과의 확연한 차이를 보였던 계층군집화 완전연결방법 채택
18개의 빵 종류는 총 8개의 조로 군집이 형성

빵 맛집 특성 데이터 분석 절차

토크나이저 선정 > 형태소 빈도 분석 > 키워드 딕셔너리 제작 > 키워드 수치화 작업 > 군집 분석 > 그룹핑 및 특성도출
형태소 빈도 분석
인터넷 리뷰 분석에 좀 더 적합한 토그나이저인 Python konlpy를 활용하여 분석을 진행
키워드 딕셔너리 제작
직접 리뷰 데이터를 살펴보며 빵집 이용의 맥락과 빵집 별 특성을 나타낼 수 있는 중요 단어들을 선별
선별한 단어들을 같은 주제를 나타내는 단어들끼리 묶어 키워드를 그룹핑
그룹핑한 키워드를 바탕으로 빠지면 안되는 단어들을 모아 사용자 사전을 제작
분석에 도움이 되지 않는 단어들을 모아 불용어 리스트를 제작
군집 분석 > 그룹핑 및 특성도출
K-means 분석 결과 기각
키워드 그룹핑으로 뽑힌 빵집의 특성을 기준으로 각 특성에 따라 4점 척도 매김
4점의 높은 점수를 보이는 빵집(베스트셀러 빵집)만을 직접 선별해 서비스에 활용
각 빵 맛집 별로 4점을 받은 특성들이 해당 빵집의 대표 키워드로 선정

서비스 제작

하단에 링크를 클릭하시면 빵BTI 유형테스트 사이트로 이동합니다.

서비스 구현 화면