쿡앱스 강연 요약 (게임 개인화 서비스와 유저 클러스터링을 위한 데이터)

지난 3월 25일, 텐투플레이가 쿡앱스에 연사로 초청받아 강연을 진행하였습니다. 쿡앱스는 북미 및 유럽시장을 타깃으로 캐주얼 모바일 게임을 제작하는 게임회사로, 대표 게임으로 모던시티, 하와이라이프, 랜덤로얄 등이 있습니다. 주로 3매치 퍼즐게임, 머지게임, 디펜스 게임 등을 제작하고 있습니다. 쿡앱스 내부 임직원들을 대상으로 교육을 진행하였으며, 게임 유저에게 개인화 서비스를 제공하기 위한 유저 클러스터링 방법론과 사례를 소개하였습니다. 텐투플레이가 진행한 강연의 내용을 요약하여 소개합니다.


cook apps

1. 게임 개인화 서비스, 해야 하는 이유

게임 유저들은 다양한 플레이 동기를 가지고 게임을 플레이합니다. 쓰리매치 게임 "에이미의 인테리어"의 리뷰를 살펴보면 같은 게임인데도 어떤 유저는 인테리어 디자인이 예뻐서, 어떤 유저는 퍼즐이 귀엽고 효과가 좋아서, 어떤 유저는 스토리가 재미있어서 플레이한다고 되어 있습니다.

personalization services of games

또, 디펜스 게임 "랜덤로얄"의 경우 카드의 종류가 많고 다채로운 전략 및 카드 구성이 가능해서, 전설카드를 충분히 다 모을 수 있을 만큼의 난이도여서, 뽑기가 재미있어서 유저들이 플레이하기도 합니다.

personalization services of games

이와 같이 게임 유저들은 다양한 플레이 동기를 가지고 게임을 하는데, 이때 각 유저들이 원하는 것을 제때 제공해 준다면, 매출과 잔존율을 극대화할 수 있습니다.

2. 유저 유형 분류하기, 클러스터링

유저의 플레이 동기를 파악하기 위해서는 기존에는 설문조사를 많이 활용하였습니다. 하지만 내 게임 유저들을 대상으로 매번 설문조사를 진행하고, 그때그때 맞춤형 서비스를 제공하기란 쉽지 않습니다.

유저들의 플레이 성향, 플레이 동기를 설문 조사가 아닌, 게임 로그 데이터로 감지하고, 이를 기반으로 유저를 클러스터링 하면 유저들에게 맞춤형 서비스를 제공할 수 있습니다.

클러스터링이란 주어진 데이터를 특성에 따라 유사한 것끼리 묶어 각 유형별 특징을 분석하는 것을 가리킵니다.

clustering

게임에서도 게임 내 행동 패턴에 따라 유저를 분류하면 이때 각 세그먼트가 어떤 것을 원하는지, 어떤 플레이 동기를 가지고 있는지 파악할 수 있습니다. 그럼 이 세그먼트에게 무엇을 제공하면 좋을 지도 구상할 수 있습니다.

3. 유저 유형 분류하기, 어떤 데이터로 분류해야 할까?

그렇다면, 게임 내 행동 패턴을 기반으로 유저를 분류하고, 플레이 동기를 파악하려면 어떤 데이터를 기반으로 분류해야 할까요?

categorize users

일반적인 게임사와 백엔드 서비스는 게임 데이터를 기존의 데이터를 업데이트 하는 방식으로 기록하고 있습니다. 즉, 시간의 흐름에 따른 시계열 데이터(Time Series)가 아닌, 주어진 시간 혹은 한 시점에서 얻은 데이터(Cross Sectional)로 데이터를 보관하고 있는데요, 이는 비용을 절감하면서 게임 운영을 위한 데이터를 저장하기에는 좋은 방식입니다. 그러나 유저의 행동을 분류하고 분석하기 위해서는 적합하지 않습니다. 왜냐하면 cross sectional data는 행동에 대한 "결과"만 알려주기 때문입니다.

즉, 매일매일 데이터를 저장은 하지만, 기존의 데이터를 업데이트 하는 방식은 가장 마지막(최근)시점의 데이터만 파악하고 있기 때문에 유저가 특정 기간동안 어떤 식으로 게임을 플레이해왔는지는 알 수 없습니다.

예를 들어 아래 그림의 왼쪽의 경우, 한 시점에 대한 데이터를 보았을 때는 AAA유저와 BBB유저가 동일한 날짜에 가입하여 동일한 레벨을 달성한 것을 알 수 있습니다. 하지만 오른쪽 시계열 데이터로 살펴보았을 때, AAA유저는 꾸준히 로그인하고 꾸준히 레벨을 향상시킨 반면, BBB유저는 일주일에 한번씩 접속하여 레벨을 한꺼번에 올리는 플레이 패턴을 보이는 것을 알 수 있습니다.

game user data

이처럼 유저의 행동 패턴을 파악하고 클러스터링을 하기 위해서는 누적 데이터 또는 한 시점에 대한 데이터가 아닌 시계열 기반의 행동 로그 데이터를 쌓아야 합니다. 시계열 기반으로 행동 로그 데이터를 쌓기 위한 방법론은 예전 블로그에서 소개한 바 있습니다.

[시계열 기반으로 행동 로그 데이터를 쌓기 위한 방법론]

1. 게임 로그의 기본은 '육하원칙'

2. 게임 로그 시스템 설계 4단계

3. 게임 로그 시스템 최적화하기

4. 좋은 게임 로그 시스템을 위해 알아야 할 3가지

이와 같이 데이터를 쌓는다면, 유저 클러스터링을 진행하고 결과를 테스트할 수 있습니다. 테스트 방법론은 게이머 클러스터링 방법론과 사례 2에서 계속됩니다.