일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- CiD
- measurement protocol
- mp
- ga이탈률
- clientID
- GA
- google anlaytics 쿠키
- Pageview
- ga종료율
- sessions
- 세션
- 사용자
- google analytics
- Users
- GA입문
- ga쿠키
- 이탈률
- GA mp
- GA지표
- GA measurement protocol
- 페이지뷰
- 종료율
- Today
- Total
데뚱의 마케팅분석 주절주절
[GA]쿠키와 클라이언트 ID 이해하기 본문
구글애널리틱스(GA)를 활용하면서 떠올리게 되는 가장 기초적인 질문 중 하나는 “어떻게 GA는 각각의 세션과 사용자를 구분해낼 수 있을까?” 라는 질문이다. 이에 답을 얻기 위해서는 먼저 쿠키와 클라인언트 ID의 개념의 이해해야 한다.
1. 쿠키(cookie)에 대한 이해
기본적으로 쿠키는 웹사이트에서 사용자의 정보를 기억할 수 있도록 하드디스크에 저장하는 정보라고 할 수 있다. 보다 구체적으로는 서버에 의해 클라이언트 측에 저장되는, 향후 사용을 위한 정보’라고 할 수 있다. 일반적으로 쿠키는 사용자의 기본 설정 등을 기록한다.
웹사이트에 삽입하는 구글애널리틱스 추적 스크립트(analytics.js) 도 유저에 대한 필요한 정보(cid, 브라우저, 기기 등)를 저장하고 식별하기 위해 _ga라는 이름의 쿠키를 사용자의 하드디스크에 저장하게 된다.
이러한 _ga 쿠키는 마지막 상호작용으로부터 기본적으로 2년간 저장되게 된다. 만약 사용자가 2년 내 사이트를 방문한다면 기존 만료 날짜에서 최신 날짜로 업데이트 되어 다시 2년을 카운팅 하게 된다.
구글애널리틱스와 같이 쿠키를 통한 유저 식별 방식은 한계도 가지고 있는데, 사용자가 언제든 쿠키를 지울 수 있다는 점이다. 사용자가 사이트를 방문하면 _ga 쿠키와 그 안에 임의의 고객 ID, 이른바 클라이언트 ID를 부여받게 되고 이를 토대로 상호작용 정보를 구글애널리틱스로 전송하게 되는데, 만약 이 쿠키를 삭제하고 사이트로 돌아오면 새로운 쿠키와 클라이언트 ID를 받게 된다. 당연히 처음 방문했을 때와 그 다음 방문 시에 클라이언트 ID가 달라 해당 사용자는 신규 사용자로 구분된다. 정리하면, 구글애널리틱스 보고서의 사용자(visitor)는 특정 개인을 나타내는 것이 아니라, 여러 가지 이유로 변경될 수 있는 특정 클라이언트 ID를 나타낸다는 점을 유념해 두어야 한다.
또한 _ga 쿠키와 클라이언트 ID는 브라우저마다 각각 생성되며, PC와 모바일 등 기기에 따라서도 별도로 생성된다. 특히 주의할 점은 카카오톡이나 네이버앱 등 모바일 앱은 별도의 브라우저로 고려되어 다른 클라이언트 ID를 부여받는 것을 알아야 한다. 즉, 같은 모바일이더라도 어떤 앱을 사용해서 사이트에 접근하느냐에 따라 클라이언트 ID가 달라질 수 있다. 이와 같이 브라우저나 장치가 다르면 쿠키와 그에 따른 클라이언트 ID가 달라지므로 다른 사용자가 된다.
2. 클라이언트 ID (cid)에 대한 이해
앞서 말한 _ga 쿠키는 그 내부에 유저마다 부여되는 임의의 클라이언트 ID를 저장한다. 사용자가 사이트에 도착하면 구글애널리틱스 추적 코드가 실행되어 _ga 쿠키가 이미 있는지 확인하게 된다. 만약 기존의 쿠키가 있다면 그 쿠키의 정보를 읽어오고, 그렇지 않은 경우 새 사용자에 대한 새로운 쿠키와 클라이언트 ID가 무작위로 생성된다.
클라이언트 ID는 아래와 같이 구성된다.
GA1.2.12349876.1500644855
– GA1 : 사용중인 쿠키의 버전을 나타낸다.
– 2 : 쿠키가 설정된 위치에 따라 다르다. 쿠키가 설정된 도메인 이름의 점(.)의 갯수이다.
(ex datalicious.com = 1, www.datalicious.com = 2).
– 12349876 : 사용자를 식별하기 위해 무작위로 생성된 값이다. 흔히 이 부분은 cid라 부름
– 1500644855 : 사용자가 처음 사이트를 방문한 타임 스탬프이다.
구글애널리틱스에서는 보통 세 번째와 네 번째 숫자 세트를 사용하여 사용자를 고유하게 식별하는데 사용하게 된다. 페이지 뷰, 이벤트, 거래 등 사용자의 상호작용은 각각 이러한 cid를 포함하여 구글애널리틱스로 보내지게 된다. 때문에 cid별 사용자 기록을 정리할 수 있게 되는 것이다.
클라이언트 ID, cid는 유저 레벨의 분석 뿐만 아니라 CRM 데이터와의 연동에서 유용하게 쓰인다. 보통 클라이언트 ID를 _ga쿠키로부터 읽어서 이를 GA에 맞춤 측정기준으로 기록하면서 동시에 CRM에도 함께 기록하게 된다. 이렇게 되면 GA데이터를 CRM에 접목할 때, 혹은 반대로 CRM 데이터의 특정 데이터를 GA에 업로드할 때 cid를 기준으로 해당 데이터들을 붙여 넣을 수 있게 된다. 게다가 클라이언트 ID를 키값으로 사용하게 되면 이전에 인증되지 않았던 세션에 대해서도 CRM 데이터와 연계할 수 있는 장점을 얻을 수 있다.
이러한 클라이언트 ID를 활용한 데이터 연계 방법은 다른 칼럼에서 자세히 소개하도록 하겠다.
'Google Analytics' 카테고리의 다른 글
[GA] 비상호작용(Non-Interaction) 활용 (1) | 2020.07.30 |
---|---|
[GA] Measurement Protocol 활용하기 (0) | 2020.07.29 |
[GA] 이탈률 VS 종료율 (0) | 2020.07.29 |
[GA] 입문자를 위한 GA 기본 지표 파헤치기 (0) | 2020.07.29 |