GA 보고서 흐름과 유저와 세션의 중요성, 의미
우리 사이트의 고객은 누구고, 어떻게 들어왔고, 들어와서 무엇을 했으며 어떻게 value를 창출했는가
audience, acquisition, behavior, conversion
measurement protocol 방식
뒤에다가 parameter을 달아서 데이터를 보낸다
보내게 되면 수집이 되고, 가공이 된 후 real data 확인 가능
t - hit의 변수를 나타내는 것
tid - UA에 대한 주소값
다른 쪽에 데이터가 쌓이면 안됨
스니펫은 웹/앱 환경에 넣는 자바스크립트 언어다
웹이 아닌 경우는 어떻게 해야하나 install program(응용 프로그램) 만들었을 때는 measurement protocol만 맞춰서 하면 된다. 키오스크 & 응용프로그램 전부 데이터 수집 가능하다.
pageview hits
event hits
ecommerce hits
social interaction hits
GA를 빅쿼리로 연동해서 데이터를 적재하면 raw data를 확인할 수 있다
전송방식은 head script에 삽입하는 방법과 GTM(구글 태그매니저) 활용해 스크립트 반영없이 태그를 생성, 삭제, 변경이 가능하다.
Dimensions & Metric (기준 & 지표)
모든 것은 Dimension (기준 - 소스/매체)를 기준으로 획득, 동작(행동), 전환 데이터가 나타난다.
Dimensions : 데이터의 특징이나 성질을 묘사
ex) 국가, 도시, 브라우저 언어, 소스, 페이지 url, 페이지 제목 등
Metrics : 데이터의 정량적 요소
ex) 세션 수, 사용자 수, 페이지 뷰, 이탈율, 전환률 등
USER
여기서 UA의 '사용자 수'는 쿠키에 있는 '클라이언트 ID' 로 계산
ID의 경우 중복은 자동으로 제거, 다만, 각 쿠키는 브라우저의 제제를 받고 있다는 점!
ex. 오전에는 크롬 쿠키, 오후에는 익스플로어 쿠키를 사용할 시 유저 수가 2개가 되는 것이다.
(둘 ID는 다르다. 그렇기에 유저 수가 2가 된다)
GA4는 유저 카운팅에 다양한 방법 사용
디바이스 아이디, 유저 아이디, 구글 시그널(gmail, 크롬계정정보) 사용
예전에는 user = unique visitor (중복값 제거)
다만, 주기적으로 쿠키를 삭제할 시 계속 신규 방문자로 남는다 (쿠키 민감해서 삭제하는 고객의 경우)
SESSION
시작과 끝이 있다.
랜딩했을 때의 시작, exit했을 때의 끝이 존재하는 영역이다.
1- 기본 30분에 한 번 세션이 분리된다
예를 들어, 9시에 사이트 메인페이지에 방문, 9시 5분에 두번째 페이지 보았다. 9시 40분에 세번째 페이지를 보았다면 세션이 두 개로 분리된다. 35분의 텀이 생겼기 때문이다. 하지만 9시에 사이트 메인페이지 방문, 9시 5분 두번째 페이지, 9시 30분에 세번째 페이지, 9시 45분에 네번째 페이지일 시 텀이 30분이 아니기 때문에 세션은 하나다.
중간에 텀이 없으면 하나의 세션으로 이어진다.
ex1) 영국에 랜딩, 다른 나라들 들렸다가 한국 오면 "여행은 한 번! 하나의 여행을 이야기한다"
2- 유입이 바뀌어도 세션이 끊긴다. (트래픽 소스가 바뀌었을 때)
페이스북 통해서 클릭하고, 사이트를 방문했을 때 30분 이전에 인스타그램/유튜브를 통해 배너를 클릭해서 들어갈 시 세션 1, 세션 2로 나뉜다. 유입 소스가 바뀌면 세션이 중간에 분리된다.
3- 저녁 12시에 세션이 한 번 더 나뉜다
*** 세션을 중심으로 전환율과 이탈률이 어떤지 고민 필요