Volver a la lista de artículos Artículos
Lectura de 7 minutos

Aprenda SQL con datos GA4 reales: Guía práctica para principiantes

¿Siente curiosidad por saber cómo se ven los datos reales de comercio electrónico en SQL? En este artículo, analizará los eventos de Google Analytics 4 (GA4) de la tienda Google Merchandise Store mediante BigQuery y, de paso, adquirirá conocimientos prácticos de SQL.

¿Desea mejorar sus conocimientos de SQL con datos reales de comercio electrónico? En este artículo, explorarás los datos de Google Analytics 4(GA4) utilizando SQL en BigQuery, el almacén de datos basado en la nube de Google. GA4 es la plataforma de análisis web de Google utilizada por millones de sitios web y aplicaciones para realizar un seguimiento de cómo interactúan los usuarios con su contenido. Está muy extendida en la analítica digital, lo que hace que los conocimientos de GA4 sean muy valiosos en el mercado laboral y en muchas empresas. Si conecta su propiedad GA4 a BigQuery, podrá almacenar estos datos de eventos sin procesar y consultarlos mediante SQL. Esto te permite ir más allá de los informes integrados de GA4 y analizar el comportamiento de los usuarios con mucho más detalle.

Google ofrece un conjunto de datos GA4 gratuito en BigQuery: ga4_obfuscated_sample_ecommerce.events_20210113. Contiene datos de eventos reales de Google Merchandise Store (la tienda online oficial de Google para productos de marca como camisetas, tazas y accesorios) capturados el 13 de enero de 2021. Encontrarás vistas de productos, adiciones al carrito, compras e información del usuario como la ubicación o el tipo de dispositivo. Se trata de un conjunto de datos ligero y real, perfecto para aprender SQL.

¿Necesita un repaso rápido de SQL? Pruebe nuestro curso interactivo de SQL para análisis de datos. Es la forma más rápida de aprender los conceptos básicos que utilizará a lo largo de esta guía.

Conozca el conjunto de datos

En esta guía, utilizaremos un conjunto de datos público y gratuito en BigQuery:
bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113 .

GA4 utiliza un modelo basado en eventos, en el que cada interacción del usuario (como ver un producto, añadirlo al carrito o completar una compra) se registra como un evento independiente. Cada fila del conjunto de datos representa una de estas interacciones y contiene tanto campos estándar (como el nombre del evento y la fecha y hora) como estructuras anidadas (como detalles del producto o parámetros del evento).

A continuación se indican algunas columnas clave con las que trabajará:

  • event_name: el tipo de acción del usuario, como page_view, view_item, add_to_cart, begin_checkout, o purchase
  • user_pseudo_ididentificador de usuario anónimo
  • event_timestampcuándo se produjo el suceso
  • event_paramsdetalles relacionados con el suceso (almacenados como pares clave-valor)
  • itemsdatos de producto anidados para eventos como view_item o una compra.

¿Qué eventos son los más comunes?

Empecemos por ver qué hacen los usuarios en el sitio. Esta consulta muestra los tipos de eventos más comunes y cuántos usuarios los desencadenaron:

SELECT
  event_name,
  COUNT(DISTINCT user_pseudo_id) AS unique_users,
  COUNT(*) AS total_events
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
GROUP BY event_name
ORDER BY total_events DESC;

Esta consulta muestra las acciones más comunes de los usuarios. Como era de esperar, page_view lidera con más de 15.000 eventos. Sólo 34 usuarios completaron una compra, mientras que muchos más vieron productos o los añadieron al carrito: una clara caída típica de los embudos de comercio electrónico.

event_nameunique_userstotal_events
page_view403415653
user_engagement32669698
scroll19445091
session_start40434478
first_visit34393440
view_item7312990
view_promotion14632127
add_to_cart168665
begin_checkout79398
purchase3436

Seguimiento del embudo de compra

A continuación, vamos a construir un embudo básico para comprender cuántos usuarios pasan de la navegación a la compra. Contaremos cuántos usuarios únicos desencadenaron cada uno de los eventos clave del comercio electrónico:

SELECT
  event_name,
  COUNT(DISTINCT user_pseudo_id) AS users
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
WHERE event_name IN ('view_item', 'add_to_cart', 'begin_checkout', 'purchase')
GROUP BY event_name
ORDER BY users DESC;

Esto le muestra cómo los usuarios abandonan en cada etapa del recorrido de compra. Es probable que observe que hay más usuarios que ven los artículos que los que realmente los compran, al igual que en la mayoría de las tiendas en línea.

event_nameusers
view_item731
add_to_cart168
begin_checkout79
purchase34

Analizar lo que compra la gente

¿Quiere saber qué productos compran más los usuarios? Muchos eventos de comercio electrónico incluyen detalles de los productos en un campo anidado llamado artículos. Para acceder a él, utilizaremos la función UNNEST().

He aquí cómo encontrar los 10 productos más comprados:

SELECT
  item.item_name,
  COUNT(*) AS purchases
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`,
  UNNEST(items) AS item
WHERE event_name = 'purchase'
GROUP BY item.item_name
ORDER BY purchases DESC
LIMIT 10;

Y aquí está el resultado:

item_namepurchases
Google Pride Sticker4
Google Sherpa Zip Hoodie Navy4
Google Light Pen Red3
Google Black Cloud Zip Hoodie3
Google Crewneck Sweatshirt Green3
Google Metallic Notebook Set2
Unisex Google Pocket Tee Grey2
Google Large Standard Journal Grey2
Google Sherpa Zip Hoodie Charcoal2
Google Soft Modal Scarf2

También puede analizar los precios de los productos y calcular los ingresos totales o medios.

Por ejemplo, esta consulta devuelve los ingresos totales por producto:

SELECT
  item.item_name,
  ROUND(SUM(item.price * item.quantity), 2) AS total_revenue
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`,
  UNNEST(items) AS item
WHERE event_name = 'purchase'
GROUP BY item.item_name
ORDER BY total_revenue DESC
LIMIT 10;

Es una buena manera de encontrar los productos más vendidos de su tienda.

item_namepurchases
Google Pride Sticker4
Google Sherpa Zip Hoodie Navy4
Google Light Pen Red3
Google Black Cloud Zip Hoodie3
Google Crewneck Sweatshirt Green3
Google Metallic Notebook Set2
Unisex Google Pocket Tee Grey2
Google Large Standard Journal Grey2
Google Sherpa Zip Hoodie Charcoal2
Google Soft Modal Scarf2

Segmentar usuarios por país

Los datos de GA4 también incluyen información sobre la ubicación y el dispositivo de cada usuario. Puedes segmentar el tráfico por geo.country.

Aquí tienes una consulta que muestra desde dónde compran los usuarios:

SELECT
  geo.country,
  COUNT(DISTINCT user_pseudo_id) AS unique_buyers
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
WHERE event_name = 'purchase'
GROUP BY geo.country
ORDER BY unique_buyers DESC;
countryunique_buyers
United States19
Canada4
Italy2
United Kingdom1
Germany1
Japan1
Singapore1
Netherlands1
Taiwan1
Malaysia1
Poland1
Hong Kong1

Practica más por tu cuenta

Ahora que ha trabajado con los ejemplos guiados, es el momento de practicar por su cuenta. La mejor forma de desarrollar tus habilidades SQL y pensar como un analista de datos es explorar los datos con tus propias preguntas en mente.

  • Desglosar las compras por fuente de tráfico (traffic_source.source)
  • Comparar el tamaño medio de los carritos entre usuarios de móviles y de ordenadores de sobremesa
  • Analizar las visitas a productos que no han conducido a una compra
  • Construir una ruta a nivel de sesión para un único usuario

He aquí algunos retos prácticos que puede intentar a continuación:

  • Desglosar las compras por fuente de tráfico. Averigüe qué fuentes (como Google, directas o de referencia) están impulsando la mayoría de las compras utilizando traffic_source.source.
  • Comparar el tamaño medio de la cesta entre usuarios de móvil y de ordenador. Utilice los datos de los dispositivos para averiguar si el comportamiento de los usuarios cambia en función de la plataforma.
  • Analice las visitas a productos que no condujeron a una compra. Identifique los puntos de abandono en el embudo comparando los eventos view_item y purchase.
  • Construir una ruta a nivel de sesión para un único usuario. Elija un user_pseudo_id y reconstruya su recorrido paso a paso utilizando event_timestamp.

Cuanto más experimente con este tipo de consultas, mejor comprenderá los datos y más seguro se sentirá a la hora de aplicar SQL a problemas empresariales reales.

Reflexiones finales

Aprender SQL es mucho más interesante y práctico cuando se trabaja con datos reales. Especialmente cuando esos datos reflejan el comportamiento real de los usuarios en una tienda online real, como Google Merchandise Store. No se trata sólo de teoría; es la forma en que los analistas de datos, los profesionales del marketing y los equipos de producto trabajan cada día.

En este artículo, ha aprendido a

  • Escribir consultas utilizando datos reales de comercio electrónico de GA4.
  • Trabajar con campos anidados utilizando UNNEST()
  • Explorar eventos, productos, segmentos de usuarios y embudos

Al trabajar directamente con los datos de GA4 en BigQuery, ha dado un gran paso para pensar como un analista de datos: haciendo preguntas, escribiendo consultas significativas y encontrando información importante.

¿Quiere ir más allá? Consulte nuestro curso SQL de la A a la Z para construir una base sólida, o sumérjase en temas más avanzados con nuestros cursos interactivos de SQL.

Sigue practicando, mantén la curiosidad y ¡buenas consultas!