expresiones regulares google analytics

Expresiones regulares en Google Analytics

Las expresiones regulares son patrones utilizados para encontrar una determinada combinación de caracteres dentro de una cadena de texto. Utilizar expresiones regulares en Google Analytics es una de las formas de agilizar el proceso de extracción de datos. A grosso modo, recurrir a expresiones regulares en los campos de filtros de Analytics nos permite reducir la totalidad de filtros a uno.

Es necesario conocer el funcionamiento de las expresiones regulares para sacarles el mayor partido posible dentro de tu herramienta de medición. A continuación te explicamos con ejemplos qué significa cada caracter y qué debes tener en cuenta a la hora de utilizarlos.

La barra invertida: \

Es muy importante que sea esta la primera expresión regular que controles. La barra invertida transforma un carácter de una expresión regular en un carácter común. Por ejemplo, si utilizamos una expresión regular que incluye un punto (“.”) pero no queremos que ese punto actúe como regex (y a continuación verás cómo funciona ese punto), debemos escapar el carácter mediante “\”. Paginaweb\.es

El pipe: |

Encontrarás el símbolo del pipe en la tecla del “1” de tu teclado. Es una de las expresiones regulares más utilizadas y actúa como una disyuntiva “OR”. Es decir, si en el campo de filtro de Analytics incluyes a|b, le estás diciendo a la herramienta que te muestre solo los resultados que sean “a” o “b”.

El punto: .

Al explicarte el símbolo de escape o barra invertida te poníamos un ejemplo en el que teníamos que escapar el punto del dominio para que no actuase como expresión regular. El punto “.” es un carácter tipo regex que significa que puede ser sustituido con cualquier carácter individual (sea una letra, un número o un símbolo). Por ejemplo, si filtramos en Analytics por “h.ola”, nos aparecerán como resultados válidos “hola”, “h4la” y “hala”.

El uso más común del punto en las expresiones regulares es para los filtros de direcciones IP. Como sabes, las IP tienen un formato similar a “1.2.3.456”. Si en los filtros de Analytics incluimos esa expresión, va a interpretar los puntos como un carácter de expresión regular, cuando en realidad no queremos que sea así. Lo que debemos hacer es escaparlos mediante la barra invertida que hemos visto antes, “\”: “1\.2\.3\.456”.

El asterisco: *

Significa que el carácter anterior al asterisco puede estar una o más veces. Siguiendo con el ejemplo anterior, con la regex “ho*la” tendríamos “hola”, “hooooola” y “hooooooooola”. El carácter anterior tiene que estar al menos una vez.

La interrogación: ?

Significa que el carácter anterior a la interrogación puede estar una o cero veces. Fíjate en la diferencia con el asterisco. Una o cero, en lugar de una o más. Por ejemplo, la expresión regular “ho?la” nos lanzaría como resultados válidos “hola” y “hla”, pero nunca “hoola”.

El sombrerito: ^

Cuando empleamos este carácter como expresión regular, le estamos diciendo a Analytics que el filtro utilizado debe empezar sí o sí por el siguiente carácter. Por ejemplo: “^hola” nos mostrará resultados “hola” y “hola/producto/A.html”, pero nunca “/hola”, porque debe empezar sí o sí por “h”.

El símbolo del dólar: $

Justo el caso contrario al sombrerito, por eso te los contamos juntos. El dólar significa que los resultados tras el filtro deben terminar sí o sí por el último carácter de la expresión regular. Por ejemplo, “hola$” funcionaría con “hola”, “/productos/carahola”, pero no para “hol”.

Los paréntesis: ()

Igual que si de matemáticas se tratase, los paréntesis sirven para agrupar expresiones regulares. La regex “h(o|a)la”, en el que le estamos diciendo a Analytics que tras la “h” puede haber una “o” o una “a”, seguidas de “la”, nos devolvería como resultados “hola” y “hala”. Fácil, ¿verdad?

En el ejemplo que veíamos más arriba de filtros de direcciones IP encaja muy bien el uso de paréntesis. Imagínate que quieres excluir el rango completo de direcciones IP de tu oficina, para no falsear los datos en la herramienta de medición. Además de “1.2.3.456”, en tu oficina utilizáis todo el rango hasta “1.2.3.460”, incluyendo los números dentro del rango (456, 457, 458, 459 y 460). En este caso, en lugar de hacer cinco filtros diferentes, podemos recurrir a una expresión regular combinada y reducir los esfuerzos: “1\.2\.3\.(456|457|458|459|460)”. Empieza a volverse complejo, pero seguro que lo entiendes a la primera.

expresiones regulares google analytics

Las expresiones regulares que te hemos explicado en este post son las más comunes y las que más vas a utilizar en tu día a día como analista. No obstante, para que te suenen al menos, échale un ojo a la tabla que tienes justo encima de este párrafo para conocer el resto de regex. Recuerda que existen los corchetes (“[]”, con los que podemos crear listas de elementos de coincidencia) y los guiones (“-“, para listas). Por último, meterte en la cabeza que la mejor manera de aprender y acostumbrarse a utilizar expresiones regulares es practicar. Así que ya sabes lo que toca 🙂

The following two tabs change content below.

Javier Arenillas

Head of Analytics & CRO at Pompeii
Graduado en Comunicación Audiovisual y Máster en Dirección de Marketing DIgital y Comunicación Empresarial. Empecé en el equipo de Social Media de Europa Press. Tras co-liderar la digitalización de la startup Amovens, me aventuré al mundo de la consultoría y exprimí durante dos años y medio en The Cocktail los proyectos en los que trabajé (Real Madrid, Worten, Iberostar, Santander, etc.) dentro del área de Datos y Analítica. Ahora soy Head of Analytics & CRO en Pompeii, un pequeño e-commerce donde vendemos zapatillas muy molonas.

Latest posts by Javier Arenillas (see all)

3 thoughts on “Expresiones regulares en Google Analytics

  1. Hola Javier, muy buenos ejemplos, pero cómo sería la expresión regular en el caso de filtrar por rangos de números consecutivos. Por ejemplo en publicaciones identificadas por un ID consecutivos. Si quiero filtrar un rango desde 2345, 2346, 2347,… hasta 2485 cómo sería?

    1. Hola Alondra!! Puedes combinar los corchetes [] y las llaves {} para montar la expresión regular que necesitas 🙂
      Si utilizas “234[0-9]” significa que nos valdrá cualquier rango que contenga los números comprendidos entre 2340 y 2349. Si quieres un rango en decenas, podríamos utilizar “23[0-9]{1,2}” y tendríamos cualquier número comprendido entre 2300 y 2399. Recuerda que las llaves significan que el número anterior tiene que estar un mínimo y un máximo de veces. Saludos!!

      1. Javier! gracias por la respuesta, en esos casos que mencionas funciona, pero si el rango es 35179-36217, no logro dar con la secuencia 🙁 En este caso que podría aplicar?

Deja un comentario

Tu dirección de correo electrónico no será publicada.