15 Expresiones Regulares Clave para Analistas Digitales

Las expresiones regulares, o RegEx, son una herramienta poderosa para analistas digitales que buscan simplificar el análisis de datos.

Como ya sabes , uno de los pilares fundamentales en el día a día de un analista de datos en una agencia de publicidad es identificar patrones en conjuntos de datos de distintas fuentes.

Por esta razón , constantemente buscamos la manera de separar los datos que nos interesan de aquellos que no.

Y es , precisamente , en este punto donde el RegEx brilla ya que nos permite buscar y manipular texto con precisión, ahorrando tiempo y esfuerzo.

En este artículo, exploraremos cómo los analistas digitales usamos RegEx para mejorar nuestro trabajo, desde la limpieza de datos hasta la extracción de información valiosa.

¿Estás lista/o para potenciar tus habilidades analíticas y optimizar tus procesos?

Sigue leyendo para descubrirlo.

¿Qué son las Expresiones Regulares?

Las expresiones regulares, o RegEx, son patrones que se usan para buscar y manipular texto.

Imagina tener una lupa mágica que te permite encontrar exactamente lo que necesitas entre líneas de datos.

Así funcionan las expresiones regulares: te ayudan a identificar, extraer y modificar fragmentos específicos de información en grandes volúmenes de texto.

¿Cuánto RegEx debe manejar un Analista Digital?

Aunque he conocido colegas que prácticamente son “Desarrolladores RegEx ” no oficiales y construyen patrones avanzados tanto en pulcritud como en especificidad , la realidad es que llegar a ese nivel de experticia tiene una curva de aprendizaje importante.

Si estamos hablando sobre expresiones regulares en Snack es porque quiero facilitarte la vida , no hacerla más difícil.

Así que: no, no tenemos que ser expertos en RegEx.

La clave está en identificar aquellos carácteres (o serie de carácteres) que usarás más seguido en tus tareas diarias y familiarizarte tanto con ellas que llegue el punto en el que sea natural para ti utilizarlas.

Aquí te comparto los míos:

15 patrones RegEx clave para cualquier Analista Digital

1. Empieza con

  • RegEx : ^
  • Explicación: Coincide con el inicio de una cadena o texto.
  • Ejemplo: ^Hola coincidirá con cualquier cadena que empiece con “Hola” como “Hola, ¿Cómo va?” y “Hola y adiós”.

2. Termina con

  • RegEx : $
  • Explicación: Coincide con el final de una cadena o texto.
  • Ejemplo: mundo$ coincide con cualquier cadena que termine con “mundo” como “Hola , mundo” y “Edmundo”.

3. Coincide exactamente con

  • RegEx : ^texto$
  • Explicación: Es la combinación del “Empieza con” y “Termina con” y coincide con cadenas que son exactamente el valor que se encuentra en el texto.
  • Ejemplo: ^casa$ solo coincide con la cadena “casa” , no “casas” , “casos” o “carcasas”

4. Cualquier carácter

  • RegEx : .
  • Explicación: Coincide con cualquier carácter individual.
  • Ejemplo: per. coincide con “pera”, “pero” y “perú”.

5. Cero o más ocurrencias

  • RegEx : *
  • Explicación: Coincide con cero o más ocurrencias del elemento inmediatamente anterior.
  • Ejemplo: ia* coincide con las cadenas “Chile” (“a” cero veces) y “Colombia” (“a” una vez”) .

6. Una o más ocurrencias

  • RegEx : +
  • Explicación: Coincide con cero o más ocurrencias del elemento inmediatamente anterior.
  • Ejemplo: a+ coincide con las cadenas “Ecuador” (“a” una vez”) y “Contraatacar” (“a” dos veces) pero no con “Chile” (“a” cero veces).

7. Contiene

  • RegEx : .*texto.*
  • Explicación: Es la combinación de “Cualquier carácter” con “Cero o más ocurrencias” . Coincide con cualquier cadena que contenga el texto , independientemente de la posición que ocupe.
  • Ejemplo: .*gato.* coincide con “gato” , “gatos” y “¿Has visto al gato del vecino?”

8. Opcional

  • RegEx : ?
  • Explicación: Coincide con cero o una ocurrencia del elemento anterior.
  • Ejemplo: zapatos? coincide con “zapato” y “zapatos” al igual que doctora? con “doctora” y “doctor”

9. Rango

  • RegEx : [ ]
  • Explicación: Coincide con cualquier carácter dentro de los corchetes.
  • Ejemplo: [a-z] coincide con cualquier letra minúscula de la “a” a la “z”. Al igual que [0-9] coincide con cualquier número entre el 0 y el 9.

10. Operador “No”

  • RegEx : [^ ]
  • Explicación: Coincide con cualquier carácter que no esté en los corchetes.
  • Ejemplo: [^a-z] coincide con cualquier carácter que no sea una letra minúscula.

11. Carácter de Escape

  • RegEx : \ o \\
  • Explicación: Símbolo que se usa para tratar caracteres especiales como texto literal.
  • Ejemplo: Si quieres buscar un punto en un texto , necesitas usar el carácter de escape “\” porque el punto (“.”) es un carácter especial en regex. La barra invertida indica que el punto no debe ser interpretado como un metacaracter, sino como un punto literal. De este modo , usarías la expresión “\.” o “\\.”

12. Operador Lógico “O”

  • RegEx : |
  • Explicación: Coincide cualquier texto
  • Ejemplo: gato|perro|loro coincide con “gato” o “perro” o “loro” . Para llevar este RegEx a una funcionalidad superior combínalo con otros RegEx , por ejemplo : .*(gatos?|perros?|loros?).* coincide con “yo tengo varios perros” , “yo tengo un gato” y “yo tengo un perro, dos gatos y tres loros”

13. Operador Lógico “Y”

  • RegEx : No existe una expresión puntualmente para esto.
  • Explicación: Aunque no es común , se puede usar la combinación “(?=)” para simular el contrario a un “O”.
  • Ejemplo: “^.*(?=.*perro)(?=.*gato)(?=.*loro).*$” coincide con “yo tengo un gato, un perro y un loro” pero no coincide con “yo tengo un gato y un perro”, “yo no tengo gatos” o “yo tengo un gato, un hamster y un loro” .

14. Agrupación

  • RegEx : ( )
  • Explicación: Los paréntesis permiten que una parte de la expresión se considere un conjunto único. De este modo , es especialmente útil para capturar y extraer subexpresiones específicas.
  • Ejemplo: Digamos que queremos extraer solo el dominio de un texto conteniendo un correo electrónico , la expresión “@((.*?)[^\.]+)” y la función “REGEXP_EXTRACT” haría el truco.

15. Delimitador “/”

  • RegEx : /
  • Explicación: En algunos lenguajes , como JavaScript y Perl , se usa “/” para marcar exactamente dónde comienza y termina el texto que estamos interesados en analizar.
  • Ejemplo: “/^casa$/” sería el equivalente en JavaScript para ^casa$

Entender estos conceptos básicos te permitirá empezar a crear tus propias expresiones regulares y utilizarlas en tus análisis digitales.

Realmente el secreto del RegEx está en las combinaciones que puedes hacer cuando usas un poco de creatividad para mezclarlas y potenciarlas entre sí.

Las posibilidades son prácticamente infinitas; desde validar correos electrónicos hasta extraer datos específicos de grandes conjuntos de texto.

En la siguiente sección, te contaré algunos casos de uso prácticos de RegEx para analistas digitales, así que asegúrate de seguir leyendo para aprender más.

Dónde usar RegEx en Analítica Digital

En el mundo del análisis digital, las expresiones regulares (RegEx) son herramientas poderosas porque nos permiten buscar, filtrar y manipular grandes cantidades de datos de manera eficiente.

Estas son algunas ideas de cómo los analistas digitales aplicamos RegEx en nuestro trabajo diario.

Aplicaciones de RegEx en Google Analytics 4

Usar expresiones regulares en Google Analytics 4 no es solo para los técnicos y geeks de la tecnología; es un superpoder que tú también puedes tener para manejar tus datos.

Imagina poder controlar lo que ves y analizas, desde eventos específicos hasta audiencias concretas.

Filtrado de datos

¿Alguna vez has querido encontrar sólo esos eventos especiales o a esos usuarios únicos en tu vasto conjunto de datos? Las expresiones regulares son como un colador ultrafino para tus datos.

Por ejemplo, si deseas filtrar todos los eventos que incluyen la palabra “item” en su nombre, puedes utilizar una expresión como .*item.* :

Esto te ayudará a ver sólo las acciones relevantes en tus informes, sin rebuscar en un montón de datos irrelevantes.

¿Qué tal si únicamente quieres incluir en tus informes tráfico proveniente de las campañas “remarketing” y “awareness”? Usa RegEx sobre la dimensión de campaña para solo mostrar aquellas que coinciden con “.*(remarketing|awareness).*

Como ves , no necesitas ser un experto en programación , solo tener claro qué buscas y entender las bases de las expresiones regulares.

Segmentación de audiencia

Tus audiencias en GA4 pueden ser tan precisas como un reloj suizo usando RegEx . Imagina querer crear un segmento de usuarios que visitaron páginas específicas basadas en una palabra clave.

Por ejemplo, imagina que trabajas para una agencia de viaje y deseas crear una audiencia que agrupe a aquellos usuarios que han visitado páginas con paquetes promocionales a “Barcelona” , “Lisboa” y “Lima”.

En este caso, puedes usar la expresión “\/paquetes\/promocion\/(barcelona|lisboa|lima)” para capturar a cualquier visitante de páginas cuyas URIs contengan alguno de estos 3 destinos dentro de la ruta de paquetes con descuento.

Además, al diseñar campañas en Google Ads, estas segmentaciones refinadas pueden ser usadas para ajustar los mensajes publicitarios de manera más efectiva, asegurando que hablas directamente con la audiencia que realmente te interesa.

No subestimes el poder de una simple expresión regular; a veces, las herramientas más pequeñas son las más poderosas.

Aplicaciones de RegEx en Google Tag Manager

Las expresiones regulares, o RegEx, son como la magia detrás de bambalinas en Google Tag Manager (GTM). Nos permiten extraer y manipular datos de manera muy precisa.

En esta sección, exploraremos 3 ejemplos de cómo puedes utilizar RegEx para mejorar la eficiencia y efectividad de etiquetas , así como cuidar el rendimiento de tu contenedor.

Activación de Etiquetas

Ejemplo 1

Digamos que deseas seguir solo las URLs de productos que terminan en “-sale”.

Tu expresión regular podría ser algo como .*-sale$.

Al incluir esta expresión en tu activador de GTM a través de una variable de JavaScript personalizada, la etiqueta solo se activará en aquellas URLs que cumplan con este criterio final.

Es como usar una red muy específica para capturar solo los peces que quieres.

Ejemplo 2

Tienes una etiqueta que quieres ejecutar con múltiples activadores (‘gtm.click’ , ‘gtm.js’ y ‘gtm.visibility’).

En lugar de crear 3 activadores distintos , puedes crear un activador que se ejecute cuando cualquiera de estos eventos sucedan.

Personalización de Variable

Quédate con el último ejemplo.

Supongamos que queremos que la etiqueta asociada al activador ajuste el valor de uno de sus parámetros según el tipo de evento que la ha originado.

Por ejemplo:

  • Si la etiqueta ha sido activada por un evento de visibilidad (‘gtm.visibility’), el valor del evento registrado debería ser “conversion-visibilidad”.

  • Si la etiqueta ha sido activada por un evento de click (‘gtm.click’) o de vista de página (‘gtm.js’) , el valor del evento registrado debería ser “conversion-todos”.

En este caso, el tipo de variable “Tabla RegEx” puede ser lo que buscamos.

La Tabla RegEx revisará el nombre del evento (izquierda) y modificará su valor dinámicamente (derecha) según la expresión con la que coincida.

Llamaremos a esta variable: “categoria_conversion” y la usaremos en nuestra etiqueta de esta manera:

Usar RegEx en Google Tag Manager es como tener una herramienta de precisión. Nos da el poder de enfocar y dirigir nuestros esfuerzos de marcaje hacia donde realmente importan.

Aplicaciones de RegEx en Looker Studio

Cuando trabajas con grandes volúmenes de datos, encontrar patrones o hacer un reporte detallado puede parecer encontrar una aguja en un pajar.

Aquí es donde las expresiones regulares (RegEx) se convierten en una herramienta poderosa dentro del Looker Studio gracias a sus funciones de texto.

¿Cómo se integran exactamente las RegEx en Looker Studio?

Vamos a descubrirlo.

Transformación de Datos

Las RegEx no solo son para filtrar. También nos ayudan a transformar datos para mejorar el armado de visualizaciones.

Mira estos ejemplos:

  • Normalización de datos: Convierte formatos de fechas o ajusta el formato de nombres con REGEXP_REPLACE.

Por ejemplo:

Tenemos un campo de fecha que usa “-” como delimitador y queremos sustituirlo por “/”

  • Extracción de información clave: Si un campo contiene datos combinados, REGEXP_EXTRACT te ayudará a extraer solo la parte que necesitas en un nuevo campo.

Por ejemplo:

Tenemos un campo que contiene el mail de algunos usuarios y queremos extraer únicamente el dominio al que está asociado.

La capacidad de convertir datos en el formato correcto te permite presentar informes más claros, aumentando así la eficacia de tus análisis.

Creación de Campos Calculados

Para obtener insights más profundos, las RegEx te permiten crear campos calculados. Estos campos pueden ofrecer:

  • Nuevos grupos basados en condiciones: Detecta patrones clave y agrúpalos en una categoría.

Digamos que queremos agrupar todas las vistas de las páginas en tres grupos:

1) “Categoria” si se trata de una página de categoría en el blog.

2) “Post” si se trata de una página de artículo.

3) “Sitio” para cualquier otra página que no coincida con las categorías anteriores.

En este caso, la combinación de la función REGEXP_MATCH y el condicional “CASE” nos resultará muy eficiente.

  • Datos enriquecidos: Combina diferentes campos en uno nuevo para ofrecer un análisis más detallado.

Hagamos una ejemplo similar , pero ahora identifiquemos aquellas vistas de página pertenecientes a la categoría “analisis de datos” hechas desde un dispositivo de escritorio.

El combo REGEXP_CONTAINS y el condicional “IF” será más que suficiente.

¿Lo ves?

Integrar RegEx en Looker Studio es como agregar una lente de aumento a esta gran herramienta de visualización, permitiendo un enfoque más nítido y detallado.

Mejores Prácticas al Usar Expresiones Regulares

Cuando trabajas con expresiones regulares (RegEx) como analista digital, es esencial aplicar buenas prácticas para optimizar su rendimiento y mantener su legibilidad.

Aquí te comparto algunas recomendaciones para asegurarte de que tus expresiones regulares sean eficientes y fáciles de mantener.

  • Especificidad: Evita el uso excesivo de comodines como .*. Ser más específico en tus patrones puede reducir drásticamente el tiempo de procesamiento.

  • Anclas: Utiliza anclas (^ y $) para limitar la búsqueda a los inicios o finales de las cadenas, lo que acelera la coincidencia.

  • Grupos de captura: Usa grupos de captura (()) solo cuando sea necesario. Los grupos de captura innecesarios aumentan el tiempo de procesamiento.

  • Alternancias eficientes: Cuando usas el operador lógico “o” ( | ), coloca primero las alternativas más frecuentes. Esto permite que la coincidencia sea más rápida en la mayoría de los casos.

Tener presente estos puntos no solo hacen que tus expresiones sean más rápidas y eficientes, sino también más fáciles de leer y mantener a largo plazo.

La idea es que estas prácticas te ahorraren tiempo y posibles dolores de cabeza en el futuro.

Errores Comunes y Cómo Evitarlos

Aunque el uso de RegEx es muy útil (cómo ya hemos hablado) , también es muy fácil cometer errores que pueden entorpecer el análisis de datos.

Te cuento sobre los dos errores más frecuentes y cómo evitarlos.

No experimentar antes de implementar

Uno de los errores más comunes es no probar las expresiones regulares antes de usarlas.

Imagina construir una casa sin revisar los planos primero.

Del mismo modo, una expresión regular sin pruebas puede causar errores en tu análisis de datos.

¿Por qué es importante probar?

  • Asegura Exactitud: Probar permite confirmar que la expresión regular hace exactamente lo que debería hacer.

  • Evita Errores: Identifica fallos antes de que se implementen en un proyecto más grande.

  • Ahorra Tiempo: Arreglar problemas al inicio es mucho más sencillo que repararlos después de que hayan arruinado +80% de tus etiquetas.

Consejos para probar tus expresiones regulares:

  • RegEx101: Este es uno de mis recursos favoritos (gratuitos) para probar mis expresiones ver instantáneamente si funciona.

  • DevTools: Usa la consola de tu navegador y métodos como “test” , “match” y “search” para probar tu RegEx con JavaScript.

  • Revisa con Datos Reales: Asegúrate de probar con ejemplos que se acerquen lo más posible a los datos reales que analizarás.

Exceso de Complejidad

Otro error común es hacer las expresiones regulares demasiado complicadas.

Piensa en RegEx como una receta de cocina; si añades demasiados ingredientes, el plato se vuelve intragable.

Aunque estés muy orgullosa/o de tu trabajo , esto es lo que realmente pasa cuando construyes expresiones innecesariamente complicadas:

  • Nadie mantiene tu RegEx: Cuanto más larga y compleja es una expresión, más difícil es de mantener y entender en el futuro. No solo por ti , sino por cualquier otra persona que quiera colaborar contigo.

  • Coincidencias con bajo rendimiento: Expresiones complejas pueden ralentizar tu sistema, especialmente si se aplican a grandes volúmenes de datos.

  • Propensas a Errores: A mayor complejidad, mayor es el riesgo de que algo salga mal y , retomando el punto uno , dependa exclusivamente de ti arreglarlo.

Cómo simplificar tus expresiones regulares:

  • Divide y Vencerás: En lugar de una única expresión compleja, considera dividir el problema en partes más manejables.

  • Documenta: Aunque puede parecer trivial, documentar cada parte de tu expresión regular hace que sea más fácil entender y modificar en el futuro.

  • Reutiliza Patrón: Si encuentras que utilizas estructuras similares en varias RegEx, crea funciones o patrones reutilizables.

Recuerda, las expresiones regulares son herramientas para facilitar tu trabajo, no para complicarlo.

Mantén las cosas simples y siempre prueba antes de implementar.

Para Cerrar

  • Las expresiones regulares (RegEx) son clave para analistas digitales porque nos ayudan a identificar patrones en datos de distintas fuentes y separar lo útil de lo irrelevante.

  • Entender las expresiones regulares es como tener una lupa mágica para encontrar justo lo que necesitas en grandes volúmenes de texto. No necesitas ser un experto: solo familiarízate con los patrones más comunes y úsalos de manera natural.

  • Estos son solo algunos ejemplos:
    • “^” (Empieza con): Coincide con el inicio de una cadena.
    • “$” (Termina con): Coincide con el final de una cadena.
    • “.” (Cualquier carácter): Coincide con cualquier carácter individual.
    • “*” (Cero o más ocurrencias): Coincide con cero o más del elemento anterior.
    • “+” (Una o más ocurrencias): Coincide con una o más del elemento anterior.
    • “?” (Opcional): Coincide con cero o una ocurrencia del elemento anterior.

  • RegEx se aplica en herramientas como Google Analytics y Tag Manager para filtrar y segmentar datos eficientemente. Por ejemplo, puedes filtrar eventos específicos en Google Analytics o activar etiquetas en Google Tag Manager con precisión. En Looker Studio, las expresiones regulares mejoran la organización y presentación de datos.

  • Para usar RegEx de manera efectiva, sigue estas prácticas: evita el uso excesivo de comodines, usa anclas para limitar búsquedas y simplifica tus expresiones para facilitar su mantenimiento.

  • Evita errores comunes como no probar tus expresiones antes de implementarlas y mantenerlas simples para evitar complicaciones.

  • Recuerda: la clave está en la simplicidad y la práctica, práctica, práctica.

Lo Gayoso

Escribo sobre Analítica Digital para Marketers y otros profesionales no técnicos en Latinoamérica que deseen potenciar sus carreras através del mundo de los datos por internet.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Comparte

¡Únete a la comunidad de Snack Digital! 🙌

Mantente al tanto de mis últimos artículos y novedades sobre Snack

Suscribete a mi lista para recibir actualizaciones directamente en tu bandeja de entrada y no perderte nada.

Aquí, me enfoco en ofrecerte valor real sin llenar tu correo con mensajes innecesarios.




⚠️ No te preocupes, este no es un hack de email marketing. Solo te escribiré cuando haya novedades relevantes o recursos que realmente te puedan interesar. Este es un espacio para conectar y crecer juntos.