Bienvenido a Soporte Purple

Aleatorización de la dirección MAC

  • Actualización

La aleatorización de la dirección MAC es un mecanismo de privacidad cada vez más usado en teléfonos modernos, tabletas y, a veces, en computadores portátiles.

Toda interfaz de red tiene una dirección MAC, un identificador único utilizado como dirección de red en las comunicaciones. La interfaz de la red WiFi de tu teléfono, tableta o computador tiene una dirección MAC única, con la cual se identifica ante puntos de acceso cercanos al buscar una red de WiFi para conectarse.

Una dirección MAC puede ser usada para identificar pasivamente un dispositivo como teléfono, tableta o computador a través de los puntos de acceso de la red; y debido a esto, los proveedores de sistemas operativos comenzaron a introducir la aleatorización de la dirección MAC, para reforzar la seguridad de los usuarios de los dispositivos. Esto funciona cambiando la dirección MAC anunciada en el dispositivo cada pocos minutos, lo cual implica que, aunque sea trivial determinar si una dirección dada es real o aleatorizada, es imposible determinar si una dirección MAC aleatorizada dada pertenece al mismo dispositivo que la última dirección MAC aleatorizada vista. Por ello, a menos que un dispositivo esté asociado a una red de WiFi, será casi imposible relacionarlo con un usuario o determinar si el dispositivo ya se ha conectado antes. También por ello se ha dificultado considerablemente el conteo de dispositivos únicos en una ubicación, puesto que un mismo dispositivo puede ser representado por múltiples direcciones MAC aleatorizadas.

Recientemente, los proveedores de sistemas operativos también han comenzado a usar direcciones MAC aleatorizadas para la conexión a redes WiFi, utilizando una dirección MAC única diferente para cada SSID conocido. De esta forma, el sistema operativo evita que un usuario dado sea identificado automáticamente mientras se mueve de una red a otra, a menos que dichas redes estén transmitiendo el mismo SSID. Esto significa que un usuario puede ser reidentificado de manera confiable y recibir acceso a la red de WiFi mientras se mueve de un lugar a otro en la misma empresa (transmitiendo el mismo SSID de red WiFi), pero no podrá ser identificado automáticamente si va a otra empresa (transmitiendo un SSID de red WiFi diferente).

Además de guardar una dirección MAC por SSID, las direcciones MAC aleatorizadas se pueden regenerar si un usuario no usa una red de WiFi por un tiempo prolongado.

La aleatorización de las direcciones MAC fue introducida por iOS 14 de Apple y por Android en 2017; cada sistema operativo la hace de manera diferente, y en el caso de Android, el proceso puede diferir por dispositivo. Para más información sobre cómo se lleva a cabo la aleatorización de direcciones MAC, consulta los siguientes recursos:

Impacto en las métricas

Presencia

En un escenario donde se observe aleatorización de la dirección MAC y el proveedor central de servicios (el proveedor de WiFi que recopila los datos) no filtre las direcciones aleatorizadas, la métrica de presencia puede tener un valor mayor al que tenga realmente el lugar. Dado que los datos de presencia incluyen datos autenticados y asociados, los efectos de esto disminuirán a medida que la cantidad de clientes asociados se acerque al total de dispositivos presentes.

Repetido vs. nuevo

Tal vez la estadística más afectada por la aleatorización de la dirección MAC es la métrica de visitante repetido/nuevo. Se crea un sesgo particular hacia los nuevos visitantes, ya que las direcciones aleatorias recién generadas no han sido observadas previamente, lo cual causa un aumento del conteo de visitantes nuevos.

La probabilidad de sesgo hacia una dirección MAC aleatoria superponiéndose con la de un visitante genuino es extremadamente baja, ya que los proveedores generalmente usan marcadores de bits locales en las direcciones MAC. La probabilidad de superposición en 2 direcciones Mac aleatorias es extremadamente baja si están en un mismo lugar y en un periodo corto de visita.

El filtrado de direcciones MAC aleatorias limpiará en su mayor parte estos datos. Se espera que la tendencia observada a través de las proporciones de nuevos vs. repetidos sea genuina y relativamente precisa. Ambas métricas pueden parecer más bajas que el valor real en una proporción basada en una combinación del conjunto de usuarios autenticados y el tiempo de permanencia de individuos (oportunidad de generar direcciones MAC genuinas en el tiempo). Por ejemplo, una tienda de conveniencia/restaurante de comida rápida observaría un mayor impacto que un supermercado/restaurante.

Permanencia

Los efectos de la aleatorización de las direcciones MAC en los datos de permanencia son un poco menos transparentes. Hay un sesgo generalizado hacia métricas de permanencia más bajas para las observaciones cortas causado por dispositivos nuevos; sin embargo, cuando los dispositivos presentan direcciones MAC genuinas durante periodos de tiempo más largos (por ejemplo, aleatorización solo durante modo de suspensión), el tiempo de permanencia real aún puede estar presente y ser preciso para el dispositivo.

Generalmente, filtrar los tiempos de permanencia bajos y las direcciones Mac aleatorizadas puede mejorar la calidad de las métricas de permanencia.

Datos de ubicación (x,y)

Independientemente de cualquier aleatorización, la señal medida de los dispositivos permanece visible. Aún es efectivo calcular la ubicación relativa de este dispositivo individual. En general, dado que el movimiento de un dispositivo móvil es en gran medida relativo a la ventana de datos, hay poca ventaja en conocer la ubicación previa de un dispositivo individual si este no está asociado. Es decir, podría ser apropiado que el dispositivo se mueva muchas decenas de metros en el intervalo del sondeo.

Para dispositivos conectados hay mucha más producción de datos y tenemos garantizado que la dirección MAC es genuina y que no habrá superposición entre direcciones MAC genuinas y aleatorizadas, por lo que no habrá un impacto real de la aleatorización para este servicio.

Mejora la precisión de las métricas

Evita el sesgo por la aleatorización de las direcciones MAC

Cuando tengamos usuarios autenticados genuinos, observaremos datos precisos genuinos.

Por lo tanto, cuanto más alta sea la proporción de usuarios autenticados presentes en el lugar, más alta será la precisión que observarás en tus datos. Como consecuencia de nuestro esfuerzo por lograr mayor precisión en capturar el comportamiento de los clientes dentro del lugar, con más usuarios conectados directamente al servicio de WiFi tendrás una visión más profunda, una granularidad más fina y una audiencia más atenta y participante.

Compensa el sesgo por aleatorización de las direcciones MAC

Dado que Android/iOS tienen actualmente diferentes estrategias de aleatorización, es importante evaluar la proporción de dispositivos iOS vs. Android presentes en el intervalo de la métrica. El sesgo de datos medibles contra datos reales se relaciona con esta proporción.

Debido a la anonimización de los códigos del fabricante prevalente en los dispositivos iOS de Apple, no podemos usar de manera realista el componente del fabricante en la dirección MAC para identificar las proporciones de Android/iOS. Estaría sesgado a favor de dispositivos que no sean iOS. Por lo tanto, es más confiable relacionar la proporción con la proporción observada en la autenticación de usuarios (& intentos de autenticación durante esta ventana). Este enfoque puede producir más precisión para conjuntos de datos más grandes, a menos que haya una razón subyacente conocida por la cual pueda haber un sesgo (por ejemplo, una sala de exposición de teléfonos móviles o inaccesibilidad de autenticación para cierto tipo de dispositivo).

Para los casos en que se conozcan las proporciones de direcciones MAC no aleatorizadas vs. aleatorizadas y haya medida de las proporciones entre iOS y Android, podemos producir una nueva estimación del sesgo con base en esta evidencia observacional cuantificable: la susceptibilidad del dispositivo a la aleatorización, la permanencia registrada (ponderación de oportunidad) y algunos coeficientes moderados a la probabilidad de aleatorización en el tiempo, sujetos al espacio de observación y basados en la previa clasificación del dispositivo.

Si no hay datos del proveedor disponibles en el conjunto (cantidad) de datos aleatorizados, debemos depender del sesgo típico, medido y calculado en lugares alternos para tener una medida actual de las proporciones de aleatorización probables en el entorno.

Generalmente, y con el propósito de observación estadística, las formas del tráfico y los patrones de la hora del día permanecerán en gran medida los mismos y proyectarán las mismas ‘formas’ en los datos generales.

Compartir en línea