Los investigadores utilizan IA para combatir y cuantificar las huellas dactilares del navegador


Los navegadores como Firefox, Safari, Opera y Chrome han estado ofreciendo protección contra métodos de seguimiento entre sitios con cookies y direcciones IP durante algún tiempo. Es un desarrollo alentador, pero existe la preocupación de que los rastreadores se vean obligados a utilizar un rastreo "sin estado" más opaco, como las huellas dactilares del navegador, que rastrea los navegadores en función de la información de configuración que los hace visibles.

Para combatir las huellas dactilares en particular, recientemente se llevó a cabo un estudio, y los investigadores de la Universidad de Iowa, Mozilla y la Universidad de California en Davis investigaron un enfoque basado en el aprendizaje automático llamado FP-Inspector, que capacita a los clasificadores para usar huellas dactilares aprender. Al extraer características sintácticas y semánticas a través de una combinación de análisis estáticos y dinámicos que complementan eficazmente las limitaciones de cada uno, FP-Inspector supera los problemas de cobertura del análisis dinámico al tiempo que aborda la incapacidad del análisis estático para lidiar con la ofuscación, dicen. Coautores.

Algunos navegadores y herramientas de privacidad han intentado reducir las huellas dactilares utilizando técnicas como cambios de API y bloqueo de solicitudes de red. Sin embargo, estos requieren un análisis manual y tienen dificultades para restringir los scripts servidos por dominios propios y de terceros con doble propósito, como redes de entrega de contenido. Esto se debe a que cualquier heurística codificada de forma rígida debe definirse estrictamente para evitar falsos positivos y actualizarse continuamente para capturar huellas dactilares en evolución y no huellas dactilares.

En contraste con esto, el FP-Inspector basado en JavaScript es en gran parte autónomo y tiene un componente de reconocimiento que extrae funciones (por ejemplo, sintaxis y ejecución) de scripts y entrena a un clasificador para identificar huellas dactilares. (Los métodos de selección de características supervisados ​​y no supervisados ​​limitan la cantidad de características utilizadas para entrenar a los clasificadores a 1,000 características estáticas y 1,000 características dinámicas). Un componente de mitigación aplica restricciones a los scripts que detecta. FP-Inspector restringe el acceso a todos los scripts que se sabe que utilizan huellas dactilares y bloquea las solicitudes para descargar scripts proporcionados por dominios que se utilizan para huellas dactilares.

Para entrenar a FP-Inspector, los investigadores buscaron en las páginas de inicio de 20.000 sitios web para compilar una lista de 17.629 sitios web con 153.354 scripts de ejecución diferentes. (Tomaron los 10,000 sitios web principales de una lista de 100,000 de los sitios web más visitados en Internet, el ranking global de Alexa, y agregaron muestras aleatorias de 10,000 sitios web del resto, por lo que fueron los sitios web y sitios web más populares a continuación. podría cubrir The Long Tail.) En experimentos se encontró que FP-Inspector funcionó bien, detectando un 26% más de scripts de huellas dactilares que las heurísticas creadas manualmente con una precisión del 99,9% y dos veces menos roturas de sitios web.

Para medir la prevalencia de huellas dactilares en scripts en Internet, los investigadores aplicaron el componente de reconocimiento de FP-Inspector a los 71.112 sitios web evaluados por Alexa. Descubrieron que más de una cuarta parte de los principales sitios web ahora proporcionan huellas dactilares (10,18% de los 100.000 sitios web principales con 2.349 dominios únicos) y que las huellas dactilares se utilizan de forma inconsistente en todas las categorías de sitios web. El uso varió desde casi el 14% de los sitios web de noticias hasta solo el 1% de los sitios web relacionados con créditos y deudas. Esta es una diferencia que los coautores atribuyen al hecho de que las huellas dactilares son comunes en los sitios web que dependen de anuncios y muros de pago para la monetización.

Los investigadores dicen que planean publicar los dominios que proporcionan secuencias de comandos de huellas digitales para realizar un seguimiento de las listas de protección como Disconnect y EasyPrivacy. "FP-Inspector ayudó a descubrir el uso de varias API nuevas que antes no se sabía que se usaran para la toma de huellas digitales del navegador", escriben. “Planeamos informar los nombres y las estadísticas de estas API a los proveedores de navegadores y organismos de estandarización conscientes de la privacidad. Para fomentar la investigación, vamos a publicar… [our] Prototype Extension for Fingerprint Countermeasures, una lista de proveedores de huellas digitales recientemente descubiertos e informes de errores que se enviarán a las listas de protección de rastreo, proveedores de navegadores y organismos de estándares. "

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *