Cómo eludir Datadome-2026 Guía paso a paso

Resumen Rápido

DataDome detecta raspadores a través de la reputación de IP, huellas de navegador, comportamiento de TLS/HTTP, ejecución de JavaScript, cookies, historial de sesiones y patrones de solicitudes.
Una estrategia efectiva de DataDome no es una sola herramienta. Es una configuración en capas: entorno del navegador, calidad del proxy, consistencia de la sesión, ritmo y monitoreo.
Los navegadores ocultos pueden ayudar con páginas que utilizan mucho JavaScript, pero no sustituyen proxies de alta calidad o un buen manejo de sesiones.
Los proxies residenciales son los mejores para páginas públicas estrictas; los proxies ISP estáticos son mejores para sesiones estables.
Los solucionadores de CAPTCHA pueden ayudar con desafíos visibles, pero no deben ser utilizados como la única solución.
Nstproxy es una buena elección de proxy para este caso de uso porque proporciona proxies residenciales, ISP estáticos, de centro de datos, móviles, IPv6 y residenciales ilimitados para diferentes patrones de fallo de DataDome.

1. ¿Qué es DataDome?

DataDome es una plataforma de protección contra bots y fraudes utilizada por sitios web de comercio electrónico, viajes, mercados, venta de entradas, medios y minoristas para identificar tráfico automatizado. Para los equipos de raspado, a menudo aparece como una página de CAPTCHA, respuesta 403, desafío de JavaScript, bucle de redirección o fallo de solicitud de API.

La dificultad de DataDome radica en que no solo verifica si una dirección IP es un proxy. Evalúa todo el entorno de la solicitud. Un raspador puede usar un buen proxy y aún así fallar si la huella del navegador parece automatizada. Puede pasar la primera página y fallar más tarde si la velocidad de solicitud, las cookies o el comportamiento de la sesión se vuelven sospechosos.

2. ¿Cómo detecta DataDome a los raspadores web?

La detección de DataDome funciona en varias capas.

La primera es la reputación de IP: si la solicitud proviene de una red residencial, ISP, operador móvil, centro de datos, VPN o pool de proxies abusados. Los proxies de centros de datos de baja calidad y las listas de proxies gratuitos suelen ser los primeros en fallar.

import random
import time

from playwright.sync_api import sync_playwright

NSTPROXY = {
    "server": "http://gate.nstproxy.io:24125",
    "username": "TU_NOMBRE_DE_USUARIO_NSTPROXY",
    "password": "TU_CONTRASEÑA_NSTPROXY",
}

TARGETS = [
    "https://example.com/",
    "https://example.com/category",
    "https://example.com/product-page",
]


def human_sleep(min_seconds: float, max_seconds: float) -> None:
    time.sleep(random.uniform(min_seconds, max_seconds))


def natural_browse(page) -> None:
    human_sleep(2.5, 6.0)

    for _ in range(random.randint(2, 5)):
        page.mouse.wheel(0, random.randint(350, 900))
        human_sleep(0.8, 2.2)

    if random.random() > 0.6:
        page.mouse.wheel(0, -random.randint(120, 320))
        human_sleep(0.7, 1.6)


def detect_block(page) -> bool:
    title = page.title()
    html = page.content()
    text = f"{title}\n{html[:5000]}".lower()

    markers = [
        "datadome",
        "captcha",
        "verifica que eres humano",
        "acceso denegado",
        "prohibido",
        "bloqueado",
    ]
    return any(marker in text for marker in markers)


def run() -> None:
    with sync_playwright() as p:
        browser = p.chromium.launch(
            headless=False,
            proxy=NSTPROXY,
        )

        context = browser.new_context(
            locale="es-ES",
            timezone_id="America/New_York",
            viewport={"width": 1366, "height": 768},
            user_agent=(
                "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
                "AppleWebKit/537.36 (KHTML, like Gecko) "
                "Chrome/124.0.0.0 Safari/537.36"
            ),
        )

        page = context.new_page()
        page.set_default_timeout(30000)

        for url in TARGETS:
            print(f"[VISITAR] {url}")

            response = page.goto(
                url,
                wait_until="domcontentloaded",
                timeout=30000,
            )
            natural_browse(page)

            status = response.status if response else "sin respuesta"
            blocked = detect_block(page)
            print(f"[RESULTADO] estado={status} bloqueado={blocked} título={page.title()}")

            if blocked:
                print("[ADVERTENCIA] Desafío o bloqueo detectado. Reduce la tasa, verifica el tipo de proxy y preserva la sesión.")
                break

            human_sleep(8.0, 18.0)

        context.storage_state(path="nstproxy-session.json")
        browser.close()


if __name__ == "__main__":
    run()

import random
import time
from urllib.parse import urlparse

import requests

NSTPROXY_HOST = "gate.nstproxy.io"
NSTPROXY_PORT = "24125"
NSTPROXY_USER = "TU_NOMBRE_DE_USUARIO_NSTPROXY"
NSTPROXY_PASS = "TU_CONTRASEÑA_NSTPROXY"

PROXY_URL = (
    f"http://{NSTPROXY_USER}:{NSTPROXY_PASS}"
    f"@{NSTPROXY_HOST}:{NSTPROXY_PORT}"
)

PROXIES = {
    "http": PROXY_URL,
    "https": PROXY_URL,
}

HEADERS = {
    "User-Agent": (
        "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
        "AppleWebKit/537.36 (KHTML, like Gecko) "
        "Chrome/124.0.0.0 Safari/537.36"
    ),
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8",
    "Accept-Language": "es-ES,es;q=0.9",
}


def is_challenge(text: str) -> bool:
    markers = [
        "datadome",
        "captcha",
        "verifique que sea humano",
        "acceso denegado",
        "prohibido",
        "bloqueado",
    ]
    lower = text[:5000].lower()
    return any(marker in lower for marker in markers)


def fetch(url: str, session: requests.Session) -> requests.Response | None:
    try:
        response = session.get(
            url,
            headers=HEADERS,
            proxies=PROXIES,
            timeout=25,
            allow_redirects=True,
        )
    except requests.RequestException as exc:
        print(f"[ERROR] la solicitud a {url} falló: {exc}")
        return None

    host = urlparse(response.url).netloc
    blocked = response.status_code in {403, 429} or is_challenge(response.text)
    print(f"[FETCH] host={host} estado={response.status_code} bloqueado={blocked}")

    return response


def main() -> None:
    urls = [
        "https://example.com/robots.txt",
        "https://example.com/sitemap.xml",
        "https://example.com/public-page",
    ]

    with requests.Session() as session:
        for url in urls:
            response = fetch(url, session)
            if response is None:
                continue

            if response.status_code in {403, 429} or is_challenge(response.text):
                print("[WARN] Detener el bucle de reintentos. Verifique el tipo de proxy, la tasa y el requerimiento del navegador.")
                break

            time.sleep(random.uniform(6, 15))


if __name__ == "__main__":
    main()

Resumen Rápido

1. ¿Qué es DataDome?

2. ¿Cómo detecta DataDome a los raspadores web?

3. Ejemplos de página bloqueada por DataDome

1. Página de desafío CAPTCHA

2. Página 403 Prohibido

3. Desafío de JavaScript

4. Bucle de redirección

5. Solicitud de API o XHR bloqueada

6. Éxito Temporal Seguido de Fallo

4. ¿Cómo eludir el Anti Bot de Datadome?

Método 1. Navegadores Sin Cabeza Discretos

Método 2. Utilizar Proxy de Alta Calidad

Método 3. Verificar APIs Oficiales

Método 4. Respetar robots.txt y Límites de Tasa

Método 5. Usar Caché o Conjuntos de Datos Públicos Donde Sea Posible

Preguntas Frecuentes

¿Qué significa eludir DataDome?

¿Hay una forma de un clic para eludir DataDome?

¿Son suficientes los proxies residenciales para eludir DataDome?

¿Qué proxies funcionan mejor para sitios protegidos por DataDome?

¿Pueden 2Captcha o CapSolver eludir DataDome?

¿Qué producto de Nstproxy debería usar?

Resumen