Как обойти Datadome-2026: пошаговое руководство

Как обойти DataDome в 2026 году: Полное руководство по обходу DataDome

Быстрые Выводы

DataDome обнаруживает скрейперы через репутацию IP, отпечатки браузера, поведение TLS/HTTP, выполнение JavaScript, куки, историю сессий и шаблоны запросов.
Рабочая стратегия DataDome — это не один инструмент. Это многослойная установка: браузерная среда, качество прокси, согласованность сессий, темп и мониторинг.
Скрытые браузеры могут помочь с тяжелыми JavaScript-страницами, но они не заменяют высококачественные прокси или хорошее управление сессией.
Резиденциальные прокси лучше всего подходят для строгих публичных страниц; статические ISP-прокси лучше для стабильных сессий.
Решатели CAPTCHA могут помочь с видимыми задачами, но их не следует использовать как единственное решение.
Nstproxy является хорошим выбором прокси для этого случая, поскольку он предоставляет резиденциальные, статические ISP, дата-центр, мобильные, IPv6 и неограниченные резиденциальные прокси для различных шаблонов сбоев DataDome.

1. Что такое DataDome?

DataDome — это платформа защиты от ботов и мошенничества, используемая интернет-магазинами, туристическими сайтами, торговыми площадками, организациями продаж билетов, медиа и розничной торговлей для идентификации автоматизированного трафика. Для команд скрейпинга она часто отображает страницу CAPTCHA, ответ 403, задачу JavaScript, цикл перенаправления или сбой API-запроса.

Причина, по которой DataDome является сложным, заключается в том, что он не просто проверяет, является ли IP-адрес прокси. Он оценивает всю среду запроса. Скрейпер может использовать хороший прокси и все равно потерпеть неудачу, если отпечаток браузера выглядит автоматизированным. Он может пройти первую страницу и все равно потерпеть неудачу позже, если скорость запроса, куки или поведение сессии становятся подозрительными.

2. Как DataDome обнаруживает веб-скрейперы?

Обнаружение DataDome работает через несколько уровней.

Первый уровень — репутация IP: откуда поступает запрос — из резиденциальной сети, ISP, мобильного оператора, дата-центра, VPN или злоупотребляемого пула прокси. Прокси из низкокачественных дата-центров и бесплатные списки прокси обычно первыми терпят неудачу.

import random
import time

from playwright.sync_api import sync_playwright

NSTPROXY = {
    "server": "http://gate.nstproxy.io:24125",
    "username": "YOUR_NSTPROXY_USERNAME",
    "password": "YOUR_NSTPROXY_PASSWORD",
}

TARGETS = [
    "https://example.com/",
    "https://example.com/category",
    "https://example.com/product-page",
]


def human_sleep(min_seconds: float, max_seconds: float) -> None:
    time.sleep(random.uniform(min_seconds, max_seconds))


def natural_browse(page) -> None:
    human_sleep(2.5, 6.0)

    for _ in range(random.randint(2, 5)):
        page.mouse.wheel(0, random.randint(350, 900))
        human_sleep(0.8, 2.2)

    if random.random() > 0.6:
        page.mouse.wheel(0, -random.randint(120, 320))
        human_sleep(0.7, 1.6)


def detect_block(page) -> bool:
    title = page.title()
    html = page.content()
    text = f"{title}\n{html[:5000]}".lower()

    markers = [
        "datadome",
        "captcha",
        "verify you are human",
        "access denied",
        "forbidden",
        "blocked",
    ]
    return any(marker in text for marker in markers)


def run() -> None:
    with sync_playwright() as p:
        browser = p.chromium.launch(
            headless=False,
            proxy=NSTPROXY,
        )

        context = browser.new_context(
            locale="en-US",
            timezone_id="America/New_York",
            viewport={"width": 1366, "height": 768},
            user_agent=(
                "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
                "AppleWebKit/537.36 (KHTML, like Gecko) "
                "Chrome/124.0.0.0 Safari/537.36"
            ),
        )

        page = context.new_page()
        page.set_default_timeout(30000)

        for url in TARGETS:
            print(f"[VISIT] {url}")

            response = page.goto(
                url,
                wait_until="domcontentloaded",
                timeout=30000,
            )
            natural_browse(page)

            status = response.status if response else "no-response"
            blocked = detect_block(page)
            print(f"[RESULT] status={status} blocked={blocked} title={page.title()}")

            if blocked:
                print("[WARN] Обнаружена проблема с вызовом или блокировкой. Уменьшите скорость, проверьте тип прокси и сохраните сессию.")
                break

            human_sleep(8.0, 18.0)

        context.storage_state(path="nstproxy-session.json")
        browser.close()


if __name__ == "__main__":
    run()

import random
import time
from urllib.parse import urlparse

import requests

NSTPROXY_HOST = "gate.nstproxy.io"
NSTPROXY_PORT = "24125"
NSTPROXY_USER = "YOUR_NSTPROXY_USERNAME"
NSTPROXY_PASS = "YOUR_NSTPROXY_PASSWORD"

PROXY_URL = (
    f"http://{NSTPROXY_USER}:{NSTPROXY_PASS}"
    f"@{NSTPROXY_HOST}:{NSTPROXY_PORT}"
)

PROXIES = {
    "http": PROXY_URL,
    "https": PROXY_URL,
}

HEADERS = {
    "User-Agent": (
        "Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
        "AppleWebKit/537.36 (KHTML, like Gecko) "
        "Chrome/124.0.0.0 Safari/537.36"
    ),
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,*/*;q=0.8",
    "Accept-Language": "en-US,en;q=0.9",
}


def is_challenge(text: str) -> bool:
    markers = [
        "datadome",
        "captcha",
        "verify you are human",
        "access denied",
        "forbidden",
        "blocked",
    ]
    lower = text[:5000].lower()
    return any(marker in lower for marker in markers)


def fetch(url: str, session: requests.Session) -> requests.Response | None:
    try:
        response = session.get(
            url,
            headers=HEADERS,
            proxies=PROXIES,
            timeout=25,
            allow_redirects=True,
        )
    except requests.RequestException as exc:
        print(f"[ERROR] {url} запрос не удался: {exc}")
        return None

    host = urlparse(response.url).netloc
    blocked = response.status_code in {403, 429} or is_challenge(response.text)
    print(f"[FETCH] хост={host} статус={response.status_code} заблокирован={blocked}")

    return response


def main() -> None:
    urls = [
        "https://example.com/robots.txt",
        "https://example.com/sitemap.xml",
        "https://example.com/public-page",
    ]

    with requests.Session() as session:
        for url in urls:
            response = fetch(url, session)
            if response is None:
                continue

            if response.status_code in {403, 429} or is_challenge(response.text):
                print("[WARN] Остановите цикл повторных попыток. Проверьте тип прокси, частоту запросов и требования к браузеру.")
                break

            time.sleep(random.uniform(6, 15))


if __name__ == "__main__":
    main()

Быстрые Выводы

1. Что такое DataDome?

2. Как DataDome обнаруживает веб-скрейперы?

3. Примеры страниц блокировки DataDome

1. Страница задания CAPTCHA

2. Страница 403 Запрещено

3. Задача JavaScript

4. Цикл перенаправлений

5. Заблокированный API или XHR запрос

6. Временный успех, за которым следует сбой

4. Как обойти антибот Datadome?

Метод 1. Ненавязчивые безголовые браузеры

Метод 2. Используйте высококачественный прокси

Метод 3. Проверьте наличие официальных API

Метод 4. Уважайте robots.txt и лимиты запросов

Метод 5. Используйте кэширование или публичные наборы данных, где это возможно

Часто задаваемые вопросы

Что означает обход DataDome?

Существует ли способ обхода DataDome в один клик?

Достаточно ли резидентных прокси для обхода DataDome?

Какие прокси лучше всего работают на сайтах, защищенных DataDome?

Можно ли использовать 2Captcha или CapSolver для обхода DataDome?

Какой продукт Nstproxy мне следует использовать?

Подытожим