# Scrapfly Documentation

## Table of Contents

### Dashboard

- [Intro](https://scrapfly.io/docs)
- [Project](https://scrapfly.io/docs/project)
- [Account](https://scrapfly.io/docs/account)
- [Workspace & Team](https://scrapfly.io/docs/workspace-and-team)
- [Billing](https://scrapfly.io/docs/billing)

### Products

#### MCP Server

- [Getting Started](https://scrapfly.io/docs/mcp/getting-started)
- [Tools & API Spec](https://scrapfly.io/docs/mcp/tools)
- [Authentication](https://scrapfly.io/docs/mcp/authentication)
- [Examples & Use Cases](https://scrapfly.io/docs/mcp/examples)
- [FAQ](https://scrapfly.io/docs/mcp/faq)
##### Integrations

- [Overview](https://scrapfly.io/docs/mcp/integrations)
- [Claude Desktop](https://scrapfly.io/docs/mcp/integrations/claude-desktop)
- [Claude Code](https://scrapfly.io/docs/mcp/integrations/claude-code)
- [ChatGPT](https://scrapfly.io/docs/mcp/integrations/chatgpt)
- [Cursor](https://scrapfly.io/docs/mcp/integrations/cursor)
- [Cline](https://scrapfly.io/docs/mcp/integrations/cline)
- [Windsurf](https://scrapfly.io/docs/mcp/integrations/windsurf)
- [Zed](https://scrapfly.io/docs/mcp/integrations/zed)
- [Roo Code](https://scrapfly.io/docs/mcp/integrations/roo-code)
- [VS Code](https://scrapfly.io/docs/mcp/integrations/vscode)
- [LangChain](https://scrapfly.io/docs/mcp/integrations/langchain)
- [LlamaIndex](https://scrapfly.io/docs/mcp/integrations/llamaindex)
- [CrewAI](https://scrapfly.io/docs/mcp/integrations/crewai)
- [OpenAI](https://scrapfly.io/docs/mcp/integrations/openai)
- [n8n](https://scrapfly.io/docs/mcp/integrations/n8n)
- [Make](https://scrapfly.io/docs/mcp/integrations/make)
- [Zapier](https://scrapfly.io/docs/mcp/integrations/zapier)
- [Vapi AI](https://scrapfly.io/docs/mcp/integrations/vapi)
- [Agent Builder](https://scrapfly.io/docs/mcp/integrations/agent-builder)
- [Custom Client](https://scrapfly.io/docs/mcp/integrations/custom-client)


#### Web Scraping API

- [Getting Started](https://scrapfly.io/docs/scrape-api/getting-started)
- [API Specification]()
- [Monitoring](https://scrapfly.io/docs/monitoring)
- [Customize Request](https://scrapfly.io/docs/scrape-api/custom)
- [Debug](https://scrapfly.io/docs/scrape-api/debug)
- [Anti Scraping Protection](https://scrapfly.io/docs/scrape-api/anti-scraping-protection)
- [Proxy](https://scrapfly.io/docs/scrape-api/proxy)
- [Proxy Mode](https://scrapfly.io/docs/scrape-api/proxy-mode)
- [Proxy Mode - Screaming Frog](https://scrapfly.io/docs/scrape-api/proxy-mode/screaming-frog)
- [Proxy Mode - Apify](https://scrapfly.io/docs/scrape-api/proxy-mode/apify)
- [(Auto) Data Extraction](https://scrapfly.io/docs/scrape-api/extraction)
- [Javascript Rendering](https://scrapfly.io/docs/scrape-api/javascript-rendering)
- [Javascript Scenario](https://scrapfly.io/docs/scrape-api/javascript-scenario)
- [SSL](https://scrapfly.io/docs/scrape-api/ssl)
- [DNS](https://scrapfly.io/docs/scrape-api/dns)
- [Cache](https://scrapfly.io/docs/scrape-api/cache)
- [Batch (Multi-URL Scraping)](https://scrapfly.io/docs/scrape-api/batch)
- [Session](https://scrapfly.io/docs/scrape-api/session)
- [Webhook](https://scrapfly.io/docs/scrape-api/webhook)
- [Schedule](https://scrapfly.io/docs/scrape-api/schedule)
- [Screenshot](https://scrapfly.io/docs/scrape-api/screenshot)
- [Errors](https://scrapfly.io/docs/scrape-api/errors)
- [Timeout](https://scrapfly.io/docs/scrape-api/understand-timeout)
- [Throttling](https://scrapfly.io/docs/throttling)
- [Troubleshoot](https://scrapfly.io/docs/scrape-api/troubleshoot)
- [Billing](https://scrapfly.io/docs/scrape-api/billing)
- [FAQ](https://scrapfly.io/docs/scrape-api/faq)

#### Crawler API

- [Getting Started](https://scrapfly.io/docs/crawler-api/getting-started)
- [API Specification]()
- [Retrieving Results](https://scrapfly.io/docs/crawler-api/results)
- [WARC Format](https://scrapfly.io/docs/crawler-api/warc-format)
- [Data Extraction](https://scrapfly.io/docs/crawler-api/extraction-rules)
- [Webhook](https://scrapfly.io/docs/crawler-api/webhook)
- [Schedule](https://scrapfly.io/docs/crawler-api/schedule)
- [Billing](https://scrapfly.io/docs/crawler-api/billing)
- [Errors](https://scrapfly.io/docs/crawler-api/errors)
- [Troubleshoot](https://scrapfly.io/docs/crawler-api/troubleshoot)
- [FAQ](https://scrapfly.io/docs/crawler-api/faq)

#### Screenshot API

- [Getting Started](https://scrapfly.io/docs/screenshot-api/getting-started)
- [API Specification]()
- [Accessibility Testing](https://scrapfly.io/docs/screenshot-api/accessibility)
- [Webhook](https://scrapfly.io/docs/screenshot-api/webhook)
- [Schedule](https://scrapfly.io/docs/screenshot-api/schedule)
- [Billing](https://scrapfly.io/docs/screenshot-api/billing)
- [Errors](https://scrapfly.io/docs/screenshot-api/errors)

#### Extraction API

- [Getting Started](https://scrapfly.io/docs/extraction-api/getting-started)
- [API Specification]()
- [Rules Template](https://scrapfly.io/docs/extraction-api/rules-and-template)
- [Saved Templates](https://scrapfly.io/docs/extraction-api/templates)
- [LLM Extraction](https://scrapfly.io/docs/extraction-api/llm-prompt)
- [AI Auto Extraction](https://scrapfly.io/docs/extraction-api/automatic-ai)
- [Webhook](https://scrapfly.io/docs/extraction-api/webhook)
- [Billing](https://scrapfly.io/docs/extraction-api/billing)
- [Errors](https://scrapfly.io/docs/extraction-api/errors)
- [FAQ](https://scrapfly.io/docs/extraction-api/faq)

#### Data API

- [Getting Started](https://scrapfly.io/docs/data-api/getting-started)

#### Proxy Saver

- [Getting Started](https://scrapfly.io/docs/proxy-saver/getting-started)
- [Fingerprints](https://scrapfly.io/docs/proxy-saver/fingerprints)
- [Optimizations](https://scrapfly.io/docs/proxy-saver/optimizations)
- [SSL Certificates](https://scrapfly.io/docs/proxy-saver/certificates)
- [Protocols](https://scrapfly.io/docs/proxy-saver/protocols)
- [Pacfile](https://scrapfly.io/docs/proxy-saver/pacfile)
- [Secure Credentials](https://scrapfly.io/docs/proxy-saver/security)
- [Billing](https://scrapfly.io/docs/proxy-saver/billing)

#### Cloud Browser API

- [Getting Started](https://scrapfly.io/docs/cloud-browser-api/getting-started)
- [Proxy & Geo-Targeting](https://scrapfly.io/docs/cloud-browser-api/proxy)
- [Unblock API](https://scrapfly.io/docs/cloud-browser-api/unblock)
- [Captcha Solver](https://scrapfly.io/docs/cloud-browser-api/captcha-solver)
- [File Downloads](https://scrapfly.io/docs/cloud-browser-api/file-downloads)
- [Session Resume](https://scrapfly.io/docs/cloud-browser-api/session-resume)
- [Human-in-the-Loop](https://scrapfly.io/docs/cloud-browser-api/human-in-the-loop)
- [Debug Mode](https://scrapfly.io/docs/cloud-browser-api/debug-mode)
- [Bring Your Own Proxy](https://scrapfly.io/docs/cloud-browser-api/bring-your-own-proxy)
- [Browser Extensions](https://scrapfly.io/docs/cloud-browser-api/extensions)
- [Native Browser MCP](https://scrapfly.io/docs/cloud-browser-api/mcp)
- [DevTools Protocol](https://scrapfly.io/docs/cloud-browser-api/cdp-reference)
##### Integrations

- [Puppeteer](https://scrapfly.io/docs/cloud-browser-api/puppeteer)
- [Playwright](https://scrapfly.io/docs/cloud-browser-api/playwright)
- [Selenium](https://scrapfly.io/docs/cloud-browser-api/selenium)
- [Vercel Agent Browser](https://scrapfly.io/docs/cloud-browser-api/agent-browser)
- [Browser Use](https://scrapfly.io/docs/cloud-browser-api/browser-use)
- [Stagehand](https://scrapfly.io/docs/cloud-browser-api/stagehand)

- [Billing](https://scrapfly.io/docs/cloud-browser-api/billing)
- [Errors](https://scrapfly.io/docs/cloud-browser-api/errors)


### Tools

- [Antibot Detector](https://scrapfly.io/docs/tools/antibot-detector)

### SDK

- [Golang](https://scrapfly.io/docs/sdk/golang)
- [Python](https://scrapfly.io/docs/sdk/python)
- [Rust](https://scrapfly.io/docs/sdk/rust)
- [TypeScript](https://scrapfly.io/docs/sdk/typescript)
- [Scrapy](https://scrapfly.io/docs/sdk/scrapy)

### Integrations

- [Getting Started](https://scrapfly.io/docs/integration/getting-started)
- [LangChain](https://scrapfly.io/docs/integration/langchain)
- [LlamaIndex](https://scrapfly.io/docs/integration/llamaindex)
- [CrewAI](https://scrapfly.io/docs/integration/crewai)
- [Zapier](https://scrapfly.io/docs/integration/zapier)
- [Make](https://scrapfly.io/docs/integration/make)
- [n8n](https://scrapfly.io/docs/integration/n8n)

### Academy

- [Overview](https://scrapfly.io/academy)
- [Web Scraping Overview](https://scrapfly.io/academy/scraping-overview)
- [Tools](https://scrapfly.io/academy/tools-overview)
- [Reverse Engineering](https://scrapfly.io/academy/reverse-engineering)
- [Static Scraping](https://scrapfly.io/academy/static-scraping)
- [HTML Parsing](https://scrapfly.io/academy/html-parsing)
- [Dynamic Scraping](https://scrapfly.io/academy/dynamic-scraping)
- [Hidden API Scraping](https://scrapfly.io/academy/hidden-api-scraping)
- [Headless Browsers](https://scrapfly.io/academy/headless-browsers)
- [Hidden Web Data](https://scrapfly.io/academy/hidden-web-data)
- [JSON Parsing](https://scrapfly.io/academy/json-parsing)
- [Data Processing](https://scrapfly.io/academy/data-processing)
- [Scaling](https://scrapfly.io/academy/scaling)
- [Walkthrough Summary](https://scrapfly.io/academy/walkthrough-summary)
- [Scraper Blocking](https://scrapfly.io/academy/scraper-blocking)
- [Proxies](https://scrapfly.io/academy/proxies)

---

# Browser Use (AI Agent) Integration

 1. [Cloud Browser](https://scrapfly.io/docs/cloud-browser-api/getting-started)
2. Browser Use

  [Browser Use](https://github.com/browser-use/browser-use) is an AI-powered browser automation framework that enables AI agents to control browsers using natural language commands. Connect it to Scrapfly Cloud Browser for scalable AI-driven automation with built-in proxies and fingerprinting.

 **Beta Feature:** Cloud Browser is currently in beta.

## What is Browser Use?

 Browser Use is an open-source Python framework that combines Large Language Models (LLMs) with browser automation. Instead of writing explicit automation code, you give the AI agent natural language instructions like "find product prices" or "fill out this form", and the agent figures out how to accomplish the task using browser interactions.

#####  AI-Powered

 Uses LLMs to understand tasks and interact with websites intelligently. No hardcoded selectors needed.

#####  Natural Language

 Describe tasks in plain English. The AI agent translates your intent into browser actions.

#####  Self-Adapting

 Handles dynamic page structures and adapts to changes without updating code.

## Installation

Install Browser Use using pip (requires Python 3.11+):

 ```
pip install browser-use
```

> Browser Use connects to Cloud Browser via CDP (Chrome DevTools Protocol). It also provides a CLI for interactive browser control from the terminal.

## Quick Start

Connect Browser Use to Cloud Browser and run AI-powered tasks:

   Python   Python SDK   CLI

  ```
import asyncio
from browser_use import Agent, Browser, BrowserProfile
from langchain_openai import ChatOpenAI

API_KEY = '{{ YOUR_API_KEY }}'
BROWSER_WS = f'wss://browser.scrapfly.io?api_key={API_KEY}&proxy_pool=public_datacenter_pool&os=linux'

async def run_agent():
    # Connect to Cloud Browser via CDP
    browser = Browser(
        browser_profile=BrowserProfile(
            cdp_url=BROWSER_WS,
        )
    )

    # Create AI agent with natural language task
    agent = Agent(
        task="Go to https://web-scraping.dev and find the product prices",
        llm=ChatOpenAI(model="gpt-4o"),
        browser=browser,
    )

    # Run the agent
    result = await agent.run()
    print("Agent result:", result)

asyncio.run(run_agent())

```

 ```
import asyncio
from scrapfly import ScrapflyClient, BrowserConfig
from browser_use import Agent, Browser, BrowserProfile
from langchain_openai import ChatOpenAI

client = ScrapflyClient(key='{{ YOUR_API_KEY }}')

config = BrowserConfig(
    proxy_pool='public_datacenter_pool',
    os='linux',
)

async def run_agent():
    # Use the Scrapfly SDK to generate the WebSocket URL
    browser = Browser(
        browser_profile=BrowserProfile(
            cdp_url=client.cloud_browser(config),
        )
    )

    agent = Agent(
        task="Go to https://web-scraping.dev and find the product prices",
        llm=ChatOpenAI(model="gpt-4o"),
        browser=browser,
    )

    result = await agent.run()
    print("Agent result:", result)

asyncio.run(run_agent())

```

 ```
# Set the Cloud Browser WebSocket URL
export BROWSER_WS="wss://browser.scrapfly.io?api_key={{ YOUR_API_KEY }}&proxy_pool=datacenter"

# Open a page in the cloud browser
browser-use --cdp-url "$BROWSER_WS" open https://web-scraping.dev/products

# Get page state (title, URL, clickable elements)
browser-use state

# Click on a product link (by element index from state output)
browser-use click 5

# Take a screenshot
browser-use screenshot product.png

# Extract text from an element
browser-use state  # Find element index, then interact

# Close the session (stops billing)
browser-use close

```

## CLI Mode

 Browser Use includes a CLI for interactive browser control from the terminal. Use the `--cdp-url` flag to connect to Cloud Browser:

 ```
# Set the Cloud Browser WebSocket URL
export BROWSER_WS="wss://browser.scrapfly.io?api_key={{ YOUR_API_KEY }}&proxy_pool=datacenter"

# Open a page in the cloud browser
browser-use --cdp-url "$BROWSER_WS" open https://web-scraping.dev/products

# Get page state (title, URL, clickable elements)
browser-use state

# Click on a product link (by element index from state output)
browser-use click 5

# Take a screenshot
browser-use screenshot product.png

# Extract text from an element
browser-use state  # Find element index, then interact

# Close the session (stops billing)
browser-use close

```

 The CLI uses a persistent daemon architecture, the browser stays running between commands with ~50ms latency. See `browser-use --help` for all available commands.

## Data Extraction with AI

Use Browser Use to extract structured data from websites using natural language instructions:

 ```
import asyncio
from browser_use import Agent, Browser, BrowserProfile
from langchain_openai import ChatOpenAI

API_KEY = '{{ YOUR_API_KEY }}'
BROWSER_WS = f'wss://browser.scrapfly.io?api_key={API_KEY}&proxy_pool=public_datacenter_pool'

async def extract_products():
    browser = Browser(
        browser_profile=BrowserProfile(
            cdp_url=BROWSER_WS,
        )
    )

    agent = Agent(
        task="""
        Go to https://web-scraping.dev/products and extract all product names and prices.
        Return the data as a JSON list with 'name' and 'price' fields.
        """,
        llm=ChatOpenAI(model="gpt-4o"),
        browser=browser,
    )

    result = await agent.run()
    print("Extracted products:", result)

asyncio.run(extract_products())

```

## Geo-Targeted Browsing

Use residential proxies with country targeting for geo-specific content:

 ```
import asyncio
from browser_use import Agent, Browser, BrowserProfile
from langchain_openai import ChatOpenAI

API_KEY = '{{ YOUR_API_KEY }}'

# Use residential proxy from Germany for geo-specific content
BROWSER_WS = f'wss://browser.scrapfly.io?api_key={API_KEY}&proxy_pool=public_residential_pool&country=de'

async def check_geo_pricing():
    browser = Browser(
        browser_profile=BrowserProfile(
            cdp_url=BROWSER_WS,
        )
    )

    agent = Agent(
        task="Go to https://web-scraping.dev/product/1 and get the product price shown for this region",
        llm=ChatOpenAI(model="gpt-4o"),
        browser=browser,
    )

    result = await agent.run()
    print("German price:", result)

asyncio.run(check_geo_pricing())

```

## Proxy Options

 | Proxy Pool | Use Case | Cost |
|---|---|---|
| `datacenter` | General AI automation, high speed, lower cost | 1 credits/30s + 7 credits/MB |
| `residential` | Protected sites, geo-targeting, anti-bot bypass | 1 credits/30s + 52 credits/MB |

## Best Practices

- **Be specific with tasks** - Clear, detailed instructions help the AI agent succeed
- **Use structured outputs** - Ask the agent to return data in specific formats (JSON, lists, etc.)
- **Handle failures gracefully** - Wrap agent runs in try/catch and provide fallback logic
- **Monitor costs** - AI agents may take longer than traditional automation. Always close browser sessions when done.
- **Use sessions wisely** - Reuse sessions for multi-step workflows to maintain state
- **Choose the right LLM** - More capable models (GPT-4) perform better but cost more. Test with different models.
- **Test tasks iteratively** - Start with simple tasks and gradually increase complexity

## WebSocket URL Format

Cloud Browser WebSocket URLs support the following parameters:

 | Parameter | Required | Default | Description |
|---|---|---|---|
| `api_key` | Yes | - | Your Scrapfly API key for authentication |
| `proxy_pool` | No | `datacenter` | Proxy network type: `datacenter` or `residential` |
| `os` | No | random | Operating system fingerprint: `linux`, `windows`, or `macos` |
| `browser_brand` | No | `chrome` | Chromium-based browser brand used for fingerprint generation. Valid values: `chrome`, `edge`, `brave`, `opera`. Invalid values are silently dropped and the default applies.   **Platform constraint:** `edge` is **Windows-only**; pairing it with `os=macos` or `os=linux` returns [`ERR::BROWSER::CONFIG_ERROR`](https://scrapfly.io/docs/cloud-browser-api/error/ERR::BROWSER::CONFIG_ERROR). `chrome`, `brave`, and `opera` support all three platforms. |
| `session` | No | - | Identifier for a resumable browser. Omit it for a one-shot run that cannot be reconnected. Pass a fresh value (a UUID is the safest choice) to start a new resumable session, or reuse the same value to reconnect to the existing browser. See [Session Resume](https://scrapfly.io/docs/cloud-browser-api/session-resume). |
| `country` | No | - | Proxy country code (ISO 3166-1 alpha-2), e.g., `us`, `uk`, `de` |
| `auto_close` | No | `true` | Automatically stop the browser session when the CDP connection disconnects. Set to `false` to keep the browser alive for reconnection. |
| `timeout` | No | `900` | Maximum session duration in seconds (15 minutes default, 30 minutes max). |
| `debug` | No | `false` | Enable session recording for debugging. See [Debug Mode](https://scrapfly.io/docs/cloud-browser-api/debug-mode). |
| `block_images` | No | `false` | Stub image requests with a transparent 1x1 pixel. Reduces bandwidth while remaining invisible to anti-bot systems. |
| `block_styles` | No | `false` | Stub stylesheet requests with an empty CSS response. |
| `block_fonts` | No | `false` | Stub font requests with an empty response. |
| `block_media` | No | `false` | Stub video and audio media requests. |
| `blacklist` | No | `false` | Stub known analytics, tracking, and telemetry URLs. |
| `cache` | No | `false` | Enable HTTP cache for static resources. Cached bandwidth billed at 1 credit/MB. |
| `enable_mcp` | No | `false` | Enable Scrapium's built-in **Model Context Protocol** (MCP) support. When enabled, the browser exposes a streamable-HTTP MCP endpoint that AI agents can connect to for standardized browser interaction and access to any tools registered by the page via `navigator.modelContext`. The MCP endpoint URL is returned in the allocation response as `mcp_endpoint`. See [Native Browser MCP documentation](https://scrapfly.io/docs/cloud-browser-api/mcp). |
| `solve_captcha` | No | `false` | Arm Scrapium's built-in **captcha detector and solver** on the first page attach. Turnstile, DataDome slider, reCAPTCHA, GeeTest, PerimeterX hold, and puzzle captchas are handled automatically, no extra CDP calls required from the client. Billed per solve; a failed attempt (`captchaError`) costs nothing. See [Captcha Solver documentation](https://scrapfly.io/docs/cloud-browser-api/captcha-solver). |

 **Stubbing vs Blocking:** Resources are **stubbed**, not blocked — the browser receives a valid but empty response (e.g. a transparent 1x1 pixel for images). This saves bandwidth while remaining invisible to anti-bot systems that detect blocked requests.

Example URL:

 ```
wss://browser.scrapfly.io?api_key=YOUR_API_KEY&proxy_pool=public_datacenter_pool&os=linux&session=my-session
```

## Related

- [Cloud Browser Getting Started](https://scrapfly.io/docs/cloud-browser-api/getting-started)
- [Billing &amp; Pricing](https://scrapfly.io/docs/cloud-browser-api/billing)
- [Playwright Integration](https://scrapfly.io/docs/cloud-browser-api/playwright)
- [Puppeteer Integration](https://scrapfly.io/docs/cloud-browser-api/puppeteer)
- [Browser Use GitHub Repository](https://github.com/browser-use/browser-use)
- [Browser Use Documentation](https://browser-use.com/)