Extrator de URLs de Sites

Rastreie qualquer site e extraia todos os links internos, externos e URLs de imagens. Exporte para TXT ou CSV e use direto nas suas auditorias de SEO.

Extract All URLs from Any Website

Internal Links
External Links
TXT & CSV Export

Why Extract Website URLs?

Site Auditing

Get a complete list of all pages and links on your website for comprehensive SEO audits and content inventory.

Find Broken Links

Discover all outgoing links to identify potential broken links that could harm your SEO and user experience.

Analyze Structure

Understand your website architecture by seeing all internal links and how pages connect to each other.

Competitor Analysis

Analyze competitor websites to understand their content strategy, page structure, and link patterns.

How It Works

1

Enter URL

Paste the website URL you want to crawl

2

Configure

Set crawl depth and what types of links to extract

3

Extract

Our crawler discovers and extracts all URLs

4

Export

Download or copy your extracted URLs

Important Notes

Due to browser security, only websites that allow cross-origin requests can be fully crawled.
JavaScript-rendered content may not be discoverable in browser-based crawling.
This tool respects robots.txt directives and will not crawl disallowed pages.
Crawling is rate-limited to avoid overwhelming target servers.

Privacy First

Crawling happens through our secure proxy to handle CORS restrictions. We don't store or log any URLs discovered.

  • Secure proxy for CORS handling
  • No URLs are stored or logged
  • No account required

Entender como as páginas do seu site estão conectadas é um dos primeiros passos para melhorar o SEO. Esse extrator percorre seu site e lista cada link que encontra — internos, externos e imagens — dando uma visão completa da estrutura de links. Serve tanto para auditar o próprio site quanto para dar uma olhada no que a concorrência tem por lá.

É simples : você cola a URL, o rastreador faz o trabalho. Cada link é classificado automaticamente como interno (mesmo domínio), externo (outros domínios) ou imagem. Você filtra o que quer ver e exporta em TXT ou CSV para continuar a análise na planilha ou na ferramenta de SEO que preferir.

O que é extração de URLs de sites?

Extração de URLs — também chamada de rastreamento web ou scraping — é o processo de percorrer um site de forma sistemática para coletar todos os links que ele contém. O rastreador começa numa página, pega todos os links ali presentes, acessa esses destinos para encontrar mais, e segue assim até mapear a estrutura inteira do site ou atingir o limite que você definiu.

No final, você tem uma radiografia completa do site: páginas, posts, listagens de produtos, qualquer coisa acessível via link. Os links para fora do domínio e os recursos de mídia como imagens também aparecem. Para quem trabalha com SEO, desenvolvimento web ou marketing digital, esse tipo de dado vale muito.

Por que extrair as URLs de um site?

Os usos são variados. Numa auditoria de SEO, mapear as URLs é o ponto de partida para encontrar páginas órfãs, perceber se a profundidade de rastreamento está elevada demais ou identificar onde a linkagem interna deixa a desejar. Quando você vê como as páginas estão conectadas, fica fácil detectar quais áreas os mecanismos de busca têm dificuldade de alcançar.

Para campanhas de link building, analisar os links externos de um site ajuda a entender o padrão de citações e achar oportunidades. Estrategistas de conteúdo usam a lista de URLs para fazer um inventário do que existe antes de planejar material novo ou consolidar páginas antigas. Em migrações, ter a lista completa é indispensável para garantir que os redirecionamentos sejam configurados certinho.

Os três tipos de links

A ferramenta divide as URLs em três categorias. Links internos apontam para páginas do mesmo domínio: são a espinha dorsal da navegação e influenciam diretamente como os mecanismos de busca distribuem autoridade entre as páginas. Uma estrutura de linkagem interna bem pensada ajuda tanto o usuário quanto o Googlebot a descobrir seus conteúdos.

Links externos levam para outros domínios. Esses links de saída afetam a relevância temática do site e dão pistas sobre o contexto do seu conteúdo. Revisá-los de vez em quando também é importante para pegar links quebrados ou que redirecionam para lugares problemáticos. Já as URLs de imagens listam todos os recursos visuais incorporados nas páginas — útil para verificar otimização e garantir que tudo está indexável.

Como o rastreador funciona

Você entra com uma URL e o rastreador carrega a página via proxy seguro para contornar restrições de CORS. Em seguida, analisa o HTML, extrai todas as tags de âncora e, opcionalmente, as fontes de imagens. Cada link interno descoberto entra numa fila para ser visitado na sequência, e assim vai até bater no limite de páginas que você configurou ou até não restar mais nenhuma página nova.

O rastreador foi pensado para não sobrecarregar servidores: tem controle de taxa de requisições embutido. Segue as convenções padrão da web e não tenta burlar restrições de acesso. Para resultados mais completos, o ideal é rastrear seus próprios sites, onde você tem acesso total.

Dicas para melhores resultados

Comece sempre pela página inicial — é de lá que geralmente partem os links para as seções principais. Configure o limite de páginas de acordo com o tamanho do site. Um blog pequeno pode ter 20 páginas; um e-commerce grande, milhares. Começar com um limite baixo dá resultados rápidos; aí você aumenta se precisar de mais profundidade.

Na hora de analisar, preste atenção nos padrões de URL. URLs claras e descritivas são mais fáceis de entender — para usuários e para mecanismos de busca. Cadeias de rastreamento muito longas podem indicar problema de navegação. Verifique os links externos para confirmar que ainda funcionam. E use o export para trabalhar os dados com mais calma numa planilha.

Limitações que vale conhecer

O rastreamento via navegador tem suas limitações. Conteúdo renderizado por JavaScript pode não aparecer nos resultados, já que o rastreador trabalha com HTML estático. Alguns sites bloqueiam acesso automatizado via CORS, medidas de segurança ou robots.txt, o que pode reduzir a cobertura. Para sites complexos onde você precisa de tudo, ferramentas de rastreamento do lado do servidor são mais indicadas.

Essa ferramenta foi feita para auditorias SEO de boa-fé. Respeite sempre os termos de uso e o robots.txt dos sites que você rastrear. Nos seus próprios sites, pode rastrear à vontade. Em sites de terceiros, use o bom senso. O controle de taxa existe justamente para não prejudicar nenhum servidor.

Perguntas frequentes

Ferramentas similares para explorar

AGE

Verificador de Idade de Domínio

Digite qualquer domínio e descubra na hora quando ele foi registrado, quantos anos tem, quando expira, quem registrou e quais servidores DNS usa — tudo via consulta WHOIS em tempo real.

Verificar idade do domínio

Validador de Sitemap

Valide seu sitemap XML contra o protocolo sitemaps.org. Detecte erros de sintaxe, elementos ausentes e URLs inválidas, e receba recomendações práticas para melhorar como os buscadores rastreiam seu site.

Validar Sitemap

Extrator de URLs de Sitemap

Pegue todas as URLs de qualquer sitemap XML em segundos. Funciona com índices de sitemap, exporta pra CSV e TXT, e traz os metadados completos: lastmod, prioridade e changefreq.

Extrair URLs

Baixador de Dados Google Search Console

Baixe seus dados do Google Search Console, exporte e analise tudo para entender de verdade o que acontece com seu trafego de busca e melhorar seu SEO.

Desbloquear Insights SEO

Buscador e Verificador de Sitemaps

Encontra e valida automaticamente todos os sitemaps XML de qualquer site. Verifica o robots.txt e mais de 12 caminhos comuns, valida cada sitemap encontrado e mostra a contagem de URLs na hora.

Buscar Sitemaps

Verificador de Links Dofollow Nofollow

Cole uma URL e veja na hora quais links nessa página passam autoridade SEO, quais estão em nofollow e se são internos ou externos.

Verificar Links