Generator robots.txt

Asamblează robots.txt cu asistent: user-agent, Disallow/Allow, crawl-delay, sitemap, blocare boți AI. Copiere și descărcare.

Fără server Instant Privat Gratuit

Despre ce este acest instrument?

Generatorul de robots.txt asamblează, cu ajutorul unui asistent, fișierul robots.txt al site-ului tău, care le spune roboților motoarelor de căutare ce părți pot parcurge și ce nu. Poți seta user-agent-ul, căile interzise (Disallow) și permise (Allow), valoarea crawl-delay și adresa sitemap-ului, ba chiar poți bloca boții AI cu un clic. Instrumentul îți arată instant fișierul gata făcut, pe care îl poți copia sau descărca. Totul rulează în browserul tău.

Cum să folosești Generator robots.txt?

  1. Șablon sau manual

    Pornește de la un șablon rapid sau setează user-agent-ul și regulile manual.

  2. Căi

    Adaugă căile Disallow (interzise) și Allow (permise) în liste.

  3. Sitemap și boți

    Scrie URL-ul sitemap și, după nevoie, activează blocarea boților AI.

  4. Salvare

    Copiază sau descarcă fișierul și pune-l în rădăcina site-ului cu numele robots.txt.

Când ai nevoie de el?

  • Ascunderea adminului

    Excluderea paginilor interne, de admin sau de coș din parcurgerea motoarelor.

  • Semnalarea sitemap

    Indicarea URL-ului sitemap ajută motoarele să găsească toate paginile importante.

  • Gestionarea boților AI

    Decizia dacă crawlerele AI pot folosi conținutul tău, cu un singur clic.

  • Configurare WordPress

    Șablon gata făcut pentru gestionarea corectă a folderelor tipice WordPress.

Principalele directive robots.txt

Directivă Semnificație
User-agent Pentru care robot se aplică regulile
Disallow Nu parcurge această cale
Allow Poate parcurge această cale (excepție)
Crawl-delay Așteptare între cereri (sec)
Sitemap URL-ul complet al sitemap.xml

Cum funcționează robots.txt?

robots.txt este o înțelegere de curtoazie între site și roboții motoarelor de căutare. Când un robot vizitează un site, cere mai întâi fișierul robots.txt din rădăcină și verifică ce căi poate parcurge. Fișierul este format din blocuri user-agent: fiecare bloc spune ce reguli Disallow și Allow se aplică unui robot anume (sau tuturor, cu semnul *).

Este important să îi înțelegi limitele. robots.txt nu este un instrument de securitate: este doar o cerere, pe care roboții binevoitori o respectă, dar care nu impune nimic. URL-urile interzise rămân accesibile public, deci conținutul sensibil nu trebuie protejat niciodată doar cu el. În plus, Disallow împiedică parcurgerea, dar nu neapărat indexarea – pentru asta există meta tag-ul noindex.

Webul modern a adus o întrebare nouă: boții AI. Tot mai multe crawlere adună date pentru antrenarea modelelor de limbaj sau pentru motoarele AI. În robots.txt le poți permite sau bloca pe nume (de exemplu GPTBot, CCBot, Google-Extended), deci tu decizi dacă conținutul tău face parte din ecosistemul AI.

Sfaturi utile

  • Fișierul trebuie să fie mereu în rădăcină, exact cu numele robots.txt – într-un subdirector nu este valid.

  • Adaugă mereu linia sitemap – este unul dintre cele mai simple câștiguri SEO.

  • Nu bloca niciodată din greșeală întreg site-ul (Disallow: /) în producție – te poate exclude din motor.

  • Nu ascunde conținut confidențial cu robots.txt – folosește parolă sau protecție pe server.

Generator robots.txt – reguli de crawling pentru motoarele de căutare

robots.txt este prima pagină pe care o citește Google pe site-ul tău. Înainte să parcurgă vreo pagină, roboții cer acest fișier ca să afle unde au voie să intre. Un robots.txt greșit poate ascunde tot site-ul din căutare; unul corect ghidează roboții exact unde trebuie. Acest generator îl compune cu un asistent, în browserul tău.

Ce este robots.txt

robots.txt este un fișier text simplu, așezat în rădăcina site-ului (exemplu.ro/robots.txt). El conține directive pentru roboții motoarelor de căutare: ce căi pot parcurge și pe care ar trebui să le ocolească. Este o convenție respectată de toți roboții serioși, precum Googlebot și Bingbot.

Cum arată un robots.txt

Fișierul este format din blocuri. Fiecare bloc începe cu un User-agent (robotul vizat), urmat de reguli:

User-agent: *
Disallow: /admin/
Allow: /

Sitemap: https://exemplu.ro/sitemap.xml

Semnul * înseamnă „toți roboții”. Disallow interzice o cale, Allow face o excepție, iar Sitemap indică harta site-ului.

Principalele directive

DirectivăSemnificație
User-agentPentru care robot se aplică regulile
DisallowNu parcurge această cale
AllowPoate parcurge această cale (excepție)
Crawl-delayAșteptare între cereri (secunde)
SitemapURL-ul complet al sitemap.xml

Limita importantă: nu este securitate

robots.txt este o cerere, nu o barieră. Roboții binevoitori o respectă, dar fișierul nu impune nimic: URL-urile interzise rămân accesibile public dacă cineva le știe adresa, iar boții rău intenționați le pot ignora complet. Nu proteja niciodată conținut confidențial doar cu robots.txt – folosește parolă sau protecție pe server.

De asemenea, Disallow împiedică parcurgerea, dar nu neapărat indexarea. O pagină interzisă poate apărea în rezultate ca simplu URL. Pentru a o scoate complet, folosește meta tag-ul noindex – dar atunci nu o bloca și cu Disallow, altfel Google nu ajunge să vadă noindex-ul.

Boții AI: o decizie nouă

Tot mai multe crawlere adună date pentru antrenarea modelelor de limbaj sau pentru motoarele AI. În robots.txt le poți gestiona pe nume:

  • GPTBot, ChatGPT-User (OpenAI)
  • Google-Extended (Google AI)
  • anthropic-ai, ClaudeBot (Anthropic)
  • CCBot (Common Crawl)
  • PerplexityBot, Bytespider (alți furnizori)

Generatorul le poate bloca pe toate cu o singură bifă. Tu decizi: dacă vrei să protejezi conținutul de antrenarea AI, blochează-i; dacă vrei vizibilitate în motoarele AI, lasă-i permiși.

Cum se folosește generatorul

  1. Pornește de la un șablon (tot permis, WordPress, fără indexare) sau setează manual.
  2. Adaugă căile Disallow și Allow în liste.
  3. Scrie URL-ul sitemap și, opțional, crawl-delay.
  4. Bifează blocarea boților AI, dacă vrei.
  5. Copiază sau descarcă fișierul și pune-l în rădăcina site-ului.

Greșeli frecvente

  1. Disallow: / uitat în producție – blochează tot site-ul din căutare. Cea mai costisitoare greșeală de SEO.
  2. Fișier într-un subdirector – doar exemplu.ro/robots.txt este valid, nu exemplu.ro/folder/robots.txt.
  3. Blocarea folderelor de CSS/JS – poate împiedica Google să redea corect pagina.
  4. Lipsa liniei Sitemap – o ocazie ratată de a ghida roboții spre toate paginile.

Confidențialitate: totul rămâne local

Asamblarea fișierului rulează în browserul tău, prin JavaScript. Regulile pe care le compui nu ajung pe niciun server – poți pregăti robots.txt-ul și pentru un site aflat încă în dezvoltare.

Instrumente înrudite

Întrebări frecvente