Cum să ștergeți un site sau fragmentele acestuia din indexul Google
Conform conceptului de indexare adoptat de Google, a reprezentat integralitatea, obiectivitatea informațiilor și conformitatea cu interogarea de căutare în eliberarea rezultatelor. În cazul în care indicele de site-ul scade cu conținut ilegal sau de resurse pentru spam, paginile acestui site nu vor fi marcate în comun cu motorul de căutare de baze de date. Pentru noi este important să învățăm, cum să ștergeți un site de la emiterea serverului pe baza rezultatelor căutării.
Opțiuni de indexare zero pentru Google
De îndată ce crawlerul - programul pentru colectarea de informații despre noi resurse - scanează pagina de pagină pe pagină, atunci dacă îndeplinește cerințele politicii Google privind parsarea, aceasta va fi indexată. Dar vom descrie și cum să ștergeți site-ul sau fragmentele individuale pentru motoarele de căutare folosind robots.txt - un pointer și, în același timp, un terminator de căutare.
Pentru a exclude întreaga resursă din problemă, se creează o anumită zonă de text în dosarul rădăcină al serverului pe care este localizat site-ul - robots.txt menționat mai sus. Această zonă este procesată de motoarele de căutare și funcționează în conformitate cu instrucțiunile citite.
Rețineți că motorul de căutare Google va indexa pagina, chiar dacă utilizatorul nu are permisiunea de a vedea. Atunci când browserul emite un răspuns 401 sau 403, "Accesul nu este valabil", aceasta se aplică numai vizitatorilor, nu celor care le construiesc motor de căutare.
Pentru a înțelege, cum să eliminați site-ul din indexul de căutare, în pointerul de text ar trebui să includă următoarele rânduri:
User-agent: Googlebot
Nu permiteți: /
Acest lucru indică robotului căutării că este interzisă indexarea întregului conținut al site-ului. aici cum să ștergeți un site Google, astfel încât acesta din urmă să nu cacheze resursa din lista găsită.
Opțiunile de scanare pentru diferite protocoale
Dacă trebuie să listați standardele de comunicare individuale pentru care doriți să aplicați reguli specifice pentru indexarea Google, de exemplu, separat pentru hipertext http / https, Aceasta ar trebui să fie setată și în robots.txt în modul următor (exemplu).
(https://yourserver.com/robots.txt) - numele domeniului site-ului dvs. (orice)
User-agent: * - pentru orice motor de căutare
Permiteți: / - permite indexarea completă
Cum să eliminați complet un site din emisiune pentru protocolul https
(Https://yourserver.com/robots.txt):
User-agent: *
Nu permiteți: / interzicerea completă a indexării
Ștergerea urgentă a adresei URL a resursei de la Căutarea Google Google
Dacă nu doriți să așteptați re-indexarea și site-ul trebuie să fie ascuns cât mai curând posibil, vă recomandăm să utilizați serviciul https://services.google.com/urlconsole/controller. Fișierul pre-robots.txt ar trebui să fie deja plasat în directorul rădăcină al serverului de site. Instrucțiunile trebuie să fie scrise în ea.
În cazul în care indicatorul pentru un motiv oarecare nu pot fi editate în directorul rădăcină, creați suficient în folderul cu obiective pentru care doriți să le ascundeți de motoarele de căutare. De îndată ce faceți acest lucru și contactați serviciul de eliminare automată a adreselor de hipertext, Google nu va scana directoarele care sunt scrise în robots.txt.
Perioada de invizibilitate este fixată timp de 3 luni. După această perioadă, directorul eliminat din ediție va fi procesat din nou de serverul Google.
KCum să ștergeți un site pentru scanare în parte
Când botul de căutare citește conținutul fișierului robots.txt, pe baza conținutului său, se iau anumite decizii. De exemplu, trebuie să excludeți de pe ecran întregul director numit anatom. Pentru aceasta este suficient să scrieți astfel de instrucțiuni:
User-agent: Googlebot
Nu permiteți: / anatom
Sau, de exemplu, nu doriți să indexați toate imaginile ca .jpg. Pentru aceasta, adăugați următoarea listă:
User-agent: Googlebot
Dezactivați: /*.jpg$
Iată un alt exemplu. Să ștergem informațiile despre paginile generate dinamic din parsare, apoi adăugăm următoarea intrare la pointer:
User-agent: Googlebot
Nu permiteți: / *?
Deci, aproximativ, și regulile pentru motoarele de căutare sunt prescrise. Un alt lucru este că este mult mai convenabil pentru toate acestea să folosească eticheta META. Și webmasterii folosesc adesea doar un astfel de standard care reglementează funcționarea motoarelor de căutare. Dar vom vorbi despre asta în următoarele articole.
- Instrucțiuni: cum să faceți Google pagina dvs. de pornire
- Întrebarea eternă: care este mai bine - Google sau Yandex?
- Cel mai popular sistem de căutare american din lume
- Clasament - ce înseamnă asta?
- La fel ca în "Google Chrome", eliminați pagina de start. Configurarea browserului din…
- Google Alert: toate detaliile
- Căutați pe site prin Google și Yandex. Script de căutare pe site
- Indexarea site-ului în motoarele de căutare
- Ce este un crawler? Funcțiile robotului de căutare "Yandex" și Google
- Motoarele de căutare pe Internet Lista este în creștere
- Cum îmi schimb setările de căutare Google Chrome?
- Cum să faci pagina de pornire Google în diferite browsere?
- Adăugarea unui site la motoarele de căutare nu este suficientă - cum să accelerați indexarea?
- Soluție simplă, cum să faci pagina de pornire a "Mile.ru"
- Optimizarea site-urilor. Înregistrarea în motoarele de căutare
- Înregistrați un site pe Google nu este ușor, dar foarte simplu
- Cum de a face Google pagina dvs. de pornire
- Cum să adăugați un site la Google?
- Ce este un feed și cine are nevoie de el?
- Google. Căutare avansată ca instrument de lucru
- Înregistrați un site în motoarele de căutare - este foarte important pentru promovarea acestuia