Владельцам блогов или любых других проектов, которые предоставляют пользователям информацию достаточно часто приходит в голову мысль об удалении из индекса страниц.
Это может произойти по разным причинам, например, потому что информация устарела или потому что вы решили сменить тематику сайта, а те статьи, что были размещены на нем раньше, потеряли свою актуальность. Очень хорошо, что есть несколько действенных способов, которые дают нам возможность удалить из индекса ненужную страницу, но, к сожалению, не всегда это происходит моментально.
Самое первое, что приходит в голову, это, конечно же, страница 404 или простое удаление странички. Только вот следует обязательно дать пользователю понять, что та страница, к которой он обратился, уже удалена.
К сожалению, способ этот может хорошенько затянуться, ведь ему нужно хотя бы несколько раз увидеть несуществующую страницу, прежде чем страница будет удалена из индекса. Примечательно, что страницу вы можете удалить даже вручную.
В то же время хочется заметить, что метод этот порой бывает довольно трудозатратным, ведь вы можете удалить только одну страницу за один раз. Инструменты по удалению такого рода ссылок находятся в сервисах Вебмастер, как у Яндекса, так и у Гугла. Если вы думаете, что на этом работа закончилась, то это еще не все, страница должна выдавать ошибку 404 или вы должны прописать её в robots.txt. Если вы уже читали мои статьи о предварительном закрытии индексации, то уже знаете, как это делать.
Впрочем, есть универсальные правила наполнения этого файла, так что вам нужно всего лишь указать Disallow: /post.html #, где пост — это ненужная страница. Признаюсь честно, что такой способ вряд ли стоит использовать для одной страница, зато он подходит для целых рубрик или групп страниц. Также этот способ вряд ли подойдет в том случае, если вы хотите закрыть индексацию старых страниц, которые уже давно проиндексированы поисковиками и их даже посещали посетители.
Дело в том, что на эту же страницу могут вести внешние ссылки, которые, скорее всего, не закрыты от индексации, поэтому ваши усилия будут растрачены зря. Впрочем, индексацию страницы можно запретить даже в самом коде страницы, просто пропишите meta name=»robots» content=»noindex,nofollow» в head страницы.