Дублированный контент на блоге — что, откуда и куда

Автор:Дата:Откуда появляется дублированный контент и как с ним бороться

Дублированный контентВ прошлой статье, посвященной плагину Platinum SEO Pack, мы затронули вопрос о дублированном контенте. И только вскользь упомянули, что повторения опасны. Сегодня мы подробнее обсудим, как появляются дубли и почему же они настолько вредны для любого блога или сайта. Вообще, на первый взгляд, сама возможность существования дублированного контента – кажется совершенно нелогичной. Мы же не наполняем свой любимый блог копипастом и уж, тем более, не публикуем одну и ту же статью несколько раз… Уверены, что нет?

Как появляются дубли контента

Вот я пишу этот пост, который будет опубликован и получит свой уникальный адрес /dubl/ Это будет первая – оригинальная – версия текста;

Но самое начало поста, а именно, ее анонс (который составляет 13% текста) – все, что расположено выше ката «Читать далее» — будет опубликовано, также, на главной странице блога по адресу /blog/ Это будет первый дубль, пусть и не всего текста, но его части. То есть, наша статья потеряет 13% технической уникальности;

Эта же статья войдет в рубрику «Наш первый блоГ». Таким образом, ее анонс будет демонстрироваться по адресу /category/newblog/ Это будет второй дубль анонса;

То же самое будет открываться через архив по месяцам по адресу /2012/09/ — третий дубль;

Архив по меткам /tag/качество-контента/ — четвертый дубль (тут количество дублей зависит от количества тегов-меток, которые мы присвоим посту);

Кроме того, анонс будет открываться и при перелистывании страниц, постепенно вытесняемый новыми постами /blog/page/…/ — пятый дубль;

- Ну и что?! Это же не проявление нашей злой воли – такая структура блога является совершенно естественной, технически обусловленной! – Именно такие эмоции вызывала (и вызывает) у меня «проблема появления дублированного контента». Но, увы, естественность – не повод игнорировать создавшееся положение.

Дублированный контент и поисковые системы

Примитивный взгляд на проблему – таков:

приходит к нам на блог робот поисковой системы, скажем, Яндекса или Гугла, и видит пять-десять дублей одного и того же текста. – Копипаст! – вопит он и отправляет наше, совершенно искреннее и уникальное творение, в мусорную корзину…

Я уверена, что так не происходит. Ведь тогда в поиск оказался бы пуст. Крайне трудно найти сайт или блог, чья структура не генерировала бы дублей. Тысячи блоггеров вообще не задумываются над этим вопросом, а их блоги продолжают вполне поступательно развиваться.

Но, с другой стороны, это некий «общий грех», который очень просто вменить в вину кому угодно – было бы желание. Поэтому лучше заранее постараться выправить себе индульгенцию.

Как избавиться от дублей контента

Ну, практически, никак! – если отвечать кратко.

Единственный «лобовой» путь – писать отдельные анонсы для постов, которые будут демонстрироваться на общих страницах (на главной, в архивах и т.д.). Это делается через функцию «цитита», которая есть на современных версиях Вордпресс. Хотя, для того, чтобы эти, специально написанные, анонсы корректно отображались, нужно, чтобы тема блога, тоже, была совместима с этим функционалом.

Можно оставить общие страницы совсем без анонсов, публикуя там лишь заголовки статей… Но это дурацкое решение (если только ваши заголовки не интригуют читателя до крайности или если вы не ведете блог-каталог, читатели которого и без анонсов прекрасно понимают, о чем идет речь в статье).

Но самый верный путь – просто не пускать робота на страницы с дублированным контентом!

Конечно, робот все равно лазит, где ему вздумается. Но если мы напишем, что, мол, «тут играй, а тут – не играй» — это и станет для нас той самой индульгенцией.

Как это сделать? – Конечно, при помощи файла robots.txt! Если только у вас есть к нему доступ (если вы ведете автономный блог на платном хостинге) – обязательно напишите такую инструкцию robots, которая оставит для индексирования только оригиналы текста, а его дубли выведет за скобки.

О том, как это сделать, мы побеседуем в следующей статье.

Оставайтесь на связи! Блоготей пришлет вам новые статьи на почту!
Введите свой E-MAIL:

     Katyaru 18.09.2012


    
Читайте БлоготеЙ! на Google+
Читайте БлоготеЙ! на Фейсбуке

К записи "Дублированный контент на блоге — что, откуда и куда" оставлено 4 коммент.

  1. Илона:

    Буду ждать продолжения — я всё никак до конца с этим файлом не разберусь(

    [Ответить]

  2. venezia:

    Очень полезная информация, спасибо! Только все это слишком сложно — столько всего везде надо отслеживать!((((

    [Ответить]

    katyaru отвечает:

    На самом деле, нужно просто раз и навсегда закрыть дубли от индексации — и усё, отслеживать не нужно)

    [Ответить]

  3. Алиса:

    Главное — не перестараться. Я с ним мудрила-мудрила и раз вместе с архивами каким-то образом половину статей закрыла. И ладно бы год целый. Так нет, с полгода выпало. Как — хз.

    [Ответить]


два + 8 =

Палю тему!
Гугл в помощь
Надо подписаться!

Введите свой E-MAIL:

Delivered by FeedBurner

Дружите с Блоготеем в соцсетях


Смотрите все ВИДЕО Блоготея на YouTube


Blogotey | 


Спутник Блоготея в Tumblr

Наверх.