
Вы помните их? Это близнецы! Одинаковые, как две капли воды. Продолжаем издеваться над поисковыми системами и будем вводить их в заблуждение зеркальными, одинаковыми, дублированными страницами. Страницами близнецами!
Это вторая часть статьи про дублированный контент. Остальные статьи выйдут ой как не скоро…я не могу раскрыть все карты раньше времени
Статью продолжаю с использованием топового магазина всех времен и народов: нхлшоп.
Когда-то давным давно, когда интернет только зарождался была необходимость явно указывать браузеру о протоколе www. Сейчас, в современном мире %) эта необходимость отпала. И многие сайты открываются как по www так и без. Визуально для посетителя разницы никакой нет. Хоть с вэ-вэ-вэ (дабл ю-дабл ю-дабл ю) хоть без сайт работает. Но для поисковиков это разные сайты. Это дополнительные поддомены одного сайта.
Заходим по адресу http://nhlshop.ru/ и по адресу http://www.nhlshop.ru/ два разных адреса показывают одинаковое содержимое. Дорогие знатоки внимание вопрос: какой из этих адресов считать основным?
Для яндекса способ задать основной сайт это принудительно прописать его в robots.txt на сайте: http://nhlshop.ru/robots.txt к сожалению, prostoprint не дает пока править этот файлик самостоятельно, но необходимая строчка добавляется автоматически:

Второй способ: задать его в яндекс вебмастере.
Для google основной сайт можно задать как в вебмастере, так и с использованием 301 редиректа. Но об этом можно забыть т.к. доступа к соответствующим настройкам у нас нет.
Остальные поисковики используют 301 редирект.
Попробуйте открыть этот блог под двумя разными адресами: с www и без него. Вас автоматически перекинет на нужный адрес.
Слеш — косая черта в конце адресной строки сайта. Вот такая: http://nhlshop.ru/ <== заметили разницу? Нет? Тогда покажу еще раз. Вот без слеша: http://nhlshop.ru
Т.е. количество страниц на сайте можно смело умножать на два! Было у вас 100 страниц, станет 200. И у них у всех одинаковое содержимое. Этим грешат не только магазины, но и сам простопринт. Меня это очень раздражает:

Я хочу зайти в конструктор, даже помню адрес конструктора но меня не пускает! По одному адресу спрятан конструктор, по другому ошибка.
Попробуйте открыть этот блог со слешем и без него. Вас перекинет на нужную страницу.
С вводом чпу количество страниц на сайте опять можно умножить на два. Не происходит 301 редиректа (перенаправления) со старых адресов на новые. Каким образом поисковая система должна выявить приоритет URL? Погадав на кофейной гуще?
Вы бы какой url выбрали: login-12345 или krasivaya-futbolka4? А что выберет поисковик? Откуда ему знать что под этими разными адресами содержится одинаковое содержимое?
Домашнее задание: подсчитайте количество дублей страниц на вашем сайте, отпишитесь в комментах.
1. Замечания со слешем и www имеют место только в партнерских магазинах, на ПП ты не сможешь открыть ссылку и с слешем и без, и с www и без.
2. ЧПУ
>>Каким образом поисковая система должна выявить приоритет URL? Погадав на кофейной гуще?>>
Ответ: rel=«canonical»
А чего ты у себя в блоге забыл указать, что для ЧПУ используется rel=«canonical»? а? или это не важно по твоему? или всю информацию нужно коверкать по своему?
>>Вы бы какой url выбрали: login-12345 или krasivaya-futbolka4? А что выберет поисковик? Откуда ему знать что под этими разными адресами содержится одинаковое содержимое? >>
Ну так проверить сложно? вбей и посмотри что выберет поисковик, а выберет он krasivaya-futbolka4 из-за атрибута rel=”canonical”.
>>Домашнее задание: подсчитайте количество дублей страниц на вашем сайте, отпишитесь в комментах.>>
0.
Смотрим:
Есть один товар, с разными ссылками, код товара и ЧПУ:
http://spensor-shop.com.ua/product/spensor-923023/
http://spensor-shop.com.ua/product/futbolka-eto-ne-ya-eto-moya-sobaka1/
Действие 1.
Ищем в Яндексе название футболки: Футболка Это не я! Это моя собака! Область поиска: сайт — spensor-shop.com.ua
http://yandex.ua/yandsearch?text=%D1%8F%20%D0%B8%D1%89%D1%83%20%D0%A4%D1%83%D1%82%D0%B1%D0%BE%D0%BB%D0%BA%D0%B0%20%D0%AD%D1%82%D0%BE%20%D0%BD%D0%B5%20%D1%8F%21%20%D0%AD%D1%82%D0%BE%20%D0%BC%D0%BE%D1%8F%20%D1%81%D0%BE%D0%B1%D0%B0%D0%BA%D0%B0%21&site=spensor-shop.com.ua&rstr=&within=0&numdoc=10&lr=143&tld=ua
Действие 2.
Аналогичное действие в google.
https://www.google.com.ua/search?hl=ru&as_q=%D1%8F+%D0%B8%D1%89%D1%83+%D0%A4%D1%83%D1%82%D0%B1%D0%BE%D0%BB%D0%BA%D0%B0+%D0%AD%D1%82%D0%BE+%D0%BD%D0%B5+%D1%8F+%D0%AD%D1%82%D0%BE+%D0%BC%D0%BE%D1%8F+%D1%81%D0%BE%D0%B1%D0%B0%D0%BA%D0%B0&as_epq=&as_oq=&as_eq=&as_nlo=&as_nhi=&lr=&cr=&as_qdr=all&as_sitesearch=spensor-shop.com.ua&as_occt=any&safe=images&as_filetype=&as_rights=#hl=ru&lr=&tbo=d&as_qdr=all&q=%D0%A4%D1%83%D1%82%D0%B1%D0%BE%D0%BB%D0%BA%D0%B0+%D0%AD%D1%82%D0%BE+%D0%BD%D0%B5+%D1%8F+%D0%AD%D1%82%D0%BE+%D0%BC%D0%BE%D1%8F+%D1%81%D0%BE%D0%B1%D0%B0%D0%BA%D0%B0+site:spensor-shop.com.ua&oq=%D0%A4%D1%83%D1%82%D0%B1%D0%BE%D0%BB%D0%BA%D0%B0+%D0%AD%D1%82%D0%BE+%D0%BD%D0%B5+%D1%8F+%D0%AD%D1%82%D0%BE+%D0%BC%D0%BE%D1%8F+%D1%81%D0%BE%D0%B1%D0%B0%D0%BA%D0%B0+site:spensor-shop.com.ua&gs_l=serp.3…1383.2072.0.2278.6.6.0.0.0.1.249.656.4j1j1.6.0…0.0…1c.1.24aXocjnFEk&bav=on.2,or.r_gc.r_pw.r_cp.&bvm=bv.41018144,d.Yms&fp=5d889cab7d6b7171&biw=1600&bih=775
Действие 3.
Проверяем на сайте по поиску дублей copyscape.com
http://copyscape.com/?q=http%3A%2F%2Fspensor-shop.com.ua%2Fproduct%2Ffutbolka-eto-ne-ya-eto-moya-sobaka1%2F
Действие 4.
Проверяем на сайте http://istio.com/rus/text/analyz/
В итоге 0 дублей. Основным урл’ом считает ЧПУшную ссылку.
На основе чего ты писал данный пост? Прежде чем писать проверяешь сам?
а, вот еще один сайт для проверки дублей http://www.seolib.ru/script/copy/
Скрин анализа данных ссылок: http://piccy.info/view3/3989727/6e4644dcf69891b26b71cafab176a684/
pumpkin 16 Янв 2013
Случай с конструктором не является примером дублированного контента — ведь содержимое разное (конструктор и ошибка)