кривые ссылки
#1
Отправлено 03 августа 2012 - 06:46
нужна помощь! на сайте Яндекс находит ссылки с повторяющимися директориями в URL, типа "/livingcenter/livingcenter/livingcenter/", хотя в реальности такой вложенности явно нет. Страницы по таким ссылкам открываются кривые-косые и непонятно откуда взятые.
В чем может быть причина появления таких ссылок? в глючных скриптах?
Как можно выловить все подобные ссылки?
Буду рад любому совету и объяснению!
#2
Отправлено 03 августа 2012 - 10:03
Смотрите: если поисковой бот проиндексировал страницу "/livingcenter/livingcenter/livingcenter/", то значит он на нее зашел. Ваш сервер и CMS (или что вы там используете) должен быть настроен таким образом, что при заходе на несуществующую страницу выдавался ответ 404 Not found и чтобы такие запросы писались в лог. В дальнейшем такой лог можно будет анализировать. Для облегчения работы можно написать скрипт, который будет парсить такой лог.Как можно выловить все подобные ссылки?
#3
Отправлено 06 августа 2012 - 05:39
Ваш сервер и CMS (или что вы там используете) должен быть настроен таким образом, что при заходе на несуществующую страницу выдавался ответ 404 Not found.
при заходе на несуществующие страницы 404-я ошибка выдается. вот только страницы, с которыми проблема, не считаются несуществующими, они открываются в браузере. поэтому, как отслеживать их по запросам к несуществующим страницам я не знаю.
нет каких-нибудь программ, которые сканировали бы сайт, как xenu например, но отслеживали не битые ссылки, а подобные моим?
#4
Отправлено 06 августа 2012 - 10:09
А Вы уверены, что сервер все же не отправляет статус 404 ошибки?при заходе на несуществующие страницы 404-я ошибка выдается. вот только страницы, с которыми проблема, не считаются несуществующими, они открываются в браузере
Посмотрите, как это можно узнать:
Прикрепленные файлы
#5
Отправлено 06 августа 2012 - 10:28
Спасибо за объяснение. Но 404 ошибки все же нет. страница во всех смыслах рабочая, только вся кривая, поехавшая, и неясно откуда взявшаяся.Посмотрите, как это можно узнать:
а как можно найти, на какой странице сайта располагается ссылка на мою косячную? может быть я там смогу найти ответы.
#6
Отправлено 07 августа 2012 - 08:20
Вы можете настроить access-логи сервера так, чтобы туда записывались источники перехода на страницы вашего сайта (для вашего примера - "/livingcenter/livingcenter/livingcenter/").а как можно найти, на какой странице сайта располагается ссылка на мою косячную? может быть я там смогу найти ответы.
Также рекомендую обратиться к программистам или вашему веб-мастеру с просьбой помочь вам. Думаю, они быстрее найдут причину проблемы.
И пусть они для несуществующих страниц изменят заголовок, отправляющий код не со статусом 200 (ОК), а с 404 (Not Found).
Количество пользователей, читающих эту тему: 1
0 пользователей, 1 гостей, 0 анонимных