|
| Дата |
|
USD/RUB | 88.6852 | BTC/USD | 68271.8247 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
22.09.2011, 00:03
|
#1
|
Senior Member
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
|
На самописной CMS нету 404-й страницы. Выручайте.
Значит, ситуация такая. Приятель пожаловался на то что сайт в жопе и "вообще как-то странно индексируется". Смотрю: какой-то дичайший самопис-CMS, при этом в индексе ПС куча старых удаленных страниц.
И самое главное: страница которая должна быть 404-й не отдает этот самый код 404 (статус 404). Просто надпись:
Указанная страница не найдена.
Нужно решение, как это победить, не сильно углубляясь в исходники (так как понятно, в чужом говне никому копаться не интересно). Может .htaccess, может еще как.
В общем, гуру - ХЕЛП! За деньгу или тут. Если за деньгу - то в асю стучите.
|
|
|
22.09.2011, 00:12
|
#2
|
Читатель
Регистрация: 23.11.2007
Сообщений: 420
Бабло: $48745
|
Сделать поиск по файлам проекта текста "Указанная страница не найдена." и в найденной функции \ методе \ хуетоде перед выводом всего и вся -- в том числе и ПЕРЕД выводом текста насчет не найдено (иначе эггог словишь, ну и сомневаюсь что там кеширование вывода юзается) захерачить
Код:
header("HTTP/1.0 404 Not Found");
header("Status: 404 Not Found"); // for fast cgi
|
|
|
22.09.2011, 00:24
|
#3
|
Senior Member
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
ТС -->
|
ТС
dveredel, ОГРОМНОЕ ТЕБЕ СПАСИБО.
p.s. Кстати, интересно мнение общественности: что лучше поставить на 404-ю: поиск, тизеры актуальные какие-нибудь или просто оставить такой? (если шоп)
|
|
|
22.09.2011, 00:29
|
#4
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
надо сначала определить, что закрывать, а что нет и варианта 3:
1) понять, по каким адресам должно быть 404 и эти адреса закрывать 404, остальное отдавать 200 или что там...
2) наоборот, понять какие оставить, а остальное закрыть 404
3) комбинированно
методов контроля за ответами веб-сервера два:
1) на уровне бекенда, т.е. в скриптах искать места и вставлять отсылку нужных хедеров, т.е. непосредственно в код
2) на уровне фронтенда/вебсервера. в апаче это .htaccess. Можно придумать rewrite rules
понять что глушить, а что нет, может помочь sitemap.xml, если она есть.
выбор простейшего способа будет зависить от структуры урл и от каких-то закономерностей.
например, если все урлы вида _ttp://domen.com/index.php?page=100 и для всех страниц меньше 100 надо отдавать 404, то проще в htaccess закрыть, чем ковыряться в чужом коде
|
|
|
22.09.2011, 00:32
|
#5
|
Senior Member
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
ТС -->
|
ТС
Да нет, все ок. Я нашел и воткнул хедер (косяк разработчика)
|
|
|
22.09.2011, 00:37
|
#6
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
Цитата:
Сообщение от 1een
Да нет, все ок. Я нашел и воткнул хедер (косяк разработчика)
|
ну как бы лучше отсекать эти запросы с помощью 404 на фронтенде, а в скриптах....если есть возможность.
Тут вопрос в производительности и нагрузки на сервер.
|
|
|
22.09.2011, 00:39
|
#7
|
Senior Member
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
ТС -->
|
ТС
Да какой там фронтэнд: кучка php-файлов, fckeditor и простой шаблонизатор - обычная поделка, каких в рунетах тысячи.
|
|
|
22.09.2011, 00:40
|
#8
|
Читатель
Регистрация: 23.11.2007
Сообщений: 420
Бабло: $48745
|
Цитата:
Сообщение от chesser
ну как бы лучше отсекать эти запросы с помощью 404 на фронтенде, а в скриптах....если есть возможность.
Тут вопрос в производительности и нагрузки на сервер.
|
Ты зануда )) Ясно же чел написал -- самопальная говноцмс в которую вникать никому нет ни времени ни желания, и соотв выяснить "по каким 404 а по каким 200 и че там ваще как" невозможно. пис.
|
|
|
22.09.2011, 01:06
|
#9
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
|
Цитата:
Сообщение от dveredel
Ты зануда )) Ясно же чел написал -- самопальная говноцмс в которую вникать никому нет ни времени ни желания, и соотв выяснить "по каким 404 а по каким 200 и че там ваще как" невозможно. пис.
|
все же я еще последний раз позанудствую и попытаюсь донести принципиальное различие двух способов.
Не важно какая там cms. Важно кол-во страниц с предполагаемой 404 ошибкой, которые уже в индексе, либо которые висят в очереди на индексацию у ПС, либо на которые стоят внешние ссылки. Если таких страниц много, а именно:
Цитата:
в индексе ПС куча старых удаленных страниц
|
значит боты постоянно теребят сайт, каждый раз запуская PHP скрипты, а вдруг так каждый раз происходит коннект к базе, инициализация какой-нибудь неведомой хуйни и тд. Это все неоправданная нагрузка на сервер, от которой можно/желательно избавиться, если отсечь эти запросы, не допуская их до пхп.
говорю не просто так, а потому что есть личные примеры, когда было 1кк страниц на сайте, также забыл 404 прописать....сайт умирал, после вписывания в пхп 404 хедеров стало попроще - это да, но все равно память кушалась хорошо, а если ее и так мало? когда отрезал запросы от пхп, нагрузка вообще исчезла.
ну сорри за занудство, разница реально есть.
ТС решил проблему - гуд, не вопрос. Но вдруг потом кто-то другой будет искать ответ на похожий вопрос и ему вдруг мой текст пригодится. пис
|
|
|
|