Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB58.6370
BTC/USD0.0000
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 22.09.2011, 00:03   #1
1een
Senior Member
 
Аватар для 1een
 
Регистрация: 28.05.2009
Сообщений: 1,306
Бабло: $161695
По умолчанию На самописной CMS нету 404-й страницы. Выручайте.

Значит, ситуация такая. Приятель пожаловался на то что сайт в жопе и "вообще как-то странно индексируется". Смотрю: какой-то дичайший самопис-CMS, при этом в индексе ПС куча старых удаленных страниц.

И самое главное: страница которая должна быть 404-й не отдает этот самый код 404 (статус 404). Просто надпись:

Указанная страница не найдена.

Нужно решение, как это победить, не сильно углубляясь в исходники (так как понятно, в чужом говне никому копаться не интересно). Может .htaccess, может еще как.

В общем, гуру - ХЕЛП! За деньгу или тут. Если за деньгу - то в асю стучите.
1een вне форума  
Старый 22.09.2011, 00:12   #2
dveredel
Читатель
 
Аватар для dveredel
 
Регистрация: 23.11.2007
Сообщений: 423
Бабло: $48745
По умолчанию

Сделать поиск по файлам проекта текста "Указанная страница не найдена." и в найденной функции \ методе \ хуетоде перед выводом всего и вся -- в том числе и ПЕРЕД выводом текста насчет не найдено (иначе эггог словишь, ну и сомневаюсь что там кеширование вывода юзается) захерачить
Код:
header("HTTP/1.0 404 Not Found");
header("Status: 404 Not Found");  // for fast cgi
dveredel вне форума  
Старый 22.09.2011, 00:24   #3
1een
Senior Member
 
Аватар для 1een
 
Регистрация: 28.05.2009
Сообщений: 1,306
Бабло: $161695
ТС -->
автор темы ТС По умолчанию

dveredel, ОГРОМНОЕ ТЕБЕ СПАСИБО.

p.s. Кстати, интересно мнение общественности: что лучше поставить на 404-ю: поиск, тизеры актуальные какие-нибудь или просто оставить такой? (если шоп)
1een вне форума  
Старый 22.09.2011, 00:29   #4
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,382
Бабло: $470735
По умолчанию

надо сначала определить, что закрывать, а что нет и варианта 3:
1) понять, по каким адресам должно быть 404 и эти адреса закрывать 404, остальное отдавать 200 или что там...
2) наоборот, понять какие оставить, а остальное закрыть 404
3) комбинированно

методов контроля за ответами веб-сервера два:
1) на уровне бекенда, т.е. в скриптах искать места и вставлять отсылку нужных хедеров, т.е. непосредственно в код
2) на уровне фронтенда/вебсервера. в апаче это .htaccess. Можно придумать rewrite rules

понять что глушить, а что нет, может помочь sitemap.xml, если она есть.
выбор простейшего способа будет зависить от структуры урл и от каких-то закономерностей.

например, если все урлы вида _ttp://domen.com/index.php?page=100 и для всех страниц меньше 100 надо отдавать 404, то проще в htaccess закрыть, чем ковыряться в чужом коде
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 22.09.2011, 00:32   #5
1een
Senior Member
 
Аватар для 1een
 
Регистрация: 28.05.2009
Сообщений: 1,306
Бабло: $161695
ТС -->
автор темы ТС По умолчанию

Да нет, все ок. Я нашел и воткнул хедер (косяк разработчика)
1een вне форума  
Старый 22.09.2011, 00:37   #6
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,382
Бабло: $470735
По умолчанию

Цитата:
Сообщение от 1een Посмотреть сообщение
Да нет, все ок. Я нашел и воткнул хедер (косяк разработчика)
ну как бы лучше отсекать эти запросы с помощью 404 на фронтенде, а в скриптах....если есть возможность.
Тут вопрос в производительности и нагрузки на сервер.
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 22.09.2011, 00:39   #7
1een
Senior Member
 
Аватар для 1een
 
Регистрация: 28.05.2009
Сообщений: 1,306
Бабло: $161695
ТС -->
автор темы ТС По умолчанию

Да какой там фронтэнд: кучка php-файлов, fckeditor и простой шаблонизатор - обычная поделка, каких в рунетах тысячи.
1een вне форума  
Старый 22.09.2011, 00:40   #8
dveredel
Читатель
 
Аватар для dveredel
 
Регистрация: 23.11.2007
Сообщений: 423
Бабло: $48745
По умолчанию

Цитата:
Сообщение от chesser Посмотреть сообщение
ну как бы лучше отсекать эти запросы с помощью 404 на фронтенде, а в скриптах....если есть возможность.
Тут вопрос в производительности и нагрузки на сервер.
Ты зануда )) Ясно же чел написал -- самопальная говноцмс в которую вникать никому нет ни времени ни желания, и соотв выяснить "по каким 404 а по каким 200 и че там ваще как" невозможно. пис.
dveredel вне форума  
Старый 22.09.2011, 01:06   #9
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,382
Бабло: $470735
По умолчанию

Цитата:
Сообщение от dveredel Посмотреть сообщение
Ты зануда )) Ясно же чел написал -- самопальная говноцмс в которую вникать никому нет ни времени ни желания, и соотв выяснить "по каким 404 а по каким 200 и че там ваще как" невозможно. пис.
все же я еще последний раз позанудствую и попытаюсь донести принципиальное различие двух способов.
Не важно какая там cms. Важно кол-во страниц с предполагаемой 404 ошибкой, которые уже в индексе, либо которые висят в очереди на индексацию у ПС, либо на которые стоят внешние ссылки. Если таких страниц много, а именно:
Цитата:
в индексе ПС куча старых удаленных страниц
значит боты постоянно теребят сайт, каждый раз запуская PHP скрипты, а вдруг так каждый раз происходит коннект к базе, инициализация какой-нибудь неведомой хуйни и тд. Это все неоправданная нагрузка на сервер, от которой можно/желательно избавиться, если отсечь эти запросы, не допуская их до пхп.

говорю не просто так, а потому что есть личные примеры, когда было 1кк страниц на сайте, также забыл 404 прописать....сайт умирал, после вписывания в пхп 404 хедеров стало попроще - это да, но все равно память кушалась хорошо, а если ее и так мало? когда отрезал запросы от пхп, нагрузка вообще исчезла.

ну сорри за занудство, разница реально есть.
ТС решил проблему - гуд, не вопрос. Но вдруг потом кто-то другой будет искать ответ на похожий вопрос и ему вдруг мой текст пригодится. пис
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума