|
| Дата |
|
USD/RUB | 93.4409 | BTC/USD | 64264.7168 |
|
|
|
Поисковые системы Поисковая оптимизация под Google, Yahoo, Bing и т.д. |
07.10.2008, 20:26
|
#1
|
Senior Member
Регистрация: 10.07.2008
Сообщений: 233
Бабло: $43675
|
Вопросы по robots.txt
если там есть следующая запись Disallow: /papka/ то значит ли это что запрещается индекс всех вложеных в эту папку папок и файлов внутри них, или это касается только файлов внутри папки papka?
подскажите плз
|
|
|
07.10.2008, 20:40
|
#2
|
Senior Member
Регистрация: 19.04.2007
Сообщений: 2,393
Бабло: $314345
|
И файлов и папок касается, т.е. запрещается индекс всех вложеных в эту папку папок и файлов внутри них.
|
|
|
07.10.2008, 21:58
|
#3
|
Ебланнед
Регистрация: 22.11.2007
Сообщений: 2,984
Бабло: $48575
|
угу, но если домен трастовый и внешних ссылок много, то гугл может проиндексировать. правда сниппет не покажет
|
|
|
07.10.2008, 22:34
|
#4
|
Senior Member
Регистрация: 05.10.2007
Сообщений: 310
Бабло: $1235
|
если будут ссылки на эту папку, либо там будет большой траффик, то она будет 100% в индексе гугли.
__________________
coming soon
|
|
|
07.10.2008, 22:36
|
#5
|
Senior Member
Регистрация: 03.06.2007
Сообщений: 489
Бабло: $810
|
DimaX прав, gcc тоже.
Есть живой пример, когда гугль несколько месяцев не выкидывал из индекса сайт, на котором стоял полный запрет индексации.
Вообще сейчас единственная защита от бота - .htaccess с паролем на вход в директорию. Но если Chrome начнет работать как индексатор - тогда совсем пиздец
|
|
|
07.10.2008, 23:06
|
#6
|
Senior Member
Регистрация: 10.07.2008
Сообщений: 233
Бабло: $43675
ТС -->
|
ТС
Цитата:
Сообщение от Chin
DimaX прав, gcc тоже.
Есть живой пример, когда гугль несколько месяцев не выкидывал из индекса сайт, на котором стоял полный запрет индексации.
Вообще сейчас единственная защита от бота - .htaccess с паролем на вход в директорию. Но если Chrome начнет работать как индексатор - тогда совсем пиздец
|
во во...а то я нашет тут парочку проиндексированых папок, на которые стоит запрет
и еще тогда вопрос по .htaccess - можно ли с помощью него (без логина/пароля) запретить доступ ботам к определенным папкам/файлам?
сама реализация не интересует.
короче ищу вариант как проверить резрешена или нет индексация на некоторых доменах =)
|
|
|
08.10.2008, 07:57
|
#7
|
Юниор
Регистрация: 09.08.2008
Сообщений: 25
Бабло: $1110
|
Цитата:
Сообщение от Bond James
...и еще тогда вопрос по .htaccess - можно ли с помощью него (без логина/пароля) запретить доступ ботам к определенным папкам/файлам?
сама реализация не интересует...
|
Ну если в лоб решить...
1) Воткнуть в корневой htaccess контроль захода на robots.txt с запуском скрипта. Если бот, то он обязан зайти на robots.txt, стало быть запустит скрипт.
2) Этот скрипт сгенерит htaccess в папке (ну или инклюд) с 404 мордой.
|
|
|
08.10.2008, 13:15
|
#8
|
Senior Member
Регистрация: 19.04.2007
Сообщений: 2,393
Бабло: $314345
|
Цитата:
Сообщение от Chin
DimaX прав, gcc тоже.
|
Ну, я ответил так, как это по идее должно быть согласно стандарту, принятому для robots.txt
А то, что гуглобот, мягко говоря, забивает на все эти стандарты (как и яхубот слурп в некоторых случаях), это уже отдельная тема
|
|
|
10.02.2009, 14:14
|
#9
|
Дохуя дорвейщик
Регистрация: 26.11.2008
Сообщений: 898
Бабло: $55079
|
robots.txt
Подскажите корректное содержимое сабжа для доров, чтобы оставить доступ только для гугла, мсн и яхи, но так, чтобы при этом яха не шибко усердствовал при индексации, а-то он мне апач с копыт срывает, второй раз за сутки уже, сука такая
__________________
If you can dream - and not make dreams your master
|
|
|
10.02.2009, 14:33
|
#10
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,230
Бабло: $247845881
|
Запрещать доступ надо через .htaccess
|
|
|
|