Никто не задавался вопросом как лучше парсить запросы по доменным зонам?
Есть 2 варианта. Перебор всех зон для каждого запроса или перебор всех запросов для каждой зоны.
Наглядно это выглядит примерно так(знак "+" можно опускать, при парсинге роли не играет):
1 вариант
inurl:zapros1 +site:com
inurl:zapros1 +site:net
inurl:zapros1 +site:org
inurl:zapros2 +site:com
inurl:zapros2 +site:net
inurl:zapros2 +site:org
inurl:zapros3 +site:com
inurl:zapros3 +site:net
inurl:zapros3 +site:org
-----------------------------
2 вариант
inurl:zapros1 +site:com
inurl:zapros2 +site:com
inurl:zapros3 +site:com
inurl:zapros1 +site:net
inurl:zapros2 +site:net
inurl:zapros3 +site:net
inurl:zapros1 +site:org
inurl:zapros2 +site:org
inurl:zapros3 +site:org
Интересует именно то, как относится гугл к 1-му и 2-му способу. В каком больше вероятность бана. В 1-м способе идет подряд один и тот же запрос, меняются только доменные зоны (из может быть например 30, тогда 30 рад подряд один и тот же запрос). Во 2-м способе запросы грубо говоря рандомно отдаются гугле.
ЗЫ: А может при многопоточном парсинге, тем более через прокси, пофигу на все это?
Интересно ваше мнение.