с самим парсингом проблем быть не должно, врят ли там есть защита на JS или что-то подобное, что не обходится курлом. Надо прикинуться ботом или человеком, а если айпи забанят - с другого парсить или прокси использовать.
я, кстати, разработал целую систему парсинга цен конкурентов, которая помогает нам иметь всегда выгодные для покупателей цены, а конкуренты наверно сидят и охуевают
Там, в принципе, не сложно: cron + curl + regexp + система оповещения об отказах. И архитектура системы должна быть масштабируема по кол-ву конкурентских шопов.
Самое трудоемкое - это написать все эти regexp-правила, причем, зачастую приходилось их переписывать по несколько раз, т.к. не всегда написанный с первого раза паттерн учитывает все и работает всегда - для это и нужна система оповещения.