Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB58.8620
BTC/USD0.0000
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 30.12.2013, 02:58   #1
El Tiburon
Senior Member
 
Регистрация: 22.05.2010
Сообщений: 486
Бабло: $146460
По умолчанию Провести частотный анализ сайта

Имеется ли готовое решение которое может:
1) выпарсить целиком сайт на 10-50к страниц
2) очистить текст от html тэгов
3) по всем страницам провести анализ частотности ключей (длиной от 1 до 5-6 слов). Инными словами - подсчитать сколько раз каждый ключ встречается в рамках всего сайта.

Первые 2 шага можно выполнить с помощью Зенки, но вот шаг 3 - вряд ли.
El Tiburon вне форума  
Старый 30.12.2013, 03:18   #2
spamless
Senior Member
 
Регистрация: 16.07.2009
Сообщений: 939
Бабло: $152432
По умолчанию

Готовых решений не видел, но решается задача в таком виде просто.
Есть нюансы, например, ключи могут встречаться в атрибутах html-тэгов, которые ты собираешься чистить, или текст с ключами может вставляться js, это тоже индексируется.
spamless вне форума