Продаю онлайн сервис - Форум успешных вебмастеров - GoFuckBiz.com - Страница 3
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Разное > Объявления о покупке/продаже товаров и услуг
Дата
USD/RUB88.4375
BTC/USD68098.4442
Объявления о покупке/продаже товаров и услуг Также в этом разделе следует размещать и предложения о сотрудничестве.

Закрытая тема
Опции темы Опции просмотра
Старый 05.03.2015, 17:40
Start Post: Продаю онлайн сервис 
  #21
pepper
Senior Member
 
Регистрация: 04.06.2008
Сообщений: 465
Бабло: $172376
По умолчанию

Всем привет.

Решил разобраться с некоторыми проектами, которые в данный момент не в приоритете.
В общем, неспешно продаю сервис для поиска сайтов по общим признакам.
Под признаками подразумевается:
  • id Google Adsense и Analytics
  • id счетчика liveinternet
  • домен статистики piwik
  • домен openx
  • id партнерки amazon
  • utm меткам
  • CMS
  • id соц. кнопок addthis
  • имена cookie
  • и др.

Из того, что нигде не встречал:
  • домен, с которого подгружается javascript, iframe
  • имена полей форм
  • редиректы с сайта/на сайт

Все признаки разбиты по группам:
  • Реклама - все, чем монетизируется сайт.
  • CMS,CMF и т.д. - системы управления сайтом, web платформы
  • Аналитика - системы статистики, аналитики и оценки конверсии
  • Технические параметры - виджеты различных серисов (vk, facebook, disqus, recaptcha и др.), наличие сайта в вебмастерских панелях google, yandex, bing и прочие элементы, относящиеся к функционированию сайта
  • Cookies - cookie, устанавливаемые сайтом при посещении
  • Элементы HTML - домен iframe, javascript и др.
  • Редиректы

Статистика признаков по группам:
  • Реклама - 551 рекламных элементов
  • CMS,CMF и т.д. - 94
  • Аналитика - 62
  • Технические параметры - 79
На каждый из признаков от 1 до нескольких паттернов для детекта (всего 1447 паттернов).
Например, для Google Analytics - 7 различных паттернов для поиска id аналитикса.
По piwik - 9, включая обфусцированные версии, когда домен получается в результате сложения строк 'piw' + 'ikdoma' + 'in.com'
и т.д.

Кроме результатов последней проверки можно смотреть историю. Данные по некоторым сайтам собираются с 2012.

Немного технических подробностей.
Web работает на фреймворке django.
Серверный бот первоначально был на python, но потом был переписан на golang, что дало 10x прирост скорости и смешном по сравнению с python потреблением памяти(так что, +1 к golang для своего серверного, сетевого софта).

Немного примеров, как можно использовать сервис кроме стандартного поиска по Google Analytics, Adsense и пр.
* Поиск лендингов.
Например, есть лендинг finkapro.ru. Вбиваем в поиск домен finkapro.ru и смотрим на имена полей форм.
email, name - эти имена слишком общие и могут встречаться в обычных формах. whatForm - а вот это имя более "уникальное". Кликаем по нему и получаем список сайтов (в данном случае лендингов), где это имя встречается.
* Часто вебмастера для удобного управления рекламой, слива трафика подгружают на страницы свой javascript код с домена-тдски. По данному домену можно найти остальные сайты/доры одного владельца.
* Поиск сайтов на wordpress, на joomla и пр.
* На сайтах, на которых стоит код тизернета, есть параметр обозначающий id площадки. Посмотрев этот id, можно отобрать нужные сайты для блеклиста/вайтлиста (не знаю как у тизернета устроена фильтрация, не покупал там траф). Пример 1 Пример 2 Пример 3

Контакты:
email,jabber: [email protected]
pepper вне форума  
Старый 10.03.2015, 14:08   #22
pepper
Senior Member
 
Регистрация: 04.06.2008
Сообщений: 465
Бабло: $172376
ТС -->
автор темы ТС По умолчанию

sellad, similarweb - отличный сервис, да. Но он же про трафик, где там можно искать по id или по наличию той или иной сети? Я что-то не нашел.

ps: тоже собирал первое время meta keywords с поиском по них, но потом решил проверить - какой только треш не пихают туда, выпилил этот функционал.

Последний раз редактировалось pepper; 10.03.2015 в 14:15.
pepper вне форума  
Старый 10.03.2015, 14:54   #23
W84me
Senior Member
 
Регистрация: 19.04.2008
Сообщений: 268
Бабло: $44680
По умолчанию

арамис делал такое года 3 назад, не пошло
абуз много было, насколько я помню. сейчас может все получше

а для аналитики такая штука весьма полезна, да.
удачи в продаже.
W84me вне форума  
Старый 10.03.2015, 15:20   #24
pepper
Senior Member
 
Регистрация: 04.06.2008
Сообщений: 465
Бабло: $172376
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от W84me Посмотреть сообщение
арамис делал такое года 3 назад, не пошло
абуз много было, насколько я помню. сейчас может все получше

а для аналитики такая штука весьма полезна, да.
удачи в продаже.
seoquaketeam - крутые перцы
Спасибо. Даже если ничего не сложится, то сервис все равно останется для персональной аналитики для меня и списка контактов из icq.
pepper вне форума  
Старый 10.03.2015, 20:09   #25
sellad
Senior Member
 
Регистрация: 20.02.2015
Сообщений: 296
Бабло: $40755
По умолчанию

pepper, у них есть similartech.com
__________________
куплю ваш трафик - связь лс
sellad вне форума  
Старый 12.03.2015, 14:46   #26
pepper
Senior Member
 
Регистрация: 04.06.2008
Сообщений: 465
Бабло: $172376
ТС -->
автор темы ТС По умолчанию

А про этот, ну тогда надо было старичка builtwith.com в пример приводить - он явно постарше будет.
И всё же, специфика у сервисов разная - искать сайты для выявления общего владельца(принадлежность к одной сетке) или аналитика технологий, используемым в данный момент в интернете. Хотя последнее в моем сервисе тоже можно делать.

Примеры:
сайты на вордпрессе http://idspy.net/search/wordpress,
или уже конкретно
сайты на wp 4.0 http://idspy.net/search/wordpress/?q=4.0

сайты с liveinternet http://idspy.net/search/liveinternet.ru/
или конкретно сетка кредитных сайтов с id Russia-Credit http://idspy.net/search/liveinternet...=Russia-Credit
(эту сетку еще можно найти через домен openx http://idspy.net/search/openx.com/?q...edit-rostov.ru)

К тому же, я сомневаюсь, что в этих сервисах есть поиск по домену, с которого подгружается iframe/javascript, по именам полей форм, или , например, по гемблинг-партнеркам:
affutd - http://idspy.net/search/affutd.com/
europartners - http://idspy.net/search/europartners.com/ (например, сайт http://idspy.net/domain/?q=01casinos.com)
ставки:
betfair - http://idspy.net/search/betfair.com/ (например, сайт http://idspy.net/domain/?q=100bonus.ru)
pepper вне форума  
Старый 21.07.2015, 16:25   #27
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 925
Бабло: $196595
По умолчанию

lxml течёт и gc не помогает.
Решение: строим DOM в отдельном процессе, периодически прибиваем процесс после построения пары сотен-тысячов DOMов.
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 14.12.2015, 18:28   #28
pepper
Senior Member
 
Регистрация: 04.06.2008
Сообщений: 465
Бабло: $172376
ТС -->
автор темы ТС По умолчанию

Актуально. У кого есть свежие списки доменов (не ru,su,рф) стучите - сделаю аккаунт с повышенными лимитами
pepper вне форума  
Старый 14.12.2015, 20:10   #29
redbul
Senior Member
 
Регистрация: 08.08.2008
Сообщений: 157
Бабло: $21455
По умолчанию

А прочто чекнуть на произвольный текст (код/регулярку) по всей базе можно?
redbul вне форума  
Старый 15.12.2015, 22:28   #30
pepper
Senior Member
 
Регистрация: 04.06.2008
Сообщений: 465
Бабло: $172376
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от redbul Посмотреть сообщение
А прочто чекнуть на произвольный текст (код/регулярку) по всей базе можно?
Такого нет. Хотя первоначально так и планировал на будущее, но много место занимают сорсы + индексы для них
pepper вне форума