Чего бы интересного пропарсить из 9 млн. доменов? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB88.6852
BTC/USD68333.4256
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 18.06.2017, 05:54
Start Post: Чего бы интересного пропарсить из 9 млн. доменов? 
  #11
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
Question

Скачал морды 9млн доменов. Подскажите, что интересного оттуда можно выпарсить? Если кому-то что-то нужно, пишите, я могу пропарсить.
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 19.06.2017, 12:42   #12
Skyworker
Senior Member
 
Регистрация: 25.12.2013
Сообщений: 6,586
Бабло: $785925
По умолчанию

Цитата:
Сообщение от digg Посмотреть сообщение
теперь все эти домены на позиции в гугле по всем кеям пропарсить и сделать семраш с ахрефсом в одном ))
Регулярно парсить на кеи и сделать так свой Гугл
А если без шуток, то есть такие сервисы, которые до ТСа уже пропарсили гораздо больше доменов, да еще и по куче параметров.
__________________
Надежный и отзывчивый VPS хостинг для серьезных проектов
Проверенная годами пуш партнерка с ежедневными выплатами
Skyworker вне форума  
Старый 19.06.2017, 15:35   #13
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,051
Бабло: $1905990
Отправить сообщение для digg с помощью ICQ
По умолчанию

Цитата:
Сообщение от Skyworker Посмотреть сообщение
Цитата:
Сообщение от digg Посмотреть сообщение
теперь все эти домены на позиции в гугле по всем кеям пропарсить и сделать семраш с ахрефсом в одном ))
Регулярно парсить на кеи и сделать так свой Гугл
А если без шуток, то есть такие сервисы, которые до ТСа уже пропарсили гораздо больше доменов, да еще и по куче параметров.
а у тс-а будет бесплатный сервис
digg вне форума  
Старый 19.06.2017, 19:33   #14
kezz
околодорвеев
 
Аватар для kezz
 
Регистрация: 19.10.2009
Сообщений: 1,841
Бабло: $229513
По умолчанию

кто знает сервисы по определению тематики сайтов ?
ты ему список доменов, он тебе какой домен какой тематики
kezz вне форума  
Старый 19.06.2017, 20:32   #15
capturis
Senior Member
 
Аватар для capturis
 
Регистрация: 25.11.2013
Сообщений: 272
Бабло: $47245
Отправить сообщение для capturis с помощью Telegram Отправить сообщение для capturis с помощью Jabber
По умолчанию

Цитата:
Сообщение от kezz Посмотреть сообщение
кто знает сервисы по определению тематики сайтов ?
ты ему список доменов, он тебе какой домен какой тематики
http://zennolab.com/wiki/ru:context-recognizer
capturis вне форума  
Старый 21.06.2017, 12:28   #16
thoth666
Юниор
 
Регистрация: 07.08.2008
Сообщений: 5
Бабло: $840
По умолчанию

Что парсить:
- движок
- возможно, тематику, на основе текстов на сайте
- какие рекламные блоки установлены
- ссылки на другие домены
- насобирать текстов с морд, чтобы лепить дорвеи

дополнительно можно парсить
- данные хуиза (из них - контакты админов, иногда они есть)
- IP сервера

на такой бигдате можно поэкспериментировать с нейронной сетью, например, скормить контент в самоорганизующуюся карту, тогда данные можно кластеризовать и дальше как-то использовать (к, примеру, договариваться об обмене ссылками с сайтами определенного кластера и т.п.)

но 9 млн - это как-то мало вообще
если пройтись по мордам и пособирать линки, то из 9 млн получится гораздо больше доменов.

затем, можно насобирать брошенные домены (ссылки на которые есть, но они проэкспарились), и зарегать их

вообще, можно много чего с этим сделать, зависит от целей)
как-то парсил сопоставимый объем, даже где-то база валялась
запилил потом локальный поисковичок на эластике и через формы обратной связи (там, где они были), выцеплял вебмастеров
thoth666 вне форума  
Старый 21.06.2017, 12:43   #17
Олдфаг
Senior Member
 
Регистрация: 08.01.2016
Сообщений: 279
Бабло: $82515
По умолчанию

Цитата:
Сообщение от kezz Посмотреть сообщение
кто знает сервисы по определению тематики сайтов ?
ты ему список доменов, он тебе какой домен какой тематики
https://goo.gl/aw7tPJ
__________________
Купи-продай сайты, домены.
Лучший парсер чего угодно.
Олдфаг вне форума  
Старый 21.06.2017, 17:35   #18
TextSupplier
Senior Member
 
Регистрация: 28.09.2013
Сообщений: 511
Бабло: $74655
По умолчанию

Попробуй сделать спаилку для арбитражников. Но это не просто "попарсить". По ФБ не так много предложений и индексом слабенько, например.
TextSupplier вне форума  
Старый 21.06.2017, 23:25   #19
7make
Senior Member
 
Аватар для 7make
 
Регистрация: 02.07.2011
Сообщений: 746
Бабло: $196220
По умолчанию

Уже все спарсили за нас
грепай не хочу...
__________________
PharmCash - Лучшие условия и профит в фарме. Hold-0, Refunds-0, Commission–50%, CPU+500. Google нас любит! | Обучаю Монстр2 нужным вам каптчам
7make вне форума  
Старый 22.06.2017, 00:54   #20
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
автор темы ТС По умолчанию

Там не всё, а лишь некоторая часть интернета. Вот тут можно посмотреть, сколько страниц с каждого домена спарсено: http://urlsearch.commoncrawl.org/
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 11.07.2017, 23:43   #21
KongWeiLing
Senior Member
 
Аватар для KongWeiLing
 
Регистрация: 28.03.2011
Сообщений: 419
Бабло: $81005
По умолчанию

Хз, а-парсером такие объёмы морд дербаню за пару дней, даже прокси не нужны, даже не храню их. Бэки так бесполезно искать все самое интересное не на мордах. Идей что собирать ищи в апарсере) единственное чем ты можешь отличиться - это собирать и хранить историю изменения всего что сможешь парсить.
KongWeiLing вне форума  
Закрытая тема