Как реализовать свою Поисковую Систему? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB89.7026
BTC/USD68412.8144
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 03.02.2016, 13:45
Start Post: Как реализовать свою Поисковую Систему? 
  #11
Anomaly
Senior Member
 
Аватар для Anomaly
 
Регистрация: 17.02.2015
Сообщений: 339
Бабло: $65265
Question

Здравствуйте, нужно организовать свою собственную поисковую систему, которая будет индексировать строго заданные сайты. Посоветуйте качественный движок, на котором это можно реализовать?

Спасибо
Anomaly вне форума  
Старый 04.02.2016, 16:43   #12
Anomaly
Senior Member
 
Аватар для Anomaly
 
Регистрация: 17.02.2015
Сообщений: 339
Бабло: $65265
ТС -->
автор темы ТС Question

Цитата:
Сообщение от smsupport Посмотреть сообщение
Есть еще всякие децентрализованные поисковые движки, peer-to-peer. Минимум ресурсов, максимум производительности.
где? я вообще нашел эти два:
http://www.inoutscripts.com/demo/ino...h-engine/demo/
http://www.azizisearch.com/demo
думал идеально подойдут, но программисты сказали что они индексируют только собственные базы хотя написано - Google Clone
Anomaly вне форума  
Старый 04.02.2016, 16:46   #13
smsupport
Senior Member
 
Аватар для smsupport
 
Регистрация: 12.07.2009
Сообщений: 1,581
Бабло: $361075
По умолчанию

Цитата:
Сообщение от Anomaly Посмотреть сообщение
где? я вообще нашел эти два:
http://www.inoutscripts.com/demo/ino...h-engine/demo/
http://www.azizisearch.com/demo
думал идеально подойдут, но программисты сказали что они индексируют только собственные базы хотя написано - Google Clone
гугл поможет
__________________
Swissdoc heavy spec
smsupport вне форума  
Старый 05.02.2016, 01:43   #14
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,048
Бабло: $1905690
Отправить сообщение для digg с помощью ICQ
По умолчанию

Цитата:
Сообщение от Anomaly Посмотреть сообщение
кто именно? Scrappy?
ну я бегло глянул на код, увидел это
PHP код:
response.css('ul li a::attr("href")').re(r'.*/\d\d\d\d/\d\d/$'
и хуй сразу повис исходя из личного опыта парсинга всяких сразношерстных сайтов
digg вне форума  
Старый 05.02.2016, 12:50   #15
seorevenue
Ебланнед
 
Регистрация: 03.02.2016
Сообщений: 1
Бабло: $1335
По умолчанию

http://www.makeuseof.com/tag/open-so...ming-projects/
а так же моугт помочь www.krugle.org, www.merobase.com, opengrok.github.io/OpenGrok/
seorevenue вне форума  
Старый 11.02.2016, 01:32   #16
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,362
Бабло: $470735
По умолчанию

Цитата:
Сообщение от digg
сразу повис исходя из личного опыта парсинга всяких сразношерстных сайтов
чини html и строй dom, тогда и стоять будет

книжка про то, как в теории работают поисковики: http://nlp.stanford.edu/IR-book/
на практике реализации отличаются плюс/минус, но это не отменяет полезность этой книжки
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 20.02.2016, 00:30   #17
cafen
Юниор
 
Регистрация: 17.02.2016
Сообщений: 1
Бабло: $1170
По умолчанию

Занимался в свое время поисковыми системами, понравился больше всего проект на основе datapark. Проект до сих пор жив, только вот базы давно не обновлял. Легко справился с несколькими регионами России. Было в планах весь рунет охватить, но пока забросил эту идею, т.к. нужны сервера, много серверов, а денег нету на развитие. Если нужно, помогу настроить, есть опыт. Не знаю можно ли ссылку оставить в первом сообщении, вот что получилось у меня http://botmy.com
cafen вне форума  
Старый 20.02.2016, 02:35   #18
sliderxxx
Ебланнед
 
Регистрация: 20.08.2008
Сообщений: 1,067
Бабло: $153400
По умолчанию

ТС, ты бы хоть написал какой ЯП. И вообще писать собрался или готовое юзать. А то получается ...принеси то, не знаю что.

Сам сейчас вот с этим разбираюсь - https://github.com/PuerkitoBio/fetchbot
sliderxxx вне форума  
Старый 22.02.2016, 16:04   #19
SANches
Member
 
Регистрация: 22.10.2015
Сообщений: 65
Бабло: $8560
По умолчанию

Цитата:
Сообщение от Anomaly Посмотреть сообщение
которая будет индексировать строго заданные сайты
а какие именно сайты?
SANches вне форума  
Старый 23.02.2016, 06:48   #20
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
По умолчанию

Если сайтов небольшое количество, то, возможно, есть смысл написать свой парсер для каждого сайта т.к. в разработке универсального паука можно наступить на множество граблей.
__________________
TgScan - узнай Telegram группы, в которых состоит человек
lorien вне форума  
Старый 25.02.2016, 14:03   #21
Zherebets
Юниор
 
Регистрация: 12.09.2012
Сообщений: 13
Бабло: $6095
По умолчанию

Elasticsearch (elastic.co)
Zherebets вне форума