Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Разное > Реклама и анонсы партнерок и сервисов
Дата
USD/RUB58.8010
BTC/USD0.0000
Реклама и анонсы партнерок и сервисов Анонсы партнерских программ и реклама полезных сервисов.

Закрытая тема
Опции темы Опции просмотра
Старый 09.12.2009, 19:33   #1
CyberScript
Супер кодер
 
Аватар для CyberScript
 
Регистрация: 23.08.2008
Сообщений: 27
Бабло: $5925
Отправить сообщение для CyberScript с помощью ICQ Отправить сообщение для CyberScript с помощью Skype™
Exclamation Продаю: Универсальный парсер контента AI-Parser

Продаётся универсальный парсер контента AI-Parser.

Сайт программы (временный): http://ai-parser.narod.ru/index.html (на сайте, кроме подробного описания, есть примеры отпарсенных статей и видео, демонстрирующее работу скрипта).

Возможности парсера (вкратце):
1. Интеллектуальный парсинг, скрипты не привязаны к конкретным шаблонам сайта, парсинг возможен на большинстве сайтов. Парсер сам определяет статью на страничке сайта.
2. Сохранение статей в txt-файлы без HTML-тегов.
3. Многопоточное сканирование (что существенно увеличивает скорость процесса).
4. Сканирование одновременно нескольких сайтов.
5. Сохранение статей в нужной кодировке.
6. Встроенный синонимайзер + БОНУС: база синонимов для более чем 10 000 слов (сам собирал).
7. Обработка куки от сервера.
8. Возможность работы через прокси-сервер.
9. Возможность остановки с последующим продолжением сканирования с момента остановки.
10. Динамический вывод статистики сканирования в окно браузера.
11. Просмотр результатов сканирования через браузер.
12. Скачивание результатов в виде ZIP-архива.
13. Управление видом сохраняемых статей и имени файла (можно задать любой шаблон под свои нужды).
14. Многое другое...

Цена парсера соответствует цене примерно 4-5 парсерам, заточенным под конкретные сайты (шаблоны). Если Вам необходимо много контента с разных сайтов, Вы получите колосальную экономию денег и времени (не придётся для каждого нового сайта искать программиста для написания парсера и обсуждать с ним задачу).

Текущая версия парсера: AI-Parser (v1.6)

Разработчик: CyberScript
Цена: 190$
Связь ICQ: 6901159 (в сети бываю не всегда, пишите в оффлайн)

Новые версии и обновления парсера бесплатны. При покупки могу провести модернизацию парсера под Вашу задачу бесплатно (если модернизация не очень крупная), возможны и дальнейшие модернизации под Ваши требования (цена обговаривается отдельно).

Перед покупкой парсера можете протестировать его работу и принять решение, подходит он под Ваши задачи или нет.

P.S.

Бесплатно могу предоставить тестирование скипта за отзыв, но не передачу. Можете пропарсить несколько сайтов и забрать себе статьи.

Последний раз редактировалось CyberScript; 18.12.2009 в 15:47.
CyberScript вне форума  
Старый 10.12.2009, 11:04   #2
JMen
учу php
 
Регистрация: 04.04.2008
Сообщений: 1,163
Бабло: $68290
По умолчанию

Я могу сразу сказать узкие места.

Раз ты сам определяешь текст - значит парсер возможно применить только сбора текста. Т.е. ты берёшь самый большой абзац на странице и отдаёшь его, в лучшем случае склеиваешь. В результате получается бяка. Нужно добавить возможность вынимания полей + обработку страниц по регэкспам. Так - же возможность игнорировать урлы по регэкспам.
__________________
Подпись??? Не продам!
JMen вне форума  
Старый 10.12.2009, 15:55   #3
CyberScript
Супер кодер
 
Аватар для CyberScript
 
Регистрация: 23.08.2008
Сообщений: 27
Бабло: $5925
ТС -->
Отправить сообщение для CyberScript с помощью ICQ Отправить сообщение для CyberScript с помощью Skype™
автор темы ТС По умолчанию

Цитата:
В результате получается бяка.
Где Вы увидели бяку, в приведенном видео или в примере напарсенных статей, покажите?
Регулярки подходят для парсинга конкретных сайтов, не будут же люди для каждого сайта сами писать регулярки? Более того, многие сайты регулярками спарсить вообще не возможно или крайне сложно.
CyberScript вне форума  
Старый 10.12.2009, 15:59   #4
reality
Senior Member
 
Регистрация: 07.04.2007
Сообщений: 172
Бабло: $8600
Отправить сообщение для reality с помощью ICQ
По умолчанию

Сделай форму, куда вводишь адрес страницы, а на выходе получаешь текст, чтобы можно было посмотреть как оно работает.
reality вне форума  
Старый 10.12.2009, 16:03   #5
CyberScript
Супер кодер
 
Аватар для CyberScript
 
Регистрация: 23.08.2008
Сообщений: 27
Бабло: $5925
ТС -->
Отправить сообщение для CyberScript с помощью ICQ Отправить сообщение для CyberScript с помощью Skype™
автор темы ТС По умолчанию

reality
Все гораздо проще, я могу предоставить доступ к парсеру на своем сайте, сможете оценить при желании.
CyberScript вне форума  
Старый 10.12.2009, 17:21   #6
JMen
учу php
 
Регистрация: 04.04.2008
Сообщений: 1,163
Бабло: $68290
По умолчанию

Цитата:
Сообщение от CyberScript Посмотреть сообщение
Где Вы увидели бяку, в приведенном видео или в примере напарсенных статей, покажите?
Регулярки подходят для парсинга конкретных сайтов, не будут же люди для каждого сайта сами писать регулярки? Более того, многие сайты регулярками спарсить вообще не возможно или крайне сложно.
Регулярками можно спарсить всё. Бяка в алгоритме работы, он даёт размах, но не даёт качества.
__________________
Подпись??? Не продам!
JMen вне форума  
Старый 10.12.2009, 18:06   #7
CyberScript
Супер кодер
 
Аватар для CyberScript
 
Регистрация: 23.08.2008
Сообщений: 27
Бабло: $5925
ТС -->
Отправить сообщение для CyberScript с помощью ICQ Отправить сообщение для CyberScript с помощью Skype™
автор темы ТС По умолчанию

Цитата:
Сообщение от JMen
Регулярками можно спарсить всё.
Приведите свою регулярку для того, что бы спарсить, например, этот сайт: www.med2000.ru/ (только статьи).
Цитата:
Сообщение от JMen
Бяка в алгоритме работы, он даёт размах, но не даёт качества.
Вы говорите с такой уверенностью, это при том, что Вы даже не знаете, какой алгоритм там используется...
CyberScript вне форума  
Старый 10.12.2009, 18:47   #8
JMen
учу php
 
Регистрация: 04.04.2008
Сообщений: 1,163
Бабло: $68290
По умолчанию

Опиши трудность (загвоздку) и приведи пример регэкспа который ты составил, но он не позволяет тебе сграбить тот сайт. Я тебе подскажу что ты делаешь не так.

Я представляю что вы могли придумать, потому как вариантов по сути не много. Вы либо ищите самый длинный абзац либо ищите длинные абзацы и их клеите. Затем очищаете от мусора. Опять - же если я не прав - опишите алгоритм. Ценности он никакой не имеет.
__________________
Подпись??? Не продам!
JMen вне форума  
Старый 10.12.2009, 21:18   #9
JMen
учу php
 
Регистрация: 04.04.2008
Сообщений: 1,163
Бабло: $68290
По умолчанию

private message from CyberScript
Цитата:
Не хочу больше тему засорять.
Вы ведете себя как троль, оно вам надо?
Quote:
Опиши трудность (загвоздку) и приведи пример регэкспа который ты составил, но он не позволяет тебе сграбить тот сайт. Я тебе подскажу что ты делаешь не так.
Какие трудности и какую мою регэкспу? Я вас попросил сделать регулярку под тот сайт. у меня нет под него регулярки, да мне она и не нужна, т.к. парсер парсит тот сайт целиком все статьи и без мусора.
Так вы можете сделать регулярку, что бы спарсить все статьи с этого сайта или нет?
Мне безразлично (я бы даже сказал больше, но мат это не хорошо) что вы думаете о моём поведении, я высказываю своё мнение о вашем софте. Не хотите высказывания - попросите администрацию закрыть ветку. Думаю что моё поведение достаточно корректно, если вы продаёте ерунду за 200 баксов, почему я должен вам поддакивать? Да... и прежде чем употребить какое - то слово по отношению к кому - то надо 10 раз подумать, а уместно ли это.

Ваши просьбы мне так - же безразличны как и вы. Если у вас есть проблема с написанием регэкспа под тот сайт - пишите в чём она, опишите что вы сделали и в чём затык, я вам помогу. Писать за вас я не намерен.

Возможно ваш парсер спарсит тот сайт целиком, но есть много других сайтов, в которых текст разделён на элементы. Применяя ваш алгоритм невозможно такие сайты корректно спарсить. Ни один из увиденных мной парсеров построенных на вашем алгоритме не мог корректно выкачивать информацию со ВСЕХ сайтов, это можно сделать лишь с помощью регэкспов. Более того, применяя ваш алгоритм НЕВОЗМОЖНО получить такую необходимую информацию как Заголовок (title) статьи и многое другое.

Помогу - приватно, а наезжать на меня в привате нефиг.
__________________
Подпись??? Не продам!
JMen вне форума  
Старый 10.12.2009, 22:43   #10
CyberScript
Супер кодер
 
Аватар для CyberScript
 
Регистрация: 23.08.2008
Сообщений: 27
Бабло: $5925
ТС -->
Отправить сообщение для CyberScript с помощью ICQ Отправить сообщение для CyberScript с помощью Skype™
автор темы ТС По умолчанию

Цитата:
Сообщение от JMen
я высказываю своё мнение о вашем софте
Какие может быть Ваше мнение, если Вы понятия не имеете, как работает данный парсер? На счет мата Вы загнули, в моём сообщении нет мата, более того, я с Вами на "Вы" (даже в ЛС), а Вы по непонятным причинам перешли на "ты" с незнакомым Вам человеком.

Цитата:
Сообщение от JMen
Ни один из увиденных мной парсеров построенных на вашем алгоритме не мог корректно выкачивать информацию со ВСЕХ сайтов, это можно сделать лишь с помощью регэкспов.
Ещё раз: Вам не известен алгоритм работы данного парсера. Вы сами для себя его придумали, и теперь говорите так, будто бы Вы сами его писали.

Цитата:
Сообщение от JMen
Более того, применяя ваш алгоритм НЕВОЗМОЖНО получить такую необходимую информацию как Заголовок (title) статьи и многое другое.
Что можно получить и в каком виде оно получается, подробно описано на сайте. Так что каждый сам может принять решение, устраивает его выдаваемый парсером результат или нет.

Цитата:
Сообщение от JMen
Помогу - приватно, а наезжать на меня в привате нефиг.
Забавно, чем Вы хотите мне помочь? Я у Вас не просил помощь.

Вернёмся немного назад, Вы говорите:

Цитата:
Сообщение от JMen
Регулярками можно спарсить всё.
Я Вам привёл пример сайта, покажите Вашу регулярку, что бы спарсить статьи с того сайта.
Вы же (по непонятной мне причине) подумали, что я пытаюсь сделать регулярку для этого сайта и прошу Вашей помощи. Мне не нужна эта регулярка, т.к. AI-Parser без проблем берёт тот сайт. Ваш ответ не адекватен по отношению к моему вопросу, потому я сделал о Вас тот вывод, который указал в ЛС.

Так Вы можете или нет написать регулярку для того сайта? Если нет, то признайте, что не всё можно спарсить только регулярками.
CyberScript вне форума  
Закрытая тема



Опции темы
Опции просмотра