Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Разное > Объявления о покупке/продаже товаров и услуг
Дата
USD/RUB58.8530
BTC/USD0.0000
Объявления о покупке/продаже товаров и услуг Также в этом разделе следует размещать и предложения о сотрудничестве.

Закрытая тема
Опции темы Опции просмотра
Старый 05.02.2014, 21:36   #1
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 879
Бабло: $177835
Отправить сообщение для lorien с помощью Skype™
По умолчанию Парсю сайты

Здравствуйте.

По прежнему парсю сайты. Много-много примеров парсинга данных, которые я лично сделал, можно посмотреть тут: http://datalab.io/project
Средняя цена за парсинг одного сайта в районе $200-300
Среднее время выполнения одного проекта: 1-7 дней
Если я взялся за проект, то вероятность его успешного завершения довольно высока, хотя бывают и осечки. Если что-то не вышло, то всегда возвращаю предоплату в полном объёме.

Также собираю идеи для парсинга баз для массовой продажи по цене до $100. Т.е. если вам нужны какие-то не слишком специфичные данные, кидайте идею, я парсю, вы получаете нужные данные по этой цене. Примеры таких идей: все фильмы с сайта kinopoisk, все фильмы с сайта imdb

skype: lorien.name
email: [email protected]

Последний раз редактировалось admin; 13.05.2015 в 12:51. Причина: по просьбе ТС
lorien вне форума  
Старый 13.02.2014, 23:35   #2
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 879
Бабло: $177835
ТС -->
Отправить сообщение для lorien с помощью Skype™
автор темы ТС По умолчанию

Решил потихоньку наполнять сайт готовыми базами данных, которые вы можете купить по небольшой цене.

Итак, русскоязычная база фильмов.

В базе содержится информация на русском языке о более чем 400 тысячах фильмов. Также вы получите архив с картинками - обложками фильмов. Размер архива 13 гигабайт. Сама база данных предоставляется в виде дампа mysql-базы данных. Для вашего удобства предоставляется тажке CSV-файл, которые вы можете импортировать в mysql-базу с помощью инструкции "LOAD DATA INFILE".

Описание полей таблицы:

* id - ID фильма на сайте kinopoisk.ru
* title - Название (русское или англ. если русского варианта нет)
* title_alt - Альтернативное название (например, на англ. языке)
* version - версия описания фильма (если на сайте-источники было несколько описаний этого фильма)
* movie_type - тип фильма (movie, mini-serial, serial, tv или video)
* movie_type_label - тип фильма в читаемом виде (фильм, мини-сериал, сериал, тв или видео)
* url - адрес фильма на сайте kinopoisk.ru
* year - год выпуска
* country - страна производства
* slogan - слоган
* director - режиссёр
* writer - сценарист
* producer - продюсер
* operator - оператор
* composer - композитор
* design - художник
* editor - монтажёр
* actor - актёр
* voice - дубляж
* genre - жанр
* budget - бюджет
* revenue_world - кассовые сборы в мире
* revenue_usa - кассовые сборы в США
* revenue_russia - кассовые сборы в России
* age_limit - возрастное ограничение
* mpaa_rating - рейтинг MPAA
* time - длительность в минутах
* release_world - дата релиза (впервые в мире)
* release_russia - дата релиза в России
* description - описание фильма
* imdb_rating - рейтинг imdb.com
* imdb_rating_count - количество голосов на imdb.com
* kinopoisk_rating - рейтинг kinopoisk.ru
* kinopoisk_rating_count - количество голосов на kinopoisk.ru
* cover_url - адрес обложки фильма
* cover_path - путь к файлу обложки фильма (архив прилагается)

Обратите внимание, в поляк actor (актёры) и voice (дубляж) указаны только самые значимые люди, учавствовавшие в фильме - поля не содержат полный список актёров и актёров дубляжа.

Страница базы данных в магазине: http://baze.org/database/moviedb-ru

Срез базы для 250 самых известных фильмов (картинки включены): http://baze.org/static/upload/moviedb_ru_demo.tar

Цена: $100
lorien вне форума  
Старый 14.02.2014, 00:29   #3
Hector
Статус кво
 
Аватар для Hector
 
Регистрация: 02.05.2008
Адрес: California
Сообщений: 11,256
Бабло: $1447920
Отправить сообщение для Hector с помощью ICQ
По умолчанию

Offtopic
__________________
----
Hector вне форума  
Старый 14.02.2014, 01:13   #4
Ower
ё
 
Аватар для Ower
 
Регистрация: 26.10.2011
Сообщений: 1,490
Бабло: $300250
По умолчанию

Offtopic
Ower вне форума  
Старый 14.02.2014, 07:02   #5
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 879
Бабло: $177835
ТС -->
Отправить сообщение для lorien с помощью Skype™
автор темы ТС По умолчанию

Думал. Если будут заявки от правообладателей, я не против убрать материалы с сайта. А так, заказы на парсинг, по сути, это сплошное нарушение прав правообладателей т.к. я сначала извлекаю данные, а потом их продаю.
lorien вне форума  
Старый 14.02.2014, 13:55   #6
adamant
KrebsonSecurity
 
Аватар для adamant
 
Регистрация: 15.05.2010
Адрес: в Зазеркалье
Сообщений: 1,597
Бабло: $416885
По умолчанию

Offtopic
adamant вне форума  
Старый 14.02.2014, 16:13   #7
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 8,000
Бабло: $1215470
Отправить сообщение для digg с помощью ICQ
По умолчанию

сколько будет стоить спарсить все категории этого сайта в xml для импорта а вордпресс под плагин woocommerce, чтоб сразу в шоп были добавлены все товары и посортированы по категориям, как на сайте доноре?
http://catalog6.obo-bettermann.com/c...teView&lang=uk
ну, и все фотки, чтоб были атачментами к каждому товару
в сумме тут около 72к товаров
digg вне форума  
Старый 14.02.2014, 19:31   #8
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 879
Бабло: $177835
ТС -->
Отправить сообщение для lorien с помощью Skype™
автор темы ТС По умолчанию

Я таким вообще не занимаюсь. Не делаю импорт в чужие движки. Как показала практика - это жуткий геморой. По сути, надо или специализироваться на конкретных движках или каждый раз изучать строение нового движка. Ни то, ни то мне особо не интересно.
lorien вне форума  
Старый 16.02.2014, 20:12   #9
lorien
Senior Member
 
Аватар для lorien
 
Регистрация: 18.05.2009
Сообщений: 879
Бабло: $177835
ТС -->
Отправить сообщение для lorien с помощью Skype™
автор темы ТС По умолчанию

Так, добавил ещё одну базу. В базе 123 тысячи записей. Цена $15.

http://baze.org/database/yandex-catalog
Цитата:
База содержит параметры сайтов, зерегистрированных в яндекс-каталоге.

База состоит из следующих полей:
* Домен
* Ссылка
* Категории, например: Развлечения / Игры / Ролевые игры и стратегии
* Категории ID, например: Entertainment/Games/Strategies
* Название
* Описание
* Скриншот
* Почтовый адрес
* Телефон
* ТиЦ
* Регион, например: (Москва)
* Регион ID, например: Russia/Central/Moscow_District/Moscow
* Тип сайта (pda, watch, listen, download, play, widget)

Один сайт может находиться в нескольки категория, в таком случае поле Категории будет содержать все категории сайта, разделённые знаком "|". Это же верно и для поля Тип сайта.

Купив базу, вы получите архив с Excel и CSV файлами (в двух форматах для удобства).
Также сейчас изучаю парсинг амазона. Если кому нужны списки товаров в виде (название, ID, цена, ссылка на картинку, категория). Обращайтесь: мильон таких записей из нужной вам категории за $10 Пример: http://lorien.name/static/pub/product.csv
lorien вне форума  
Старый 16.02.2014, 21:09   #10
DIe$el
www.king-servers.com
 
Регистрация: 03.04.2007
Сообщений: 1,021
Бабло: $148870
Отправить сообщение для DIe$el с помощью ICQ
По умолчанию

2гис есть? нужно выдернуть телефоны по городу
__________________
Аренда Dedicated servers и VDS - Hosting for you
DIe$el вне форума  
Закрытая тема



Опции темы
Опции просмотра