Каталоги с описанием товаров где взять? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Общий раздел > Мысли, идеи и полезные статьи
Дата
USD/RUB88.6852
BTC/USD67751.1020
Мысли, идеи и полезные статьи Интересные статьи, а также креативные идеи в сфере онлайн бизнеса.

Закрытая тема
Опции темы Опции просмотра
Старый 15.09.2011, 13:00
Start Post: Каталоги с описанием товаров где взять? 
  #11
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,356
Бабло: $470735
По умолчанию

Ищу каталоги с большим кол-вом товаров и хорошим описанием, подробными характеристиками, и чем больше всяких фич - тем лучше.
Желательно чтобы был человеческий способ доступа к инфе, типа xml-фида, или другого апи. Вообще, распарсить то не проблема, но чем проще вариант, тем лучше.

Знаю что есть Amazon и там полно инструментов. А еще?
Надо что-нибудь на англ или мультиязычный, поэтому яндекс.маркет не катит
можно, конечно, все подряд шопы парсить, но это сколько времени надо


ps: это будут мои первые реальные шаги в датамайнинг, поддержи меня
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 15.09.2011, 19:58   #12
Cookie Monster
prospera
 
Аватар для Cookie Monster
 
Регистрация: 03.01.2009
Сообщений: 882
Бабло: $198348
По умолчанию

Цитата:
Сообщение от Reach Посмотреть сообщение
Откуда парсишь?
2 первоисточника + контрольный в гугл
Цитата:
Сообщение от chesser Посмотреть сообщение
цель: сделать пророчитель
у меня тоже
Cookie Monster вне форума  
Старый 15.09.2011, 20:28   #13
3Hell
Ебланнед
 
Регистрация: 12.09.2011
Сообщений: 74
Бабло: $9570
По умолчанию

Цитата:
Сообщение от chesser Посмотреть сообщение
Ладно, спалю, один хер всем срать

И главная моя цель: сделать пророчитель

Ты серьезно думаешь,что сможешь сделать нечто подобное?
А как же быть с принципом неопределенности Гейзенберга?
__________________
Войны нельзя избежать, её можно лишь отсрочить к выгоде вашего противника.
Ребиллы на страхе - работаем в команде
3Hell вне форума  
Старый 15.09.2011, 21:33   #14
citrix
конверчу-хуеверчу
 
Аватар для citrix
 
Регистрация: 16.09.2009
Сообщений: 605
Бабло: $103180
По умолчанию

Принцип неопределенности(а в народе-принцип менжуя) ставил под сомнение еще Эйнштейн, хотя действительно возникают сомнения насчет полезности полученной инфы, если брать ее как функции свойств от событий. Даже несмотря на то, что берется она с временной корреляцией, сложно утверждать, что именно рождаемость альбиносов повлияла на продажи 4 яблофона во втором квартале. Но даже все предыдущее можно поставить под сомнение, поэтому имхо
необходим фундаментальный подход при проектировании прорицателя, с выделением основных свойств/событий/факторов/etc иначе получится простой коллектор для статистического анализа, который ничего кроме циферей не даст.

update:
но при всем этом, дико хочется поглядеть на это все в красивых чартах.
citrix вне форума  
Старый 16.09.2011, 05:10   #15
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,356
Бабло: $470735
ТС -->
автор темы ТС По умолчанию

датамайнинг может и пока слишком громкое слово.
нужно набрать данные для многофакторного анализа, а дальше посмотрим как там что.

ресы еще давайте палите
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 16.09.2011, 05:22   #16
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,891
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

redis вроде в память проецируется полностью, не?
для товаров думаю хорошим решением будет MongoDB, товары разные, характеристики тоже, реляционные БД плохо подходят для такой информации.

матан нужно учить для датамайнинга, я подписан на группу в linkedln вникаю потихоньку.
http://www.membrana.ru/particle/16033 вот люди делают норм. штуки ) а так прикладных применений масса, от екоммерц до трейдботов.
__________________
www.imscraping.ninja
grablab.org | blog
WebNinja вне форума  
Старый 16.09.2011, 05:45   #17
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,356
Бабло: $470735
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от WebNinja Посмотреть сообщение
redis вроде в память проецируется полностью, не?
для товаров думаю хорошим решением будет MongoDB, товары разные, характеристики тоже, реляционные БД плохо подходят для такой информации.
в редисе два режима: RAM и виртуальная память, последняя жопа, но куда деваться.
Редис держит все в отведенной ему RAM, если кластер, то в рамах всего кластера. Но если в друг память заканчивается, то он сбрасывает не уместившиеся данные на диск. Причем, наименее используемые. Редис - это продвинутый(имхо) аналог мемкешеда, т.е. nosql key-value БД
MongoDB не видел, но читал, вроде норм. Но надо смотреть алгоритм использования и структуру данных. Редис пошустрее в любом случае, но функционала меньше

Цитата:
Сообщение от WebNinja Посмотреть сообщение
матан нужно учить для датамайнинга, я подписан на группу в linkedln вникаю потихоньку.
http://www.membrana.ru/particle/16033 вот люди делают норм. штуки ) а так прикладных применений масса, от екоммерц до трейдботов.
да я тоже в ней недели 3 уже, скачал несколько пдф книжек, почитываю - видел наверно, там они постили бесплатные.
+ у меня в универе вроде люди занимаются датамайнингом, надо сходить поспрашать че как, хочу развернуть свой диссер в этом направлении. У меня было "Автоматизация процессов объектно-ориентированной интеграции Интернет-ресурсов" - добавлю сюда побольше анализа и будет нормальный компот
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 17.09.2011, 14:14   #18
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,891
Бабло: $322264
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

Bing Liu
Web Data Mining

Exploring Hyperlinks,
Contents, and Usage Data

я вот читаю, скачал где-то на едухе.

http://www.cs.uic.edu/~liub/
http://www.cs.uic.edu/~liub/WebMiningBook.html
__________________
www.imscraping.ninja
grablab.org | blog
WebNinja вне форума  
Старый 17.09.2011, 14:36   #19
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,356
Бабло: $470735
ТС -->
автор темы ТС По умолчанию

я вот по этим "бегаю":
http://www.intechopen.com/subject/co...ce/data-mining
они более классические, без ориентации на веб

WebNinja, скинь в скайпе свои книжки, а?
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 17.09.2011, 16:50   #20
inferno[DGT]
Аццкий хостер
 
Аватар для inferno[DGT]
 
Регистрация: 02.05.2007
Сообщений: 2,976
Бабло: $1733930993
По умолчанию

А в чем смысл, если Google это сделает все равно быстрее, лучше и бесплатно -))
__________________
Inferno Solutions: Выделенные серверы и VPS с абсолютно бесплатным администрированием. Более 19 лет с вами. Любые конфигурации под заказ.
inferno[DGT] вне форума  
Старый 17.09.2011, 17:36   #21
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,356
Бабло: $470735
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от inferno[DGT] Посмотреть сообщение
А в чем смысл, если Google это сделает все равно быстрее, лучше и бесплатно -))
1) какой смысл делать сайты, если уже и так их полно? - но люди все равно делают ведь
2) откуда гуглу знать, что нужно именно мне?
3) датамайнинг - он более разнообразный, нежели собрать статистику с разных направлений и тупо ее скрестить, построить графики и тд. Тут тема более тонкая и многообразная.

Но вообще да, у гугла шикарные возможности для подобных вещей.

Я тут думал-думал(может лучше и не стоило этого делать) и пришел к выводу, что в будущем интернет может хорошо подхватить это направление. По сути, то что мы сейчас имеем в интернете это:
- большие хранилища информации (уже существующие и накопленные), можно назвать их статикой
- также есть динамика в виде коммуникативных потоков
- набор сервисов, основанных на статических данных и (реже) на динамических
Это все доступно и отлично работает. Но скоро мы достигнем(или уже) критической массы как статики, так и динамики, но развитие все равно будет, куда?

чего же не хватает? не хватает:
- _доступного_ глубокого анализа статич. и динамич. данных
- автоматизации этого анализа
- а также оптимизация
- также неплохо бы автоматизировать появление новых изобретений/открытие закономерностей и тд
датамайнинг тут поможет

почему его раньше не было и все молчали об этом? потому что ресурсы для анализа больших выборок были только у гос корпораций, а сейчас оно все более стремительно спускается до частников, включая мелкие группы.

Короче, кто быстрее укротит датамайнинг, тот победит

а конкретно товары парсить - я их уже 3 года паршу, просто хотел узнать может появилось что-то новенькое и датамайнинг тут больше как "попробовать". И вот с рынками цен поэкспериментировать вполне реально
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Закрытая тема