|
| Дата |
|
USD/RUB | 88.6852 | BTC/USD | 68446.3164 |
|
|
|
Объявления о покупке/продаже товаров и услуг Также в этом разделе следует размещать и предложения о сотрудничестве. |
17.06.2014, 18:11
|
Start Post: KeyDB - база русскоязычных поисковых запросов
|
Senior Member
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
|
Всем привет.
Я сделал веб-интерфейс к базе русскоязычных поисковых запросов - http://keydb.ru. Саму базу я напарсил с открытых отчётов в сервисе top.mail.ru. На данный момент в базе находятся запросы за май 2014 - всего 60 миллионов запросов.
Если кто-то хочет потестить сервис, пишите сюда или в ЛС, я вам в ЛС скину ссылку на регистрацию.
Буду рад вопросам, отзывам, предложениям.
__________________
TgScan - узнай Telegram группы, в которых состоит человек
|
|
|
18.06.2014, 14:16
|
#12
|
Senior Member
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
|
ТС
Всем скинул
__________________
TgScan - узнай Telegram группы, в которых состоит человек
|
|
|
18.06.2014, 15:50
|
#13
|
ПОКАЙТЕСЬ!!! Ибо Грядет!
Регистрация: 27.05.2009
Сообщений: 596
Бабло: $100679
|
И мне бы
__________________
ПОКАЙТЕСЬ!!! Ибо Грядет!
|
|
|
18.06.2014, 16:32
|
#14
|
Senior Member
Регистрация: 23.04.2007
Сообщений: 2,118
Бабло: $337995
|
Прикольная база. По некоторым темам поисковых запросов не сильно много, на встретил такие, которые в гугло и яндекс базах не встречал.
По поводу интерфейса, осмелюсь внести две рекомендации по улучшению:
1. Поисковый движок выдает в результаты не только искомое слово, но и вариации его окончаний. То есть, когда я ищу все запросы со словом "лава", то на выходе получаю и "лав" (типа "лав радио"), и "лависс", и "лавить", и "лавия".
Чтоб такого избежать, предлагаю использовать уточнения в виде или кавычек вокруг поискового запроса, или квадратных скобок.
2. Было бы круто иметь возможноcть делать поиск с операторами + и -, где минус - это "невключать в список запросы с содержание слова после минуса".
|
|
|
18.06.2014, 17:01
|
#15
|
Member
Регистрация: 02.12.2012
Сообщений: 102
Бабло: $43025
|
присоединяюсь. ссылку бы)
|
|
|
18.06.2014, 17:38
|
#16
|
Senior Member
Регистрация: 26.10.2009
Сообщений: 597
Бабло: $127864
|
Тоже жду ссылочку
|
|
|
18.06.2014, 20:34
|
#17
|
Юниор
Регистрация: 13.06.2008
Сообщений: 4
Бабло: $1510
|
скинь и мне плс )
|
|
|
18.06.2014, 22:31
|
#18
|
Senior Member
Регистрация: 04.02.2008
Сообщений: 476
Бабло: $79900
|
сервис неплохой. не понравилось - выдает результаты слова с разными окончаниями, как писали выше. в принципе это все подчистилось руками. в будущем стоит доделать разные варианты, чтобы отсекать не нужные формы слов, особенно когда сервис станет платным
|
|
|
19.06.2014, 00:46
|
#19
|
Чупс
Регистрация: 20.04.2009
Сообщений: 173
Бабло: $56826
|
и мне ссылочку пожалуйста
__________________
|
|
|
19.06.2014, 06:47
|
#20
|
777
Регистрация: 21.09.2007
Сообщений: 1,406
Бабло: $304877
|
и мне скинь
|
|
|
19.06.2014, 09:00
|
#21
|
Senior Member
Регистрация: 18.05.2009
Сообщений: 928
Бабло: $196595
ТС -->
|
ТС
Всем отправил ссылку
Цитата:
Прикольная база. По некоторым темам поисковых запросов не сильно много, на встретил такие, которые в гугло и яндекс базах не встречал.
|
Там всего 60млн запросов сейчас, дальше больше могу залить, но для начала хочу отладить на этом количестве.
Цитата:
1. Поисковый движок выдает в результаты не только искомое слово, но и вариации его окончаний. То есть, когда я ищу все запросы со словом "лава", то на выходе получаю и "лав" (типа "лав радио"), и "лависс", и "лавить", и "лавия".
|
Цитата:
сервис неплохой. не понравилось - выдает результаты слова с разными окончаниями, как писали выше. в принципе это все подчистилось руками. в будущем стоит доделать разные варианты, чтобы отсекать не нужные формы слов, особенно когда сервис станет платным
|
Ага, понял.
Цитата:
2. Было бы круто иметь возможноcть делать поиск с операторами + и -, где минус - это "невключать в список запросы с содержание слова после минуса".
Чтоб такого избежать, предлагаю использовать уточнения в виде или кавычек вокруг поискового запроса, или квадратных скобок.
|
Минус можно сделать т.к. это означает фильтрацию полученного результата, который значительно меньше базы.
А вот насчёт плюса не уверен. Некоторые запросы могут выдавать очень много результатов, например, "скачать" выдаст 2 миллиона И такой запрос обрабатывается секунд 15-20 сейчас. А если человек введёт запрос типа "+скачать +купить" плюс ещё парочку мощных ключей, то запрос будет достаточно долго выполняться.
В принципе, можно обрезать любые результаты, например, выдавать максимум 500 тысяч по результату запросу или даже меньше. Или разрешить делать запросы с любым кол-вом результатов на более дорогих аккааунтах. Я тут даже не знаю, как быть.
__________________
TgScan - узнай Telegram группы, в которых состоит человек
|
|
|
|