Google хочет измерять важность сайтов по фактам, а не по ссылкам. - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Поисковые системы
Дата
USD/RUB93.7196
BTC/USD63635.0981
Поисковые системы Поисковая оптимизация под Google, Yahoo, Bing и т.д.

Закрытая тема
Опции темы Опции просмотра
Старый 02.03.2015, 14:30   #1
maxidrom11
Senior Member
 
Аватар для maxidrom11
 
Регистрация: 22.09.2007
Сообщений: 682
Бабло: $133145
Arrow Google хочет измерять важность сайтов по фактам, а не по ссылкам.

Исследовательская команда Google опубликовала на arXiv.org статью "Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources", в которой рассматривается вопрос вычисления для определённой веб-страницы специальной репутационной характеристики Knowledge-Based Trust (KBT). Планируется, что KBT должна стать основой для будущего алгоритма поисковой машины Google, выстраивающей сайты в соответствии с их «надёжностью».

Известно, что алгоритм ссылочного ранжирования PageRank определяет важность веб-страницы как число ссылок, ведущих на неё. Реальный поиск Google учитывает ещё множество факторов, таких как наличие определённых слов на страницах сайтов, актуальность информации, местоположение пользователя, адаптивность к мобильным устройствам — всего таких факторов около 200. Считается, что обновление поискового алгоритма в сентябре 2013 года, известное как «Колибри» (Hummingbird), научило Google реагировать не только на ключевые слова, а и на контексты и образы, их сопровождающие. Прошлогоднее обновление алгоритма «Голубь» (Pigeon) привело к более релевантным результатам поиска с географически зависимой информацией.

Новый подход к ранжированию сайтов рассматривает важность веб-страницы как числовую характеристику достоверности фактов. Как и раньше, поисковый робот сканирует сайт, извлекает из него «утверждения», достоверность которых сравнивается с базой знаний Knowledge Vault. Эта база знаний, принадлежащая Google, сейчас содержит примерно 1.6 миллиарда фактов, автоматически собранных из интернета. Её главное отличие от более известной Knowledge Graph заключается в её «всеядности». Если Knowledge Graph использует в качестве источника информации заведомо надёжные Wikipedia и Freebase, то Vault «не брезгует» ничем и собирает информацию с абсолютно всех сайтов, из которых можно извлечь хотя бы что-то. На основе числа совпадений «извлечённых» фактов с хранящимися в Google Vault, и определяется достоверность ресурса.

На тестовых данных вероятностная модель, предложенная авторами работы, показала удовлетворительные результаты. Затем в автоматическом режиме были вычислены показатели KBT для 119 миллионов реальных веб-страниц. Дальнейшая проверка в ручном режиме показала, что и реальные данные вполне поддаются новой системе ранжирования. Как скоро результаты исследования затронут существующий поисковый алгоритм Google пока что неизвестно.
__________________
ФАРМА 40% Живи без анализов 36$в год (твоя РоскомСвобода)
maxidrom11 вне форума  
Старый 02.03.2015, 14:54   #2
Neovin
Senior Member
 
Аватар для Neovin
 
Регистрация: 20.05.2010
Сообщений: 450
Бабло: $98335
По умолчанию

Цитата:
использует в качестве источника информации заведомо надёжные Wikipedia и Freebase
Это Википедия надежная? Видел исследование касающееся медицинских статей. Так там 80% статей по медицине содержат недостоверную информацию.
Neovin вне форума  
Старый 02.03.2015, 15:16   #3
drunkard
Ебланнед
 
Регистрация: 26.02.2014
Сообщений: 138
Бабло: $26725
По умолчанию

чесно говоря вообще не понял как они это свой KBT считать собрались, тёмное дело.
drunkard вне форума  
Старый 02.03.2015, 15:47   #4
kibnet
Senior Member
 
Аватар для kibnet
 
Регистрация: 11.03.2012
Сообщений: 586
Бабло: $128055
По умолчанию

ну так это, берем факты из их баз, спамим фактами на своих страницах, вот, теперь мы трастовые, важные и самое главное НАДЕЖНЫЕ )
__________________
Автоматизирую с помощью BAS (не пишу скрипты на заказ)
rucaptcha.com - разгадает всё
kibnet вне форума  
Старый 02.03.2015, 17:07   #5
Cannabis Cup
Senior Member
 
Регистрация: 09.07.2014
Сообщений: 5,611
Бабло: $760670
По умолчанию

Заебал он сука, они же там какой то гугл брейн ввести пытались Не фартануло или чо?
Cannabis Cup вне форума  
Старый 02.03.2015, 17:19   #6
reed
Senior Member
 
Аватар для reed
 
Регистрация: 25.03.2014
Сообщений: 1,130
Бабло: $154385
По умолчанию

Offtopic
reed вне форума  
Старый 03.03.2015, 15:58   #7
Neovin
Senior Member
 
Аватар для Neovin
 
Регистрация: 20.05.2010
Сообщений: 450
Бабло: $98335
По умолчанию

Это же какой простор для цензуры появляется: не совпадает с тем, что в официальном списке - пиздуй на 100 позицию.
Neovin вне форума  
Старый 04.03.2015, 00:02   #8
inkubus
Senior Member
 
Аватар для inkubus
 
Регистрация: 11.02.2010
Сообщений: 928
Бабло: $176835
По умолчанию

http://www.freebase.com/

2,716,894,372
Facts
(and counting)
inkubus вне форума  
Старый 04.03.2015, 03:29   #9
Cttr
Senior Member
 
Аватар для Cttr
 
Регистрация: 23.05.2014
Сообщений: 162
Бабло: $26920
По умолчанию

Your client does not have permission to get URL /music from this server. That’s all we know.
Cttr вне форума  
Старый 04.03.2015, 04:51   #10
Dadee
Шоколатье
 
Аватар для Dadee
 
Регистрация: 20.04.2007
Сообщений: 5,973
Бабло: $726105
По умолчанию

то есть раньше парсили кейворды, теперь будем парсить факты по таблеткам и постить в столбик?
халява какая-то
P.S. глянул че в фрибейс пишут про силденафил, бля тупо все названия этих таблеток в столбик ебануть - вот тебе и факты.
очень ждем этот алго
Dadee вне форума