Google Brain - кто что думает? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Поисковые системы
Дата
USD/RUB89.2589
BTC/USD68674.6194
Поисковые системы Поисковая оптимизация под Google, Yahoo, Bing и т.д.

Закрытая тема
Опции темы Опции просмотра
Старый 28.09.2014, 05:08
Start Post: Google Brain - кто что думает? 
  #11
Narval
Member
 
Регистрация: 26.01.2014
Сообщений: 74
Бабло: $33398
По умолчанию

Google применил технологии Deep Learning для борьбы с поисковым спамом

18 сентября был опубликован патент Google на классификацию поискового спама «Классификация ресурсов с использованием самообучающейся сети» (Classifying Resources Using a Deep Network ). Об этом сообщает SEO-эксперт Билл Славски (Bill Slawski).

Запатентованная технология была изобретена разработчиками компании Цинчжоу Ван (Qingzhou Wang), Ю Лян(Yu Liang), Ке Ян (Ke Yang) и Кай Чэнь (Kai Chen).

Последние несколько лет лидер поиска был занят построением самообучающейся сети, известной как Google Brain.

Google Brain – неофициальное название исследовательского проекта Google, посвященного глубокому обучению (Deep Learning). В рамках этого проекта исследователи компании смогли создать примерную модель работы нейронов головного мозга – «нейрональную» самообучающуюся сеть, соединив 16,000 процессоров и подключив её к сети Интернет. Полученная система сумела самостоятельно обучиться распознавать образ котов.

Теперь компания использует эти технологии для идентификации поискового спама, что нашло выражение в разработке патента на его классификацию.

Патент описывает методы, которые включают:

прием входящей информации, содержащей множество характеристик ресурса, в котором каждая характеристика – это значение соответствующего атрибута ресурса;
обработку каждой характеристики, используя соответствующую функцию вложения для генерации одного или нескольких числовых значений;
обработку числовых значений, используя один или несколько нейронных сетевых уровней для создания альтернативного представления о характеристиках ресурса, в котором обработка значений с эластичными параметрами включает применение к ним одного или нескольких нелинейных преобразований;
обработку альтернативного представления входа с использованием классификатора для генерации соответствующей оценки для каждой категории в их заранее определенном наборе, где каждая из соответствующих оценок измеряет прогнозированную вероятность, что ресурс принадлежит к соответствующей категории.

«Предопределенный набор категорий» может включать категорию спама поисковых систем. Оценка категории (category score) для ресурса измеряет предсказанную вероятность, что ресурс является поисковым спамом.


Предопределенный набор категорий может включать в себя соответствующую категорию для каждого из множества типов поискового спама.

Оценки категорий могут быть использованы для:

определения, следует ли добавлять эти ресурсы в индекс поисковых систем;
генерирования и упорядочивания результатов поиска в ответ на поисковые запросы.

Самообучающаяся сеть может быть эффективно использована для классификации ресурсов в категории. Например, ресурсы могут быть классифицированы как являющиеся или не являющиеся спамом, как являющиеся одним из нескольких видов спама или как один из двух и больше типов ресурсов.

«Использование самообучающейся сети для классификации ресурсов по категориям может привести к тому, что поисковые системы будут способны лучше удовлетворить информационные потребности пользователей путем эффективного определения поискового спама и воздержания от предоставления поисковых результатов, определяющих такие ресурсы, пользователям. Или же они смогут предоставить поисковые результаты, которые идентифицируют ресурсы, принадлежащие к категориям, лучше соответствующим информационным потребностям пользователя» - поясняют разработчики в патенте.

Согласно патенту, эта система классификации ресурсов может типизировать ресурсы как «поисковый спам или не поисковый спам». Она не определяет детали веб-спама, но говорит о том, что может выделить его типичные виды, такие как:

контент-спам;
ресурсы, содержащие ссылочный спам;
ресурсы, использующие клоакинг;
и т.д.

Ресурсы на страницах сайта могут включать слова из контента сайта в символьной форме; URL-ы сайта; его тайтл; имя домена; категории или типы объектов, относящиеся к сайту; его возраст. Каждая из этих характеристик может быть использована для расчета вероятности того, что сайт является спам-ресурсом, и определения, индексировать его или понижать в выдаче.

Патент не предоставляет деталей относительно обучения и классификации характеристик в рамках модели машинного обучения, но ссылается на документ, который дает эту информацию: Large Scale Distributed Deep Networks.

Последний раз редактировалось Narval; 28.09.2014 в 05:14.
Narval вне форума  
Старый 29.09.2014, 15:04   #12
res1dent
Везучий ВМ
 
Аватар для res1dent
 
Регистрация: 21.08.2009
Сообщений: 1,493
Бабло: $239825
Отправить сообщение для res1dent с помощью Telegram
По умолчанию

А там ничего не сказано про отчисления в пенсионный фонд дорвейщиков ?
__________________
Не зная ни сна и ни отдыха, при лунном и солнечном свете, легко и просто качаю бабло в интернете
res1dent вне форума  
Старый 29.09.2014, 15:14   #13
dady
Senior Medved
 
Аватар для dady
 
Регистрация: 15.06.2008
Сообщений: 4,136
Бабло: $22479945
По умолчанию

Цитата:
Сообщение от res1dent Посмотреть сообщение
А там ничего не сказано про отчисления в пенсионный фонд дорвейщиков ?
Нет, но обещали устроить в ближайший завод
__________________
Аппрув США >91% и Европа >90% Сливай фарму на Pharmcash - получай хрустящий кэш! / Спонсор! Докажи, что твоя партнерка №1 / 2019
dady вне форума  
Старый 29.09.2014, 16:52   #14
Dadee
Шоколатье
 
Аватар для Dadee
 
Регистрация: 20.04.2007
Сообщений: 5,960
Бабло: $726105
По умолчанию

главное посоны - в таксисты не ходите.
а то гугл и оттуда выдавит, инфа 100%

Dadee вне форума  
Старый 29.09.2014, 20:02   #15
Cannabis Cup
Senior Member
 
Регистрация: 09.07.2014
Сообщений: 5,602
Бабло: $760725
По умолчанию

Думаю так, самое главное это, чтобы не загнулось ссылочное, о чем М. Каттс утверждал не так давно.
Ну и потом это конечно пироги, что собственно и является поисковым спамом. Чтобы эти 2 фактора жили.
Cannabis Cup вне форума  
Старый 03.10.2014, 14:58   #16
SoftMaster
я крут как root
 
Аватар для SoftMaster
 
Регистрация: 28.05.2012
Адрес: HTTPHEADER
Сообщений: 478
Бабло: $66080
По умолчанию

Кота они распознали наверно так же, как и лица?
__________________
TrueMed$ - ссылка для реги без инвайта конверт 1:1 USA, 1:3 Евро, 0% на выплаты.
SoftMaster вне форума  
Старый 03.10.2014, 15:07   #17
Dr.Gonzo
gofuckingoogle
 
Аватар для Dr.Gonzo
 
Регистрация: 28.08.2008
Адрес: 666
Сообщений: 9,412
Бабло: $1278665
По умолчанию

Цитата:
«нейрональную» самообучающуюся сеть, соединив 16,000 процессоров и подключив её к сети Интернет. Полученная система сумела самостоятельно обучиться распознавать образ котов.
Нужно попробовать позаливать на сайты пикчи котов
Dr.Gonzo вне форума  
Старый 13.11.2014, 18:33   #18
mirikas
Senior Member
 
Аватар для mirikas
 
Регистрация: 25.12.2008
Сообщений: 1,088
Бабло: $272735
По умолчанию

Цитата:
Сообщение от Dadee Посмотреть сообщение
главное посоны - в таксисты не ходите.
а то гугл и оттуда выдавит, инфа 100%

посмотрел видос понравилось, молодцы конечно они - двигают мир вперед
mirikas вне форума  
Старый 27.11.2014, 14:56   #19
scnutt
Ебланнед
 
Регистрация: 10.11.2014
Сообщений: 44
Бабло: $6940
По умолчанию

тоже глянул видео, молодцы, круто
scnutt вне форума  
Старый 28.11.2014, 11:29   #20
Skyworker
Senior Member
 
Регистрация: 25.12.2013
Сообщений: 6,549
Бабло: $785925
По умолчанию

Цитата:
Сообщение от SoftMaster Посмотреть сообщение
Кота они распознали наверно так же, как и лица?
Какик красивые у нее лица на столе!
__________________
Надежный и отзывчивый VPS хостинг для серьезных проектов
Проверенная годами пуш партнерка с ежедневными выплатами
Skyworker вне форума  
Старый 02.12.2014, 14:27   #21
scnutt
Ебланнед
 
Регистрация: 10.11.2014
Сообщений: 44
Бабло: $6940
По умолчанию

это точно, глаза невозможно оторвать
scnutt вне форума