Почему PDF не так хороши для SEO? Как отслеживать просмотры PDF?
Впервые Google начал индексировать PDF-файлы в 2001 году. Данный формат обычно используется в правительственных документах, академических кругах и бизнес-среде.
Они работают практически на любом устройстве и всегда имеют одинаковый внешний вид. Однако, при создании нового контента, все же следует использовать обычные веб-страницы вместо PDF-файлов.
В данной статье мы рассмотрим:
- Как Google относится к PDF-файлам.
- Почему PDF не так хороши с точки зрения SEO.
- Как оптимизировать PDF-файлы.
- Как отслеживать просмотры PDF.
Как Google относится к PDF-файлам
В результатах поисковой выдачи Google PDF-файлы отображаются с тегом PDF.
PDF-документы индексируются как HTML. Для текстовых изображений, Google использует технологию оптического распознавания символов (OCR). Изображения в PDF также индексируются в результатах поиска по изображениям.
Если на сайте классическая веб-страница дублирует PDF-файл, то Google выберет веб-страницу. Именно она и будет отображаться в результатах поиска.
Почему PDF не так хороши с точки зрения SEO
Несмотря на то, что Google индексирует и ранжирует PDF-файлы, данный формат имеет несколько недостатков по сравнению с веб-страницами:
- Не адаптирован под мобильные устройства. PDF-файлы имеют одинаковый вид на всех устройствах. Это означает, что не существует такого понятия, как адаптация PDF под мобильные устройства.
- Отсутствует навигация. Большинство PDF-файлов не содержат элементов навигации, что затрудняет изучение других материалов.
- Отсутствуют некоторые SEO-элементы. PDF-файлы имеют эквивалентные версии многих SEO-элементов, но в то же время, отсутствуют некоторые атрибуты ссылок, такие как nofollow, UGC и sponsored.
- Редко сканируются. Поскольку PDF-файлы редко меняются, они, как правило, сканируются реже, чем страницы, которые обновляются чаще.
- Сложнее отслеживать. Большинство обычных трекеров запускают JavaScript на веб-странице и не работают в PDF-файлах.
Как оптимизировать PDF-файлы
В PDF также применяется большинство SEO-элементов, которые используются на страницах HTML. Рассмотрим несколько способов оптимизации PDF-файлов с точки зрения SEO:
- Качественный контент.
- Оптимизированный заголовок.
- Оптимизированное описание.
- Релевантное имя файла.
- Атрибуты изображений alt.
- Заголовки.
- Ссылки.
1. Качественный контент
Миссия компании Google заключается в организации мировой информации. Даже если это не веб-страница, хороший контент - это хороший контент. Можно увидеть много отличного контента в PDF-файлах, таких, как техническая документация и т. д.
2. Оптимизированный заголовок
Как и обычные страницы сайта, PDF-файлы также имеют теги title. Обратите внимание, что многие поисковые системы используют заголовок для описания документа в своих результатах выдачи. Если PDF-документ не имеет заголовка, то в поисковой выдаче будет отображаться название файла.
Вот как можно отредактировать заголовок PDF в Adobe Acrobat:
- Нажмите Файл> Свойства.
- Изменить поле заголовка.
3. Оптимизированное описание
Как и в случае метаописаний для веб-страниц, это не является фактором ранжирования, но дает возможность контролировать текст, который появляется в результатах выдачи.
- Нажмите Файл> Свойства.
- Нажмите «Дополнительные метаданные».
- Редактировать описание.
4. Релевантное имя файла
Имя PDF-файла будет частью URL. Это повлияет на URL, который будет отображаться в результатах поисковой выдачи, и является небольшим фактором ранжирования.
- Нажмите Файл> Сохранить как.
- Изменить имя файла.
5. Атрибуты alt для изображений
Чтобы помочь поисковикам понять содержание ваших изображений, можно добавить дополнительный текст к изображениям в вашем PDF.
- Нажмите значок «Теги» на левой боковой панели.
- Найдите изображение, для которого вы хотите добавить альтернативный текст в иерархию документов.
- Щелкните правой кнопкой мыши по изображению.
- Нажмите «Свойства».
- Добавьте альтернативный текст в соответствующее поле.
- Заголовки
Как и в обычных веб-страницах, так и в PDF-файлах можно указать, что определенный текст является заголовком (H1-H6).
- Нажмите значок «Теги» на левой боковой панели.
- Найдите текст, который вы хотите редактировать в иерархии документов.
- Щелкните правой кнопкой мыши по тегу.
- Нажмите «Свойства».
- Выберите соответствующий уровень заголовка из выпадающего списка.
7. Ссылки
Как и в случае с другими страницами, внутренние и внешние ссылки также участвуют в ранжировании PDF-файлов. Ссылки передают PageRank, а их якорный текст добавляет контекст. При добавлении ссылок на PDF-документ, увеличивается его PageRank. Некоторые PDF-файлы получают огромное количество ссылок. Ларри Пейдж однажды сказал: «Оказывается, люди, получившие Нобелевскую премию, цитируются в 10 000 разных газетах»
Посмотрите на документ с общим регламентом по защите данных (GDPR). Он имеет 119 тыс. обратных ссылок из 855 ссылающихся на него доменов. Но с него нет ни одной исходящей ссылки. Это упущенная возможность. Добавление нескольких внутренних ссылок из этого PDF-файла на другие страницы сайта повысит позиции данных страниц.
Вот другой пример из Google. Их PDF-руководство для начинающих SEO-специалистов имеет 3.5 тыс. обратных ссылок с 772 ссылающихся доменов, и они отлично справляются с передачей веса на другие страницы.
Чтобы добавить ссылки в PDF:
- Нажмите кнопку «Редактировать PDF» на правой боковой панели.
- Нажмите на раскрывающийся список «Ссылка» в меню «Правка».
- Нажмите «Добавить / изменить веб или ссылку на документ».
- Нарисуйте прямоугольник вокруг текста, для которого необходимо создать ссылку.
- Установите тип ссылки на «Невидимый прямоугольник»
- Установите галочку в соответствующем пункте, чтобы ссылка открывалась в новом окне.
- Добавьте URL.
ПРИМЕЧАНИЕ
Приведенные выше снимки экрана и инструкции относятся к Acrobat Pro DC и могут отличаться в зависимости от используемого программного обеспечения.
Как отслеживать просмотры PDF
Как упоминалось ранее, PDF-файлы сложнее отслеживать. Из-за этого многие вебмастера стремятся скрывать PDF-файлы или делать их доступными только после того, как пользователь заполнит специальную форму. Таким образом, смещается акцент с отслеживания трафика на лидогенерацию. Есть несколько вариантов для отслеживания PDF-файлов, в том числе:
Отслеживание событий
Вы можете отслеживать клики по ссылкам в формате PDF и отправлять их в свою аналитическую систему. Это позволяет увидеть, сколько раз люди нажимали на PDF-файлы, чтобы загрузить или открыть их.
Встраивание
Если вы встраиваете PDF в страницу, используя JavaScript или iframe, вы можете просто использовать данные аналитики для самой страницы.
Скрипт промежуточного отслеживания
Это сложное решение, но можно отправлять PDF-клики через промежуточный скрипт отслеживания, который отправляет данные в аналитику, до того как перенаправить посетителей в PDF.
Логи сервера
Поскольку PDF-файлы хранятся на сервере, любые запросы на доступ к файлам будут записываться в логи сервера.
Данные из других источников
Поскольку PDF-файлы редко отслеживаются в аналитических системах, иногда лучше получить данные из других источников. К примеру, Google Search Console может предоставить данные о том, какие PDF-документы ваших конкурентов получают больше всего органического трафика. Просто вставьте их домен в Site Explorer, затем перейдите к отчету «Top Pages» (самые популярные страницы) и найдите URL-адреса, содержащие .pdf.
Послесловие
В большинстве случаев новый контент следует создавать на веб-страницах, а не в PDF-файлах. Но как насчет старых PDF, следует ли их оптимизировать под поисковые системы или преобразовывать в веб-страницы?
Это зависит от различных факторов. Единственного правильного решения здесь не существует. Делайте так, как вам проще.