7 важных алгоритмов ссылочного ранжирования с выводами для владельцев сайтов и SEO-специалистов

Автор: Виктор Есипов
Для кого: для тех, кто продвигает сайт с помощью ссылок
Время чтения: 10 минут. Обещаю, Вы не потратите его зря
Сложность статьи: низкая.

Дата публикации: 24 октября 2018 г.

1. Индекс цитирования

Индексом цитирования называется показатель поисковой системы, вычисляемый на основе числа ссылок (цитирования) на данный ресурс с других ресурсов сети Интернет за определенный промежуток времени, например, год.

При этом индекс цитирования не учитывает вес самих источников. При его расчете также не учитываются ссылки с немодерируемых ресурсов, которые могут добавляться без контроля со стороны владельца ресурса.

У каждой поисковой системы есть свой индекс цитирования.

Пример

У поисковой системы Google, которая первой начала активно использовать индекс цитирования для ранжирования страниц сайтов, есть алгоритм PageRank, который учитывает при ранжировании количество и качество ссылок (как внешних, так и внутренних). Рассчитывается для каждой страницы сайта.

У Яндекса есть взвешенный индекс цитирования (вИЦ), который рассчитывается отдельно для каждой страницы сайта, как и PageRank Google. Ранее был и тематический индекс цитирования (тИЦ), но в августе 2018 года Яндекс объявил о замене тИЦ на ИКС. Более подробно про ИКС можете ознакомиться на официальном блоге Яндекса для Вебмастеров.
Вывод для владельца сайта и SEO-специалиста

Нужно стараться постоянно и постепенно повышать индекс цитирования продвигаемого сайта с помощью получения внешних ссылок на него.

2. PageRank

PageRank — это числовая величина, характеризующая «важность» веб-страницы сайта. Чем больше ссылок ведет на страницу сайта и чем они более качественнее, тем страница становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы с помощью подсчёта важности ссылок на неё.

Под качеством ссылки понимается количество веса, который она передает.

Этот метод расчета запатентовали разработчики и сооснователи поисковой системы Google Сергей Брин и Ларри Пейдж. Более подробно ознакомиться с текстом исследования можете здесь (на английском языке). На русском языке очень подробно все расписано тут.

Что такое вес страницы сайта?

Под весом страницы степень ее важности. Если проводить аналогию с человеческими отношениями, то фраза "его слово имеет вес" будет отражать суть понятия "вес страницы сайта".

Вес страницы выражается в конкретных цифрах и его можно рассчитать.

Условно, вес страницы бывает двух видов:

  1. Статический вес (определенная цифра), который вычисляется на основании запросонезависимых факторов - это все факторы, которые не имеют отношения к поисковом запросу. Например, возраст сайта, его страниц, дата индексации страниц, количество внутренних и внешних ссылок, ведущих на страницу.

  2. Динамический вес, который вычисляется на основании запросозависимых факторов - это все факторы, который связаны с поисковым запросом (текстом). Текст запроса сопоставляется с текстом страницы сайта, поэтому, запросозависимые факторы это те, которые в первую очередь зависят от текстовых элементов страницы - ее заголовка title, описания description, текста на ней, анкоров (текстов) ссылок, которые указывают на нее и исходят с нее.

Алгоритм PageRank определяет статический вес страницы, а не динамический. Иначе говоря, статический вес страницы - это и есть ее PageRank. На сайте может быть страница без контента, но если на нее ведет хотя бы одна ссылка, то она будет иметь статический вес.

Статический вес считается поисковиками в фоновом режиме и присваивается странице сайта. Спустя определенное время он пересчитывается. Динамический вес считается не в фоновом режиме, а на лету, когда пользователь отправляет поисковый запрос поисковой системе для поиска результатов.

Как выглядит формула PageRank?

Никто точно не знает, как на самом деле Google рассчитывает PageRank. Но можно ориентироваться на эту формулу, предложенную Сергеем Брином и Ларри Пейджом в их исследовании.

PR(A)=(1-d)+d(PR(T_1 )/C(T_1 ) +⋯+PR(T_n )/C(T_n ) ), где

PR(A) — вес страницы-акцептора A (на которую проставлена ссылка)

PR(T_n) — вес страницы-донора, ссылающейся на страницу A (с которой проставлена ссылка)

C(T_n) — число ссылок со страницы-донора

d — коэффициент затухания, обычно принимается равным 0,85. В вероятностной модели он подразумевает, что пользователь не перейдет по ссылке вообще, а закроет страницу сайта. Такому событию присвоили вероятность равной 15 %. Остальные 85 % отданы ссылкам.

1-d — элемент, который нужен для того, чтобы формула не занулилась, если вес ссылающихся страниц-доноров будет равен 0. Это означает, что даже самая незначительная страница сайта может передавать какой-то минимальный вес по ссылке.

Формулу можно записать в таком виде

Вес страницы-акцептора сайта равен сумме весов, передаваемых по ссылкам от страниц-доноров к странице акцептору.

Вес, передаваемый по ссылке, равен весу страницы-донора, деленному на все его ссылки.

Пример

Если продвигается сайт в тематике по продаже рулонных штор, то нам нужно найти страницы на сайтах-донорах с высоким PageRank. При аутриче я не анализирую значение PageRank каждой страницы сайта, с которым хочу провести аутрич, т.к. такая страница может быть на заспамленном сайте. Я ориентируюсь на тематичность страницы-донора и чтобы такая страница была в ТОП-10 поисковый системы по тематическим информационным запросам, которые относятся к продвигаемому продукту/услуге и на показатели, по которым проверяю каждый потенциальный сайт-донор перед тем, как написать предложение его владельцу или лицу, ответственному за размещение материалов на нем, о публикации ссылки или упоминания.

Если страница находится на первой странице результатов поиска, значит алгоритм поиска посчитал ее качественной для того, чтобы быть в ТОП-10 по интересующему нас поисковому запросу. С такой страницы и нужно постараться получить активную ссылку или упоминание, т.к. она уже имеет трафик из поиска и ссылка, размещенная на такой странице, будет иметь большую вероятность перехода пользователями за счет нахождения в ТОПе.

Другой вопрос, как разместить ссылку так, чтобы она выглядела как проставленная редакционно (естественно). Об этом я рассказываю в своем руководстве по аутричу для SEO, аналогов которого пока нет в Интернете.
Вывод для владельца сайта и SEO-специалиста

  1. PageRank рассчитывается не для сайта в целом, а для каждой страницы в отдельности.

  2. Ссылки должны размещаться на тематических или околотематических страницах, потому что поисковая система также вычисляет вес, передаваемый по ссылкам, с учётом тематики страницы-донора, с помощью алгоритма Topic-sensitive PageRank.

  3. PageRank всего лишь один из многочисленных методов, используемых Google для определения релевантности и важности страницы.

  4. Не все ссылки одинаково влияют на PageRank. У Google есть патент, в котором говорится о том, что вес ссылки зависит от определенного набора факторов.

3. Импакт-фактор

Импакт фактор - это численный показатель важности научного журнала. Он характеризует отношение числа всех ссылок за определенный год на статьи журнала, опубликованные за два предыдущих года, к числу этих статей.

Расчёт импакт-фактора основан на определенном временном периоде, как правило, двух- или трехлетнем.

Пример

Импакт-фактор журнала (сайта) в 2018 году вычислен следующим образом:

ИФ = A/B, где

A – число цитирований в течение определенного года статей (например, 2018), опубликованных в данном журнале в 2016 - 2017 годах.

B – число статей, опубликованных в данном журнале в 2016 - 2017 годах.

При расчете импакт-фактора (точнее, числа цитирований А) учитываются не все публикации, но только те, которые "могут быть цитируемы" (т.н. citable items), т. е. исследовательские статьи и научные обзоры. Не учитываются цитирования в некоторых типах статей (редакционные заметки, письма в редакцию, новости, отчеты о конференциях, списки опечаток). Тип цитируемого издания влияет на вес ссылки в нем. Ссылка в телевыпуске новостей значительно весомей цитаты в центральной газете. Ссылка на источник
Вывод для владельца сайта и SEO-специалиста

  1. Стараемся систематически публиковать исследовательские статьи на продвигаемом сайте, подробные и полезные обзоры продуктов/сервисов/услуг, чтобы повысить их вероятность цитирования другими людьми.

  2. Стараемся получить внешние ссылки из такого типов публикаций, потому что они повышают вероятность их цитирования другими людьми.

  3. Стараемся получить ссылки с трастовых ресурсов, где есть целевая аудитория продвигаемого сайта, т.к. тип ресурса влияет на передаваемый по ссылке вес.

    4. HITS

    Данный алгоритм переводится с английского как поиск по гиперссылке.

    Алгоритм оперирует двумя понятиями:

    1. Авторитетный документ (автор или страница, на которую ссылается ссылка) — это документ, соответствующий запросу пользователя, имеющий больший удельный вес среди документов данной тематики, то есть большее число документов ссылаются на данный документ.

    2. Хаб-документ (посредник или страница, с которой стоит ссылка) — это документ, содержащий много ссылок на авторитетные документы.

    Страница, на которую ссылаются многие другие страницы, должна быть хорошим «автором». В свою очередь страница, которая указывает на многие другие, должна быть хорошим «посредником».

    Алгоритм HITS является запросозависимым - по одному поисковому запросу страница продвигаемого сайта может быть авторитетом, по другому - не будет таковой. Он учитывает не только входящие, но и исходящие ссылки с ссылающейся страницы.
    Вывод для владельца сайта и SEO-специалист

    Стараемся получить ссылки с тематических страниц-хабов, которые ссылаются на аналогичные тематические ресурсы. Это могут быть тематические каталоги сайтов, фирм, организаций, рейтинги, справочники.

        5. Hilltop

        Алгоритм оперирует двумя понятиями:

        1. Экспертный документ (страница, с которой ссылается ссылка) — это документ определенной тематики, который ссылается на другие тематические документы этой же тематики.

        2. Неаффилированный документ (страница, на которую ссылается ссылка) — страницы сайта считаются неаффилированными в том случае, если они созданы веб-мастерами (владельцами сайтов), относящимися к неаффилированным организациям.

        Сайты считаются аффилированными в том случае, если:

        • Совпадают первые 3 октета IP-адресов.
        • Идентичен крайне правый не-общий токен имени хоста.

        Токенами имени хоста являются подстроки, разделенные «.» (точкой). Суффикс хостнейма считается общим (generic), если он встречается на большом количестве различных хостов.

        Пример

        Доменное имя верхнего уровня «.com» и национальное доменное имя верхнего уровня «.co.uk» имеются у огромного числа хостов, а значит, суффикс является общим. При сравнении двух хостов, если у обоих убрать общий суффикс, и предшествующая ему часть окажется одинаковой, то эти хосты будут считаться аффилированными.

        Сравнивая «ibm.com» и «ibm.co.mx» общие суффиксы «.com» и «.com.mx» будут проигнорированы. Получится, что в обоих случаях крайне правым токеном является «ibm», который для этих двух хостов идентичен. Т.е. эти хосты рассматриваются как аффилированные.

        Алгоритм индексирует лишь тот текст на странице, который содержится в HTML-секциях, включающих в себя «ключевые фразы» экспертной страницы. Ключевая фраза — это текст, описывающий один или более URL-адресов, встречающийся на странице. Каждая ключевая фраза имеет место быть в тексте документа. URL-адрес, расположенный в пределах какой-либо фразы, считается «квалифицированный» ею.

        Мета-тег title, заголовки h1 - h6 и анкорный текст экспертной страницы считаются ключевыми фразами. TITLE является элементом, который описывает все гиперссылки, встречающиеся в документе. Заголовок описывает все гиперссылки до следующего заголовка аналогичного или следующего уровня. Анкорный текст распространяется только тот URL-адрес, с которым он ассоциирован.
        ссылочный алгоритм хилтоп для seo
        LevelScore(p) — это оценка, назначаемая фразе в зависимости от её типа. В реализации разработчиков алгоритма использована оценка LevelScore равная 16 для фраз, содержащихся в TITLE, 6 для заголовков (H1) и 1 для анкорного текста гиперссылок.

        Всё это основано на том предположении, что для определения эксперта текст TITLE более полезен, чем текст, содержащийся в заголовках на странице, который, в свою очередь, более полезен, чем текст анкора гиперссылки.
        Вывод для владельца сайта и SEO-специалист

        1. Стараемся получить ссылки с тематических страниц-экспертов, которые ссылаются на аналогичные тематические ресурсы. Это могут быть разного рода обзоры, сравнительные исследования, а также тематические каталоги сайтов, фирм, организаций, рейтинги, справочники.

        2. Получайте ссылки с неаффилированных сайтов-доноров.

        3. При определении экспертного документа, с которого хотим получить ссылку, смотрим на наличие вхождения продвигаемого ключевого слова/фразы в мета-теге TITLE.

          Пример

          Если продвигаем страницу о велосипедах BMX, то ищем информационные обзорные статьи о разновидностях этой модели велосипедов с вхождением продвигаемой ключевой фразы "велосипеды BMX" в title страницы, с которой хотим получить ссылку.

          Проводим переписку по электронной почте с владельцем сайта, на которой размещена такая обзорная статья, с просьбой дополнить статью с упоминанием вашей компании, на которой есть возможность выбора этой модели велосипедов.

            6. TrustRank

            TrustRank - это метрика, определяющая степень доверия к сайту на основе удаленности от трастовых сайтов.

            TrustRank основан на предположении, что качественные страницы сайтов в Интернете редко ссылаются на спам.

            Предполагается, что имеется определенный список трастовых сайтов (с околонулевой вероятностью спама), которые отбираются вручную модераторами поисковых систем. Это могут быть сайты правительственных организаций, образовательных учреждений, волонтерских организаций.

            Если начать обход интернета с этих сайтов, то перейдя с них по внешним ссылкам на другие сайты, можно предположить, что те сайты, которые находятся «на расстоянии одной ссылки» от 100 % траста, также достаточно трастовые, т.к. сайты NASA, Белого Дома или Википедия с меньшей вероятностью будут ссылаться на спамные сайты, пытаясь манипулировать поисковой выдачей.

            Поэтому можно утверждать, что на расстоянии одного перехода по ссылке TrustRank практически не теряется. Если же пойти дальше по ссылкам и перейти на сайт, который находится на расстоянии двух переходов по ссылкам, то уровень доверия будет также еще довольно высоким, хотя и начнет снижаться.

            Поэтому расстояние от трастовых источников до продвигаемого сайта может быть одной из причин низких позиций страниц сайта по продвигаемых ключевых словам.

            Дальнейшая оценка сайтов в сети происходит автоматически на основании этих первоначальных данных.

            Основной принцип TrustRank

            Чем дальше сайт (продвигаемый или который ссылается на продвигаемый) находится от трастовых ресурсов, тем меньше его уровень доверия.

            Что еще важно знать?

            Противоположностью TrustRank является алгоритм Anti TrustRank, суть которого сводится к тому, что чем ближе сайт продвигаемый сайт или сайт-донор (с которого хотите получить ссылку) находится к спамным ресурсам, тем с большей вероятностью такой сайт тоже будет спамным. Соответственно, если вы получаете ссылку с такого сайта на продвигаемый вами ресурс, то последний тоже становится немного ближе к заспамленным сайтам.

            Поэтому, именно заспамленность сайта донора нужно обязательно учитывать перед тем, как принять решение о возможности получения на нем ссылки.

            Источники, которые раскрывают принцип работы алгоритмов TrustRank и Anti TrustRank

            Вывод для владельца сайта и SEO-специалист

            1. Ищите трастовые сайты, с которых можно получить ссылку, тем самым постепенно наращивая Trust Rank продвигаемого сайта. Как найти такие ресурсы, я подробно описал в своей книге по аутричу.

            2. Не ссылайтесь с заспамленных ресурсов на страницы продвигаемого сайта и на заспамленные ресурсы со страниц собственного сайта. Именно по этой причине ссылки из комментариев блогов, на форумах обычно закрываются с помощью атрибута, который не передает вес по ссылке от страницы-донора к странице-акцептору или закрывают ссылки от индексации, чтобы уменьшить риск получения санкций со стороны поисковой системы.

                7. BrowseRank

                Основное отличие BrowseRank от PageRank в том, что он учитывает не количество ссылок, а клики (переходы) по ним. Помимо этого, сохраняется мета-информация о продолжительности сессии в рамках посещенной страницы сайта.

                Основной принцип BrowseRank

                Кликабельные ссылки передают больший вес, чем некликабельные.

                Основной источник данных о поведении пользователей — браузерные бары. Все ведущие поисковые системы имеют плагины, обеспечивающие мониторинг активности аудитории в Интернете.

                Источник, который раскрывает принцип работы алгоритма Browse Rank - Патент компании Microsoft "Автоматизированный анализ поведения пользователя"
                ссылочный алгоритм browserank для seo
                Вывод для владельца сайта и SEO-специалист

                1. При размещении ссылки учитывайте факторы вероятности клика по ней. Эти факторы рассмотрены в руководстве по аутричу.

                2. Не ориентируйтесь только на тип ссылки - передает она ссылочный вес или нет, индексируется она или нет. Если можете получить ссылку с качественной площадки - тематической, незаспамленной и трафиковой, то постарайтесь получить ее, т.к. ссылка на таком сайте может конвертировать посетителей в клиентов/подписчиков. Ссылка должна размещаться не только для повышения SEO-показателей, но и для того, чтобы помогать пользователям в нахождении быстрых, полных и подробных ответов на их вопросы через переходы по ней, приносить пользу продвигаемому бизнесу в виде конвертации посетителей в покупателей/клиентов/подписчиков.

                3. Не накручивайте клики по ссылкам с помощью специальных сервисов или людей, которые предлагают такие услуги.

                    Какие можно сделать выводы?

                    1. Постоянно и постепенно наращиваем индекс цитирования продвигаемого сайта с помощью простановки ссылок на продвигаемые страницы сайта.
                    2. Инициируйте получение ссылок с сайтов, близких по тематике с продвигаемым сайтом или имеющих тематический раздел на сайте.
                    3. Стараемся систематически публиковать исследовательские статьи на продвигаемом сайте, подробные и полезные обзоры продуктов/сервисов/услуг, чтобы повысить вероятность их цитирования другими людьми и получать ссылки из таких типов публикаций.
                    4. Принимаем действия к получению ссылок с тематических страниц, которые ссылаются на другие тематические ресурсы, аналогичные с продвигаемым сайтом.
                    5. Получаем ссылки с неаффилированных сайтов-доноров.
                    6. При определении экспертного документа, с которого хотите получить ссылку, смотрите на наличие вхождения продвигаемого ключевого слова/фразы в мета-теге title (заголовки страницы сайта в браузере).
                    7. Ищите трастовые сайты, с которых можно получить ссылку, тем самым постепенно наращивая TrustRank продвигаемого сайта.
                    8. Не ссылайтесь с заспамленных ресурсов на страницы продвигаемого сайта и на заспамленные ресурсы со страниц собственного продвигаемого сайта.
                    9. Учитывайте факторы естественного размещения ссылки и вероятности перехода по ней пользователем.

                    Остались вопросы? Задайте в комментариях