Создание сайтов, web-дизайн, мультипликация Больше чем система управления сайтом
Сайт на CMS Битрикс:
Автомобильная компания

Выбираем имена:
bazar.com.ua
road.com.ua
magic.com.ua
trainer.com.ua
MedCentr.com.ua
wisdom.com.ua
flow.com.ua
run.com.ua
total.com.ua
plus.com.ua
fv.com.ua
7i.com.ua
Ваши предложения...

Фил Крэйвен: Что такое PageRank (ПэйджРанк) Google'а и как получить его по максимуму

По материаллам раскрутки Веб-ресурсов

Как рассчитывается ПэйджРанк?

При расчете ПэйджРанка страницы, учитываются все входящие (ведущие на нее) ссылки. Это ссылки, ведущие на нее изнутри сайта, и ссылки, ведущие на нее извне сайта.

PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

Вот по этому уравнению и рассчитывается ПэйджРанк. Именно эта формула для расчетов была опубликована, когда расчет ПэйджРанка только вводился в эксплуатацию. Вполне возможно, что к настоящему времени формула претерпела целый ряд модификаций, однако Гугл в открытой печати об этом не сообщал. Однако, это не суть важно, поскольку само исходное уравнение достаточно хорошо.

В этом уравнении «t1 — tn» — это страницы, ссылающиеся на страницу A, «C» — количество выходящих вовне ссылок, а «d» — демпфирующий фактор, которому обычно присваивается значение 0.85.

Мы можем записать его в более простом виде:

ПэйджРанк страницы A = 0.15 + 0.85 * («доля» ПэйджРанка каждой страницы, которая ссылается на нашу страницу A)

где «доля» есть ни что иное как ПэйджРанк ссылающихся на страницу A других страниц разделенный на количество выходящих со страницы ссылок.

Страница «голосует» частичкой своего ПэйджРанка за каждую страницу, на которую она ссылается. Доля ПэйджРанка, которая передается в процессе «голосования», немногим меньше собственного ПэйджРанка этой страницы (а именно — значение собственного ПэйджРанка * 0.85). Это значение равномерно делится между всеми страницами, на которые стоят ссылки с данной страницы.

Исходя из этого, мы можем заключить, что ссылка со страницы, имеющей PR 4 и 5 выходящих вовне ссылок, хуже, чем ссылка со страницы с PR 8 и 100 выходящими вовне ссылками. ПэйджРанк страницы, которая ссылается на вашу, важен. Однако количество ссылок на этой странице, которая ссылается на вас, также важно. Чем больше внешних ссылок находится на ссылающейся на вас странице, тем меньшее количество ПэйджРанка ваша страница получит от нее.

Если «шаг» между значениями ПэйджРанка PR 1, PR 2…… PR 10 один и тот же, то приведенное выше заключение справедливо. Однако многие считают, что значения, лежащие между PR 1 и PR 10 изменяются по логарифмической шкале, и существуют веские причины, чтобы считать это правдой. Никто за пределами Гугла не знает наверняка, какое утверждение справедливо — первое или второе, — но очень велики шансы, что шкала именно логарифмическая, или схожая с последней. Коль скоро так, это означает, что, для того чтобы добраться до более высокого уровня ПэйджРанка, требуется значительно больше абсолютного значения, чем потребовалось странице, чтобы добраться до предыдущей градации. Тогда, предыдущее заключение приобретает прямо противоположный смысл: ссылка со страницы, имеющей PR 8 и множество выходящих вовне ссылок, хуже, чем ссылка со страницы, имеющей PR 4 и всего несколько выходящих вовне ссылок.

Вне зависимости от того, какой шкалой на самом деле пользуется Гугл, нам четко ясна одна вещь, а именно: ссылка с внешнего сайта изменяет ПэйджРанк вашего сайта. Помните об этом во избежание получения ссылок с «ферм ссылок».

Следует особо отметить, что когда страница «голосует» своим значением ПэйджРанка за другие страницы, ее собственное значение ПэйджРанка не понижается на размер значения, которым она «голосует». Значение ПэйджРанка не отдается вовне. Просто происходит процесс «голосования» в соответствии с весом ПэйджРанка того, кто голосует. Это как на собрании акционеров компании, когда каждый акционер голосует в соответствии с размером своего пакета акций; однако, при этом размер пакета акций не изменяется. Однако, страницы теряют часть своего значения ПэйджРанка непрямым путем, как мы увидим несколько позже.

Все ясно? Отлично. А теперь обратимся к вопросу о том, как на самом деле производятся вычисления.

При каждом расчете ПэйджРанка страницы ее существующий ПэйджРанк обнуляется, и расчеты производятся заново. Это делается потому, что за время, прошедшее с последнего вычисления, количество и качество ссылок, входящих извне на страницу, могло претерпеть изменения.

Из приведенного нами выше уравнения вполне понятно, как получается значение ПэйджРанка для страницы. Однако, существуют определенные тонкости. Представим себе, что у нас есть две страницы, A и B, каждая из которых ссылается на другую, и больше на них нет никаких ссылок. Тогда получается следующее:

Шаг 1: Расчет ПэйджРанка страницы A по весу входящих на нее ссылок

У страницы A теперь имеется новое значение ПэйджРанка. В расчетах используется значение для ссылки, входящей со страницы B. Но страница B, как мы уже говорили, тоже имеет входящую извне ссылку (со страницы A), а ее новое значение ПэйджРанка еще не рассчитано. Поэтому новое значение ПэйджРанка для страницы A базируется на неточных данных, и поэтому само не может быть точным.

Шаг 2: Расчет ПэйджРанка страницы B по весу входящих на нее ссылок

У страницы B теперь имеется новое значение ПэйджРанка. Но оно не может быть точным, потому что при его расчете используется новое значение ПэйджРанка, превходящее от ведущей извне ссылки со страницы A, которое неточно.

Это ситуация из «Уловки-22». Мы не можем получить значение ПэйджРанка для страницы A, пока нам не будет достоверно известно значение ПэйджРанка для страницы B; и мы не можем получить значение ПэйджРанка для страницы B, пока нам не будет достоверно известно значение ПэйджРанка для страницы A.

Теперь, если для обеих страниц мы имеем вновь рассчитанные значения ПэйджРанка, достаточно ли нам запустить вычисления вновь, чтобы получить корректный результат? Нет, не достаточно. Мы можем запускать вычисления снова и снова, базируясь на все более точных результатах, но эти результаты никогда не будут полностью точными, и, следовательно, наши финальные подсчеты будут неточными всегда.

Проблема решается неоднократными повторами процесса вычисления. С каждым разом при вычислениях получаются все более и более точные значения. На самом деле, получить точные значения невозможно, однако, пройдя от 40 до 50 последовательных итераций, мы приходим к ситуации, когда последующие дополнительные итерации не дают существенной добавки к точности вычисленных значений. Именно таким путем и идет Гугл при производстве каждой корректировки; и именно поэтому корректировка занимает так много времени.

Всегда следует помнить, что при производстве вычислений получается относительный (пропорциональный) результат. Получаемые результаты затем откладываются на шкале, принцип градуировки которой достоверно точно известен лишь самому Гуглу, и только после этого получается текущее значение ПэйджРанка для каждой страницы. Но даже и в таких условиях, мы можем пользоваться расчетами, чтобы понять распределение ПэйджРанка внутри сайта и ответить на вопрос, почему одни страницы сайта имеют более высокое значение ПэйджРанка, нежели другие.

Примечания:

Вы, возможно, слышали версию о том, что все считается именно так, как мы отмечали выше, но при каждой итерации результаты складываются с предшествующими значениями вычислений ПэйджРанка. Новое значение (результат + предшествующий ПэйджРанк) затем якобы используется когда происходит вычисление передачи ПэйджРанка другим страницам. Эта версия неверна по следующим причинам:

1. Они используют то же самое уравнение, но в измененном виде:

с PR(A) = (1-d) + d(……) на PR(A) = PR(A) + (1-d) + d(……)

Это и неверно, и не нужно.

2. Мы рассмотрим вопрос о том, как строить ссылки таким образом, чтобы некоторые страницы получали большую долю ПэйджРанка, чем остальные. В процессе вычислительных итераций имеет место добавление к существующему ПэйджРанку страницы других значений, нежели следует из опубликованного уравнения. А, поскольку это так, то добавления производятся по другому алгоритму и уравнение, о котором идет речь, неверно.

В соответствии с опубликованным уравнением, расчеты по каждой странице начинаются с самого начала при каждой вычислительной итерации. Результат зависит исключительно от входящих ссылок. Идея «добавления к существующему ПэйджРанку» не позволяет делать этого, поэтому получаемые таким путем результаты всегда неверны.

НазадДальше К началу