pages bg right
Posted by papulia on Октябрь 18, 2008


ДА! ЕЩЕ О AWSTATS

Да, еще

Итак, вы успешно одолели главу 2? Отлично! Если вам достаточно только самых основ, чтобы перейти к Google Analytics, то можете пропустить эту главу. Так зачем же мы ее написали? Хороший вопрос. В данной главе мы рассмотрим некоторые проблемы, из-за которых в процессе сбора и анализа данных о трафике сайта возникает много ошибок и заблуждений. Мы по-прежнему будем использовать AWStats в качестве основного примера, и вы также можете заглядывать в свои статистические данные, если, конечно, они у вас есть. Кроме того, вы узнаете о вещах, которые AWStats может делать, a Google Analytics — нет.

Мы считаем, что излагаемый материал — увлекательное чтиво, но, возможно, вам оно покажется чуть менее захватывающим, чем глава 2. Тут ничего поделать нельзя. Терпите. А теперь переходим к Monthly History (Истории по месяцам) (рис. 3.1).

Примечание

Приведенные здесь копии экрана были сделаны в AWStats 6.4. Если у вас другая версия — информация о версии выводится внизу фрейма отчета, — то, что вы видите, может существенно отличаться от приведенных копий экрана.

Окно Monthly History

Окно Monthly History состоит из двух частей: столбчатой диаграммы (гистограммы) и таблицы значений. Значения на диаграмме и в таблице соответствуют информации Summary для каждого месяца. В самом низу каждого столбца диаграммы — итоговое значение, которое выводится в годовых итогах (Year Sum-

Рис. 3.1. В окне Monthly History (Истории по месяцам) приведены значения из Summary (Итоги) каждого месяца

тагу). Как и в годовых итогах, итоговое значение параметра Unique Visitors (Уникальные посетители) — неточное. (Эта проблема подробно обсуждалась в главе 2.)

На столбчатой диаграмме каждый цветной столбик пропорционален другим столбикам этого же цвета. Но, к сожалению, между столбиками разных цветов корреляции нет. На рис. 3.1 самый высокий желтый столбик и самый высокий бирюзовый — одинаковой высоты. Но самый высокий желтый столбик означает 18530 посещений, в то время как самый высокий бирюзовый — 173 849 просмотров.

У окна Monthly History простое назначение. Оно предназначено только для того, чтобы вы могли сравнивать значения трафика от месяца к месяцу. Например, почему в феврале трафик удвоился, а в марте упал?

Эти вопросы имеют отношение и к бизнесу, и к сайту. В конкретном случае сайта SkateFic.com цифры трафика объясняются следующим образом: в феврале проводились Зимние Олимпийские игры 2006 года, что вызвало на короткий период подъем интереса к фигурному катанию. Но затем в марте, несмотря на то, что велись телевизионные трансляции с чемпионата мира, трафик упал, потому что “временные” фанаты вернулись к своему привычному распорядку. И поскольку в нашем распоряжении есть исторические данные за восемь лет, можно уви-

деть, что точно такая же тенденция наблюдалась во время Олимпийских игр 1998 и 2002 годов.

Это еще одно преимущество показателей сайта. С их помощью можно отличить кратко- и долговременные тенденции; иногда для этого достаточно просто взглянуть на данные. Достигает ли ваш веб-сайт своего пика в августе каждый год? Привело ли упоминание о сайте в передовой статье популярного журнала к резкому скачку трафика в январе? Наблюдается ли рост трафика в связи с неким событием в реальной жизни? Каковы кратко- и долговременные тенденции?

Другой способ оценки трафика, по дням и часам, показан на рис. 3.2.

Рис. 3.2. В окне Days of Month (Дни месяца) показан трафик для каждого дня

Дни и часы

Отчеты The Days of Month (Дни месяца), Days of Week (Дни недели) и Hours (Часы) (рис. 3.3) отвечают на одни и те же основные вопросы: “Цикличен ли трафик веб-сайта?” и “Влияют ли на трафик какие-либо особые события?” Отчет Days of Month позволяет получить данные по дням, сравнить их со средним значением и показать, как анализатор AWStats получает цифры Summary (Итоги).

С точки зрения бизнеса сравнение месячных отчетов показывает, что трафик сайта SkateFic намного выше зимой, во время сезона фигурного катания (еще бы!). Зимние Олимпийские игры 2006 года также значительно повысили трафик в фев-

Рис. 3.3. Трафик для Days и Hours

рале 2006. Каких-либо особых внутримесячных тенденций не наблюдается, даже если сравнивать данные по месяцам.

Очень плохо, что отчеты Days of Week и Hours не настолько полезны. В отчете Days of Week средние значения сглаживают как случайные, так и закономерные скачки. Диаграмма Hours, в отличие от Days of Week, дает совокупные значения, где средние величины были бы более значимыми. Но диаграмма Hours дает некоторые преимущества, позволяющие закрыть глаза на недостатки: она показывает часы пик около 8:00 утра, с 14:00 до 15:00 и около 21:00 (помните, что речь идет о центральном часовом поясе США — Central Time).

Что это означает для бизнеса? Диаграмма Days of Week абсолютно ничего не означает, поскольку усредняет любые скачки, которые действительно могут иметь смысл. Диаграмма Hours показывает, что сайт SkateFic больше посещают

до работы, после школы и после просмотра вечерних новостей. Большинство посетителей, вероятно, из континентальной части США, поскольку сайт наиболее загружен в течение дневного времени в США. Но, очевидно, на сайте бывает значительное число “сов” и людей из восточного полушария, потому что трафик имеет место даже тогда, когда жители западного полушария сладко спят. Отсюда возникает вопрос о географии посещений (рис. 3.4).

Рис. 3.4. Думаете, все посетители сайта — из США? Подумайте еще раз

Страны

У американцев есть скверная привычка быть американоцентричными. AWStats использует запросы на обратное преобразование системы доменных имен, чтобы выяснить, откуда пришли посетители сайта. На главной странице перечислены 25 основных стран, в порядке убывания трафика. Как правило, есть существенное число входящих IP-адресов, которые нельзя определить. Они обозначаются как “Unknown” (Неизвестный).

Щелкнув на ссылке Full List (Полный список), можно увидеть все страны, которые зафиксированы в журнальных файлах. Могли бы вы подумать, что люди из 96 стран, включая Иран, Бермуды, Нигерию и Монголию, интересуются литературой о фигурном катании? Думаем, это удивит каждого, если, конечно, его еще не рассмешила сама мысль о существовании художественной литературы о фигурном катании!

Точно так же и ваш сайт может иметь гораздо более широкую географию посетителей, чем вы себе представляете. Нам кажется, это понимание должно повлиять на решения, связанные с контентом сайта и электронной торговлей. Изменили бы вы свою стратегию, если бы узнали, что 35% трафика вашего сайта приходит из стран Европейского Союза?

Полагаем, что да.

Хосты

В списке хостов (рис. 3.5) предлагается несколько различных представлений одной и той же информации: названия хостов и IP-адреса посетителей. По сути, это одна и та же информация, которая говорит о том, из какой страны пришли посетители.

Рис. 3.5. Все хосты в гости к нам!

На главной странице AWStats в первой строке после строки заголовка содержатся данные о том, сколько имеется известных и неизвестных/неопределенных хостов, а также сколько есть уникальных посетителей. Основной отчет начинается с хоста, с которого запросили наибольшее число страниц; хосты перечислены в порядке убывания трафика.

На рис. 3.5 можно заметить два интересных момента. Во-первых, в отличие от других отчетов, где показаны только “люди”, в этом списке хостов показаны и “люди”, и “не люди”. “Пауки” и другие роботы — не являются “гражданами второго сорта” в этом списке хостов. Во-вторых, “пауки” Google занимают первую пятерку мест. Что это означает? Дело в том, что Google индексирует новый контент сайта минимум раз в неделю, а иногда дважды. Это очень хорошая новость для небольшого сайта. Ведь это значит, что огромная махина поискового механизма обращает на сайт свое внимание и регулярно его индексирует. Таким образом, новый контент не канет в неизвестность.

В строке заголовка этого отчета есть три ссылки. Ссылка Full List (Полный список) позволяет увидеть список всех хостов в порядке убывания трафика. С помощью ссылки Last Visit (Последнее посещение) можно загрузить список последних тысячи хостов, с которых посещался ваш сайт, расположенных по времени последнего визита. Ссылка Unresolved IP Address (Неопределенные IP-адреса)

позволяет перейти к списку тысячи хостов, названия которых не удалось определить; они расположены в порядке убывания трафика.

Роботы и “пауки”

В главе 2 мы уже говорили о посетителях, которые являются людьми и которые таковыми не являются. Один особенно важный тип посетителя, который не является человеком, — индексирующий “паук”, или веб-краулер. В отчете Robots/Spiders (Роботы/Пауки) (рис. 3.6) перечислены веб-краулеры, имеющие имена, и безымянные (но идентифицированные), которые прошлись своими маленькими липкими ногами по всем вашим страницам.

Рис. 3.6. Проиндексирован. Найден

Поименованные “пауки” — это известные роботы известных систем: Google, Inktomi, MSN, Yahoo и т.д. Другие “пауки” неизвестны, но когда они находят специальный файл на верхнем уровне веб-сайта, который называется robots . txt, сервер идентифицирует их как “пауков”. Файл robots.txt говорит “паукам” о том, куда им разрешено ходить и что можно индексировать. Например, если вы не хотите, чтобы изображения на вашем сайте индексировались, то можете добавить соответствующую строку в файл robots . txt, чтобы закрыть для “пауков” весь каталог изображений. Большинство хороших “пауков” обращают внимание на эти указания, но стопроцентной гарантии этого нет.

В отчете просмотры “пауков” отмечаются чуть-чуть не так, как просмотры других систем. Для каждого “паука” первое число в колонке Hits (Просмотры) — это количество запросов, сделанных “пауком”. Потом идет знак “плюс”, а за ним — число, показывающее, сколько раз “паук” успешно просмотрел файл robots, txt. Как видно на рис. 3.7, разные “пауки” просматривают файл robots.txt

разное (причем очень разное) количество раз. Эти числа могут означать все, что угодно, — от большого количества посещений “паука” до очень неэффективных алгоритмов его работы. Но в целом “пауки” — это хорошо. Ведь быть проиндексированным хорошо. А быть найденным — еще лучше.

Рис. 3.7. Заслуживающий внимания отчет о продолжительности посещений
Толпы вторгающихся “пауков”

Создать файл robots . txt не так уж сложно. Ниже приведены некоторые ресурсы, которые помогут вам создать такой файл, если у вас его еще нет.

• How to Set Up a robots . txt to Control Search Engine Spiders: The how and the why of setting up a robots . txt file (Как настроить файл robots . txt, чтобы контролировать “пауков” поисковых систем: “как” и “почему” настройки файла

robots. txt).

• www.thesitewizard.com/archive/robotstxt.shtml

Robots.txt Validator: Make sure your robots.txt file is correct with this nifty tool (Robots.txt Validator: проверьте, подтвердит ли этот отличный инструмент допустимость вашего файла robots . txt).

• http://tool.motoricerca.info/robots-checker.phtml Robots.txt file Creator: An online tool that will create a robots . txt file for you (Robots.txt file Creator: онлайновый инструмент, который создаст для вас файл robots . txt). Вы должны разбираться в настройках, но Creator позаботится о синтаксисе.

• www.123promotion.со.uk/tools/robotstxtgenerator.php.

Помните, что файл robots . txt должен находиться на верхнем уровне структуры каталогов веб-сайта — в том же каталоге, что и главная страница.

Предупреждение веб-мастеру: подсчет “пауков” в Google Analytics

Очень важно отметить, что Google Analytics обращается с “пауками” совершенно не так, как AWStats. AWStats определяет паука, если он “говорит”: “Я — паук” или если он находит файл robots . txt, или использует имя известного “паука”. Очень часто в Google Analytics “пауки” не выполняют JavaScript-сценарий, который говорит: “Эй, я здесь!” Google Analytics может вообще не засчитать посещения “паука”, а может засчитать, в зависимости от того, запускает “паук” этот код сценария или нет.

Помни об этом, веб-мастер.

Продолжительность посещений

Почему от этого отчета тошнит? Ну хорошо, тошнит только Мэри, в конце концов, это ее сайт. Отчет Visits Duration (Продолжительность посещений) показывает, сколько длились посещения. Среднее посещение составляет около 2,5 минуты. Это совсем неплохо. Но затем вы смотрите на цифры, которые составляют эти 2,5 минуты. Около двух тысяч человек оставались на сайте более двух минут. И только 15% оставались более тридцати секунд! И если учесть, что это контентный сайт, то у редактора должно дрогнуть сердце.

Одной из мер успеха контентного сайта является то, насколько он “привлекательный”. “Привлекательность” говорит о том, быстро ли посетители заходят и уходят. Очевидно, многие быстро заходят и уходят. Либо они нашли, что искали, и сразу ушли, либо не нашли и тоже ушли. В любом случае они покинули сайт до того, как стали исследовать его глубже.

Это наблюдение само по себе очень ценное. Но откуда пришли все эти люди? Как они нашли сайт? Они ушли сразу или попытались загрузить другую страницу? Они нашли то, что искали, и ушли? Или они не искали? Два последних вопроса — это совершенно разные вещи.

Анализатор AWStats не может ответить на эти вопросы. Предоставляя сырые данные о том, кто пришел, сколько пришло и откуда, он не может сказать, кто пришел и ушел немедленно, сколько человек стали глубже исследовать сайт и куда они пошли. Для ответов на эти вопросы нужен сервис Google Analytics.

Отчет Pages-URL

В отчете Pages-URL (URL-адреса страниц) (рис. 3.8) перечислены двадцать пять URL-адресов в соответствии с количеством просмотров соответствующих страниц. С помощью ссылки Full List (Полный список) в строке заголовка можно перейти к полному списку всех URL-адресов, зарегистрированных для вашего сайта.

Рис. 3.8. Самый популярный отчет Page-URL анализатора AWStats говорит о многом, но не обо всем

Ссылки Entry (Вход) и Exit (Выход) (рис. 3.9) позволяют перейти к страницам с полным списком URL-адресов, сгруппированных по наибольшему числу входов и выходов соответственно.

Списки Entry и Exit, как и многие вспомогательные страницы, позволяют фильтровать список с помощью регулярных выражений. Регулярное выражение (сокращенно RegEx) сравнивает шаблоны с помощью специального синтаксиса, о котором будет подробнее говориться в главе 6. Также на рис. 3.9 показано, как регулярное выражение .*/serials/.* сравнивает все URL-адреса, содержащие каталог /serials/. На сайте SkateFic.com каталог serials содержит “сериальные романы”. С точки зрения бизнеса, если вы знаете, как фильтровать список Pages-URL, это дает возможность посмотреть разные разделы сайта — если структура веб-сайта соответствует структуре вашего бизнеса (т.е. разные разделы сайта соответствуют разным разделам бизнеса).

Но если это не так? Что если вы используете переменные, чтобы направлять людей к различным частям вашего сайта? Например, на рис. 3.9 два верхних URL-адреса относятся к /chapters/index.php. И хотя с первого взгляда это неочевидно, два этих URL-адреса представляют сотни отдельных глав, потому что у каждого из них есть переменная, обозначающая главу; например /chapters/ index.php?Chapter=2 3 для главы 23 сериала.

Если сайт представляет собой онлайн-каталог, то на нем может быть только одна страница каталога, на которой используются номера товаров, чтобы извлекать их описания из базы данных. Если на сайте установлена система управления контентом (Content Management System — CMS), то на нем может быть очень ма-

Рис. 3.9. Списки Entry и Exit позволяют фильтровать результаты с помощью регулярных выражений

ло реальных страниц, и страницы будут различаться только последовательностью переменных в URL-адресе. Вы видите эти переменные в URL-адресах, которые показывает AWStats? Нет? Мы тоже.

Это еще один пример того, чего не делает AWStats, но что вам будет необходимо. Конечно, очень полезно знать, сколько людей читают главы одного или другого сериала (либо читают статьи, либо посещают каталог). Но намного полезнее знать, что 2 ООО человек прочитали самую новую главу (или статью), или что 337 человек прочитали десять других глав, или что 1 500 человек посмотрели на товар, выставленный на распродажу на этой неделе, или что 1 800 человек посмотрели на кучу других товаров в каталоге.

Вот еще один важный элемент информации, который имеет преимущества и недостатки. Посмотрите на рис. 3.10.

Рис. 3.10. Привлекательна ли страница Figure Skating Trivia?

Каталог /figure-skating-trivia/ содержит единственную страницу с многочисленными краткими биографиями фигуристов. Как оказалось, именно

это чаще всего ищут на сайте SkateFic.com. Это также наиболее часто и регулярно посещаемая страница.

Посмотрите на цифры Entry (Вход) и Exit (Выход). Вы, наверное, думаете, что они как-то связаны между собой, но это не так. Человек может зайти на сайт на другой странице, немного посмотреть, найти страницу trivia, прочитать кое-что, а затем уйти на другой сайт (или просто пить чай). И что же получится? Входа нет, один выход, один просмотр. Человек может сделать противоположное: войти на странице trivia, а выйти на другой странице, и получится один вход, выхода нет, один просмотр. Можно войти на другой странице, прочитать немного, просмотреть страницу trivia и закончить чтением одного из стихотворений в другой части сайта, — нет входа, нет выхода, один просмотр. И наконец, человек может войти на сайт на странице trivia и немедленно уйти, т.е. один вход, один выход, один просмотр. Именно об этом человеке нам нужно знать побольше! Но знаем ли мы о нем хоть что-то? Нет.

Страница trivia важна потому, что она побуждает людей углубиться в сайт. Страница trivia сайта SkateFic.com — это как дискуссионная статья контент-ного сайта или популярный товар в Интернет-магазине. Это, конечно, хорошо, что люди смотрят эту страницу, но на самом деле вам нужно, чтобы они захотели посетить и другие страницы. Это как супердешевый товар в супермаркете, продаваемый с убытком с целью привлечения покупателей. Эффективность данного товара определяется тем, сколько человек отправится с этой страницы дальше исследовать сайт.

Анализатор AWStats не может этого сказать. Он может сказать, сколько человек просмотрели страницу, сколько человек сюда вошли и сколько вышли. Но он не может сказать, сколько человек просмотрели эту и только эту страницу. Но именно эти аналитические данные чрезвычайно важны.

Нечто важное
FUEL ждет коллекционное  издание. FUEL ждет коллек... rating
Diablo III снова без LANa Diablo III снова бе... rating
Watchmen: The End is Nig 2 скоро увидит свет Watchmen: The End is Nig 2... rating
Негодование на полях Starcraft 2 Негодование н... rating
Случайное
Оставьте свой комментарий


Leave a Reply

You must be logged in to post a comment.