пятница, 25 октября 2013 г.

Анализ и статистика сайта. IP, User Agent, referer


По мере наполнения содержимым сайта, одной из главных задач можно считать мониторинг посещаемости и активности.

Все вебсерверы имеют журналы работы сайта, в которых фиксируется кто откуда и что смотрел на сайте. Но в большинстве случаев это не отображает качественного показателя, а только количественный.
Зарей развития Интернета можно считать 1999-2000-е года. Именно в это время был дан старт таким инструментам
  • интернет форумы, которые заменили новостные рассылки и фидо
  • блоги - это ЖЖ (LiveJournal) и другие, которые по сути электронные дневники, дали возможность всем желающим расширить круг общения и творчества, которые в свою очередь переросли в социальные сети
  • Электронные магазины и аукционы, которые дали возможность заказать онлайн товар и получить его по почте
  • Файлообменные сети - это и торренты и серверы для хранения пользовательских файлов
  • Электронная почта с помощью веб клиентов - hotmail, yahoo, mail.ru, yandex, gmail
  • Онлайн-общение в чатах и IRC
  • И главное что помогло всему этому развиваться - поисковые системы, которые в большинстве случаев были представлены как интернет-порталы с набором сервисов которые включали большинство вышеописанных
Основной задачей было своевременное наполнение каталогов поиска нужными ссылками с указанием не только тематики, но и ключевых слов и описанием сайтов. Появление новых инструментов и мощностей дал большой рост сайтов. И как следствие коммерческая сторона не заставила себя ждать.
Появление рекламы спровоцировало управление рейтингами позиций в поиске. А это в свою очередь появление таких деятельностей так SEO - оптимизация для поисковых систем. Специалисты этой сферы занимаются подгонкой сайтов для обеспечения высокого рейтинга в поисковой системе и продвижения их в рекламной среде. Но без подходящих инструментов и методик это невозможно.



Одним из правильных подходов к анализу можно считать установка счетчика посещений. Они являются маленькими скриптами, которые передают данные в основную систему статистики.

Вот самые популярные счетчики
Яндекс.метрика
Рамблер
SpyLog (с недавних пор OpenStat)
LiveInternet.ru
Mail.ru
Hotlog.ru

Для их подключение достаточно зарегистрироваться и расположить счетчик на своей странице.
Большинство CMS уже имеют готовые плагины для подключения счетчика по идентификатору.

Итак рассмотрим какие данные сохраняются в журналах сервера при посещении сайта и как их можно проанализировать.

remote IP - адрес посетителя
User Agent - браузер посетителя
Accept-Language - предпочтительный язык посетителя
referer - URI перенаправления
 Это базовые составляющие протокола HTTP при запросе страницы.

Адрес посетителя
При анализе адреса посетителя существуют сервисы которые позволяют определить местоположение посетителя
Например, мы  хотим узнать где находится ДНС-сервер гугл (8.8.8.8)

geoiplookup 8.8.8.8
Host Name: google-public-dns-a.google.com
GeoIP Country Edition: US, United States
GeoIP City Edition, Rev 1: US, 38.000000, -97.000000, 0, 0
GeoIP Organization Edition: Level 3 Communications

Тоесть у нас есть возможность ознакомиться с географической популярностью нашего сайта и какова динамика распространения.

User Agent
Это может быть и необязательный параметр, но в большинстве случаев он все-таки указан, поскольку разнообразие на рынке браузеров внесло требования к построению сайтов. Не все браузеры одинаково поддерживают возможности верстки страниц, и поэтому указание типа помогает сайтам подстраиваться  под пользователя и отображать страницу без ошибок. Помимо этого, данные о браузера помогают озвучить операционную систему или даже тип устройства с которого посетитель просматривает ваш сайт.
Например, зайдя на страничку с Samsung Galaxy S, мы увидим:

Mozilla/5.0 (Linux; U; Android 2.1-update1; ru-ru; GT-I9000 Build/ECLAIR) AppleWebKit/530.17 (KHTML, like Gecko) Version/4.0 Mobile Safari/530.17

Предпочтительный язык
Ну данный параметр не сильно ключевой, но возможно подскажет в нужный момент, когда нужно ориентироваться на более широкий круг посетителей

Идентификатор перенаправления
Это самый интересный  параметр - он указывает откуда Ваш посетитель перешел на Вашу страничку.
Все идентификаторы в большинстве случаев строятся так

http://my.domain.com/page.html?parameter1=data1&parameterN=dataN&...

Почему это интересно? Потому что все поисковые системы строят свои поиски именно вставляя в поле data текст поиска который искал посетитель, и уже после поиска в поисковой системе, посетитель выбирает результат поиска который приводит на Вашу страничку.
Одним из второстепенных полезностей - это что именно искал пользователь когда пришел на Вашу страничку.

Это же касается и других мест, откуда было осуществлено перенаправление на Ваш сайт.
Например, Вы создали электронный магазин, описали и опубликовали товар. Чтобы создать приток клиентов, Вы дали рекламу и объявления в разные биржи, объявлении и каталоги. Проверить какая система была целевой для вашего магазина можно очень просто.
Достаточно подсчитать количество перенаправлений с адреса Вашего объявления на Ваш сайт.

И тут как раз наступает вовремя вопрос:  
Почему же нужно использовать внешние счетчики, если мы на нашем веб-сервере можем увидить всю интересующую нас информацию?

Ответ очень прост. В "каменный век" Интернета, счетчики практически дублировали информацию находящуюся на вебсервере в плане анализа - это были и географические данные о пользователях, их браузер и язык, а также некоторые данные о повторных заходах и новых пользователях.
Но в наше время большинство пользователей регистрируясь в социальных сетях и заполняя регистрационные формы невольно расширяют количество данных о себе. Соответственно, системы предоставляющие счетчики и имеющие доступ к данных пользователей могут моделировать более полную картину о посетителях и целевой аудитории.

Вот примерный список параметров при наличии счетчика Mail.ru
География - кто с какой страны или города заходил
Время проведенное на сайте
Поисковые запросы
Поисковые серверы - какие серверы предпочтительные для поиска
Социальные сети - на каких социальных сетях опубликовано ссылки на ваш сайт
Почтовые сервисы, каталоги, счетчики - где отображены ссылки на ваш сайт
Демография - отображение возрастных категорий и полов
А также рейтинги в каталоге по схожей тематике.

Поэтому счетчики будут очень хорошим помощником в анализе аудитории и посещаемости странички.
Главное не переборщить.
Анализ сайта xodoki.net


Комментариев нет:

Отправить комментарий