Перевод книги «Using Google Analytics with R» (Michal Brys)

StalkerOK

Администратор
Команда форума
Регистрация
5 Фев 2019
Сообщения
471
Скачать.PDF

Электронная книга «Using Google Analytics with R» (Michal Brys) представляет собой практическое руководство по анализу данных из Google Analytics в R. Написана дата-сайентистом в 2014 году, но ничуть не теряет своей актуальности и сегодня.


Using Google Analytics with R

В настоящее время мы плаваем в «озере данных» (data lake). Только если вы знаете, как использовать эти данные, вы останетесь на поверхности. Первым шагом является регулярная проверка стандартных отчетов в инструменте веб-аналитики (Google Analytics).

Но чтобы оставаться конкурентоспособным, нужно нечто большее. Все говорят о сборе данных. Но только некоторые знают, что делать с данными после их сбора. Я постараюсь описать этот процесс и дать вам несколько идей, как работать с данными из Google Analytics, используя R. (Michal Brys)

R — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU. Был разработан сотрудниками статистического факультета Оклендского университета Россом Айхэкой (Ross Ihaka) и Робертом Джентлменом (Robert Gentleman).


Данные Google Analytics в R (количество сеансов в зависимости от даты)
Основные преимущества языка R:

  • бесплатный;
  • доступно множество библиотек для различных статистических вычислений;
  • актуальный список пакетов. Множество учебных материалов (учебные пособия, MOOCs, блоги) доступно бесплатно в интернете;
  • имеет большое сообщество специалистов (русскоязычное пока маленькое);
  • готов к запуску на разных платформах (Windows, Mac, Unix). Версия для установки сервера также доступна;
  • быстрый, поскольку работает в режиме вычислений в памяти.


Michal Brys


Автор материала работает в интернет-индустрии с 2009 года, является экспертом в области веб-аналитики в электронной коммерции, особенно с использованием Google Analytics и Google Tag Manager, а также состоит в группе разработчиков Google в Кракове (Польша).


Точечный график с линией тренда
Благодаря этой книге я познакомился с R. Она написана для маркетологов, которые работали с Google Analytics и знают основные метрики, включенные в этот инструмент, и знают веб-интерфейс.

В книге используется R Studio (свободная среда разработки программного обеспечения с открытым исходным кодом для языка программирования R), а также различные пакеты, такие как: googleAnalyticsR, googleAuthR, RGoogleAnalytics, ggplot2, plotly, tidyverse, forecast, reshape2.


Кластеризация в R (метод k-средних)



Содержание книги:
  • Вступление
  • Зачем?
  • О Google Analytics
  • Про R
  • Об авторе
  • Подготовка среды
  • Источники данных
  • Создание аккаунта Google Analytics
  • Получение учетных данных для Google Analytics API
  • Установка счетчика Google Analytics на веб-сайт
  • Установка R Studio
  • Первые шаги
  • Введение в R
  • Связь с Google Analytics
  • Пакет googleAnalyticsR
  • Импорт и экспорт данных в .CSV
  • Хранилище кодов
  • Разведочный анализ данных (EDA)
  • Визуализация данных в R
  • Тепловая карта трафика (Traffic Heatmap)
  • Сравнение устройств
  • Машинное обучение
  • Кластеризация (метод k-средних)
  • Построение отчетов
  • Введение в R Markdown
  • Создание отчета
  • Дополнительный анализ
  • Обнаружение аномалий
  • Прогнозирование
  • Ресурсы (блоги, документация, онлайн тренинги, книги)
Поскольку книга была написана в 2014 году, некоторые вещи за последние 5 лет претерпели изменения. Например, обновился код Google Analytics (gtag.js), изменен интерфейс cloud.google.com, некоторые команды в библиотеках R. В процессе перевода я сам проверял код, запускал программы, и там, где было необходимо, вносил корректировки. Поэтому данные из оригинальной книги могут несколько отличаться от моего перевода.

Источник
 
Сверху