R – самый популярный язык программирования среди аналитиков
по данным опроса O’Reilly Media
Мы живём в эпоху цифровизации, когда каждый процесс можно автоматизировать и упростить свою работу. На языке R можно написать код, который освободит вам время для новых проектов.
Самая универсальная область применения R — аналитика. Используя R, вы можете провести статистические тесты и проверить гипотезы, построить графики и сделать прогноз.
Кому подойдёт этот курс
- Интернет-маркетологам
Получите инструмент для работы с данными. Автоматизируете рутинные операции и научитесь создавать информативные отчёты. Начнёте говорить с программистами на одном языке. - Начинающим аналитикам
Добавите ещё один профессиональный навык в резюме и углубите понимание статистики. Научитесь собирать и анализировать в одном месте данные по всем проектам.
- Собирать данные из большинства аналитических систем
- Преобразовывать R-скрипты для переработки получаемых данных в зависимости от задач
- Анализировать процессы с помощью скриптов и показывать результаты на графиках
- Легко собирайте данные из различных систем с R
- Прокачайтесь до уровня middle в прогнозировании и визуализации в R-Studio
- Автоматизируйте свои рутинные задачи после прохождения курса
Собирать
Данные из большинства аналитических систем
Преобразовывать
R-скрипты для переработки получаемых данных в зависимости от задач
Анализировать
Рутинные процессы с помощью скриптов и показывать результаты на графиках
Достижения и ключевые навыки после обучения
Достигнутые результаты
- Составлен прогноз продаж в зависимости от погоды
- Собраны несколько наборов данных в один
- Проведён анализ продаж интернет-маркетинга
- Проведён анализ потребительских привычек регионов России
- Составлен прогноз цены квартиры на основе характеристик
- Сбор данных из большинства веб-аналитических систем
- Преобразование данных с помощью R-скриптов
- Работа с клиент-серверными, облачными и локальными базами данных на языке R
- Разработка скриптов для рассылки писем и создания наглядных графиков
Содержание Модуль 1 - Базовые принципы программирования на R
Рассмотрим базовые возможности языка R, научимся настраивать R-Studio и начнём использовать для простых операций.
- R и R-Studio
- Переменные их типы
- Объявление переменных в R
- Арифметические операции
- Логические переменные и операции
- Ветвление
- Циклы
Познакомимся с векторами и техниками программирования в R.
- Понятие вектора, векторные операции
- Использование функций
- Обзор основных функций и пакетов R
Научимся импортировать данные в R, познакомимся с фреймами данных, освоим базовые операции (просмотр, обращение к данным, преобразование, соединение, фильтрация).
- DataFrame — что это и для чего
- Импорт DataFrame в R
- Простейшее исследование DataFrame
- Доступ к переменным DataFrame (знак $)
- Базовые операции с DataFrame
- Фильтрация DataFrame
Познакомимся со способами визуализации данных в R, научимся применять визуализацию в зависимости от данных, интерпретировать графики. Научимся оценивать распределение, описательные статистики для двух и более переменных, узнаем о корреляции и регрессии.
- Основы визуализации в R
- Построение гистограмм — функция hist
- Построение boxplot
- Построение графиков зависимостей двух переменных
Познакомимся с продвинутыми способами визуализации данных в R, научимся работать со сложными наборами данных и интерпретировать их.
- Базовый шаблон ggplot
- Геометрические типы и преобразования
- Управление графическими параметрами
- Группировка данных
- Системы координат
- Оси, легенды, подписи
- Разделение графиков по фасетам
- Интерактивная визуализация в Shiny
Научимся подготавливать данные к дальнейшей работе, анализу структуры, классификации без обучения (кластерный анализ).
- Стандартизация данных
- Иерархическая кластеризация
- Метод k-средних (kmeans)
- Основы мультивариативного анализа в R
Узнаем про основные модели прогнозирования, познакомимся с линейной регрессией и научимся её построению, оценке и использованию.
- Модели прогнозирования
- Линейная регрессия
- Построение модели линейной регрессии в R
- Оценка модели линейной регрессии и её использование
Узнаем больше о различных моделях прогнозирования и их использовании в полевых условиях, научимся их строить и валидировать. Познакомимся с работой с предсказанием категории и с несбалансированными данными.
Логистическая регрессия
Основные модели, основанные на деревьях решений
Валидация модели
Дилемма смещения-дисперсии
Работа с предсказанием категории
Работа с несбалансированными данными
Имплементация модели в работу компании
Скачать:
Для просмотра содержимого вам необходимо Войти или Зарегистрироваться.