Posts Tagged ‘news’

Art of R — обзор новостей из мира R

23.11.2014

Учёные используют R чтобы… предсказать размер одежды человека после того, как он похудеет! Используя посты на Reddit, в которых похудевшие пользователи делились своим весом, размерами одежды и фотографиями «до» и «после». Исследователи выяснили, что похудение на 5 килограмм сопровождается более стройной на 3.33 см талией. Построение регрессий, визуализация (пакет ggplot2) и даже поиск (XML, RCurl) и чистка (tidyr) таких данных — на всё это способен R.

Каузальность странный предмет — вроде бы есть, а вроде бы её и нет. С помощью пакета CausalImpact, разработанного Google, теперь можно удобно узнать о влиянии какого-либо события на поведения людей. Так, авторы заметки исследуют влияние рекламы на поведение людей. Пакет предоставляет удобный аналитический аппарат с понятными командами и строит красивые графики. Пока пакет можно скачать лишь с GitHub с помощью пакета devtools. Информацию о том, как это сделать Вы найдёте в начале кода самой заметки.

Пакетов R подходящих для лёгкой визуализации панельных данных, в особенности с бинарными переменными, не так много, что иногда доставляет некоторые неудобства исследователям. Пакет lme4 призван сделать построение графиков по панелям совсем простым. С помощью всего одной команды lme4 может построить красивые графики фиксированных эффектов в том числе по группам, график случайных эффектов с проверкой нормальности или матрицу корреляций фиксированных эффектов.

Нельзя в очередной раз не сказать о растущей популярности R. Опубликован ноябрьский TIOBE index — индекс популярности языков программирования, в котором R поднялся с 31 на великолепное 12 место. Это самый популярный статистический язык программирования, впереди лишь такие ведущие языки общего назначения как, например, C, Java, PHP.

User, use R!

Реклама

Art of R — обзор новостей из мира R

11.10.2014

Учёные используют R чтобы… отследить сезонность в перемещениях ураганов, а затем и предсказать их следующее появление! Для этого им понадобился пакет maps и немного данных. Это прекрасный пример визуализации событий на картах с помощью R, а ведь ещё можно не только окрашивать в цвета регионы по интенсивности признака, но и, например, анализировать преступность.

Пользователи R часто сталкиваются с проблемой с публикацией исполняемого кода графиков, особенно интерактивных. Так, до недавнего времени, легко вывесить в Интернет интерактивку из R Shiny можно было только через Linux. Теперь появился сервис plotly, позволяющий публиковать графики, интерактивные модели и презентации вместе с кодом и данными, по которым они строятся. Кстати, делать презентации в R c помощью Slidify просто, а результат поражает своей красотой.

Обилие команд R порой приводит к тому, что бывает трудно вспомнить их в нужный момент. Чтобы нужные команды всегда были под рукой, ребята из RDataMining.com сделали полезную шпаргалку, в которую не только удобно, но и приятно заглядывать. А если Вы увлекаетесь Data Mining, то обязательно посетите их сайт, который посвящён широкому кругу задач от классификации и кластеризации до анализа временных рядов и Big Data их реализации в R.

В Вышке прошёл семинар по TraMineR  — пакет для анализа последовательностей.  С его помощью можно, например, выявить наиболее частые карьерные треки индивидов, построить таблицу вероятностей и стоимостей перехода из одной группы в другую, сделать кластеризацию, и конечно же, построить красивые графики. Основные методы можно посмотреть в презентации семинара.

И, в завершение, ещё 14 причин, почему лучше использовать R, а не, например, Excel.

User, use R!