Архив автора

Мир R: новости начала лета

07.06.2015

Всех приветствую и спешу поделиться новой порцией полезных новостей о том, что происходит в мире R.

Вероятно, прежде чем начать работу в R с тем или иным массивом данных, многим часто приходится предварительно обработать эти данные в Excel, что порождает дополнительные неудобства. Решение проблемы было предложено давно несколькими разработчиками, которые создали пакеты для R, комбинация которых позволяет читать данные из Excel, работать с ними в R и подгружать результат обратно, включая графику, формулы, форматирование и новые листы. Недавно вышел новый пакет readxl для чтения данных из Excel, он отличается высокой скоростью работы и простотой установки — он не требует установки Java или других дополнительных средств.

Вероятно, для многих студентов макросы ассоциируются со средствами VBA, реализуемыми в Excel. Однако разработчики R не стоят на месте и создают код, позволяющий писать макросы в R. Matloff дает рекомендации о том, как можно осуществить эту идею, рассматривает несколько простых примеров, синтаксис которых можно заимствовать для своих макросов.

По уже сложившейся традиции, хочу поделиться с вами новостями о приложении R к анализу глобальных проблем экологии и уровня жизни населения. История одного азиатского корреспондента для New York Times о том, каких уровней может достигать загрязнение воздуха в странах Азии, вдохновила создателя этой заметки на анализ этой проблемы в R. На мой взгляд, любой пользователь R найдет в этой заметке для себя массу полезного: в ней содержится пошаговая инструкция всего исследования, включающая советы о том, как создавать красивые графики и карты с нанесением данных. Добавлю к слову о графиках и картах: пост содержит интересные примеры модернизации существующих диаграмм на основе знаний о мире с помощью средств R.

И напоследок, не могу не поделиться ссылкой на новый краткий курс онлайн по R, который может быть интересен всем тем, кто стремится совершенствовать свой уровень владения этим языком.

Всем шикарного лета и приятной сессии!

Ваша Юля.

Мир R: обзор последних событий

30.03.2015

Доброго времени суток всем любителям R!

Пришла пора и мне вновь поделиться свежей порцией новостей мира R.

Начну с того, что на днях открыла для себя новый пакет leaflet. Автор данного поста об этом пакете на r-bloggers.com подошел к вопросу иллюстрации применения leaflet нестандартно: он решил обозначить на карте Лондона очаги эпидемии холеры в 1854 году, опираясь на данные John Snow`s Cholera data. Результат наглядно показал, что данный пакет отлично подходит для работы с картами, если нужно выделить какую-либо область на ней или же произвести расстановку точечных объектов. Более подробный код и результат можно найти здесь.

Несомненно, популярность R растет с каждым годом. Но задумывались ли вы когда-либо о том, насколько популярны различные пакеты программирования среди исследователей и как оценить и сравнить этот показатель от пакета к пакету? Данный пост наглядно демонстрирует ряд любопытных фактов. Во-первых, удивительно, но в 2014 году SPSS уверенно занимает первое место по количеству статей, приходящихся на данный пакет. За ним идут SAS и MATLAB. R немного отстает от MATLAB, занимая четвертое место в топе. При этом статистика показывает, что популярность R растет плавно, в то время как количество статей, использующих SPSS и SAS резко упало за последние 10 лет и продолжает следовать нисходящему тренду.

R пригодится и любителям мира финансов. С помощью пакета quantmod один из юзеров выгрузил ежедневные котировки компаний, которые входят в перечень NASDAQ 100, и измерил расстояние между офисами этих компаний и провел визуализацию полученных результатов. Оказалось, что в целом чем ближе компании друг к другу, тем более скоррелировано поведение их акций. Заинтригованы? Еще больше интересных фактов по теме здесь.

Надеюсь, вам понравилось. До новых встреч на Pokrovka11!

Ваша Юля.

Мир R: события уходящего года

03.01.2015

Итак, на дворе третье января, а значит, пришло время подвести итоги ушедшего 2014 года.

Как всегда, в подготовке подборки новостей мне помогли два блога пользователей R: Revolutions и R-bloggers. Каждый, кто интересуется вопросами анализа данных, моделирования, прогнозирования с помощью R, найдет здесь множество подсказок.

Если Вы не можете определиться, какой графический пакет удовлетворит именно Ваши нужды, этот пост, автор которого сравнивает различные пакеты R, для Вас. Продолжая разговор об углублении знаний об R, хочу порекомендовать всем тем, кто хотел бы познакомиться с этой средой, но не знает, где найти литературу, этот пост: An R «meta» book, который содержит подборку полезной литературы по теме.

Не секрет, что R позволяет приходить к весьма неожиданным фактам об окружающем мире. Так, пакет choroplethr поможет наглядно представить информацию о распределении уровней доходов, явок на голосования, уровней преступности и любых других показателей на определенной территории, о чем подробнее можно прочитать здесь. Кроме того, разносторонний анализ экспертных мнений в R может помочь построить предсказания относительно победителей кинопремии Оскар, а также протестировать собственную стратегию в популярной игре 2014 года 2048.

Но пользователи не останавливаются на этом и находят применение R даже в самых неожиданных областях. Так,  Giuseppe Paleologo, вдохновившись коллажами в  New York Times, которые отражают все коллекции и их цветовые гаммы Недели моды 2014, прошедшей в Нью-Йорке, создал свой собственный код R, который позволяет оптимизировать эту работу и создать палету из 2000 образов за минуту. Подробнее об этой красоте и силе творчества здесь.

Завершая свой обзор, хочу привести интересный, на мой взгляд, факт. На основе данных двух исследований уровней зарплат IT сектора на территории США был сделан вывод о том, что навыки R ценятся работодателями более всего и позволяют их обладателям получать наиболее высокую зарплату в данном секторе, а это значит, что освоение R является не только увлекательным занятием, но и довольно прибыльным делом.

Отличных праздников и восстановления душевных сил всем нам!

Ваша Юля.

Свежая порция новостей мира R

27.10.2014

Мир R не перестает радовать новостями даже самых продвинутых пользователей, а это значит, что пришла пора очередного обзора.

На этой неделе я открыла для себя блог любителя математики и анализа данных по имени Myles, в котором можно найти массу размышлений о разных языках программирования, о том, как лучше анализировать информацию и даже примеры того, как это делать. Но примечателен тот факт, что автор использует все эти инструменты для анализа событий, встречающихся в повседневной жизни. Так, на этой неделе Myles опубликовал свой пост, в котором проанализировал свой аккаунт в Twitter с помощью R. Каждый может проделать то же самое со своими аккаунтами в социальных сетях, поупражнявшись в применении R к анализу жизни. Кто знает, может быть, вы откроете для себя ряд удивительных закономерностей, о которых раньше и не подозревали.

Кроме того, R не стоит на месте и развивается постоянно. Revolution R Open — бесплатное обеспечение на базе R, которое, как утверждают создатели, содержит массу новых библиотек и возможностей, которые помогут решить самые сложные статистические задачи.

На этой неделе стартовал проект translate2R, который принесёт пользу всем тем, кто до сих пор тратит уйму времени на то, чтобы прочитать в R неродные форматы данных. Сейчас проект находится на тестировании, в котором может поучаствовать каждый желающий. На мой взгляд, это уникальная возможность для всех тех, кто начинает свое знакомство с R и сталкивается с описанной проблемой довольно часто.

В преддверии новогодних праздников, памятуя о хлопотах, связанных с выбором подарков в году предыдущем, наверняка многие задумываются о том, что преподнести своим близким, уже сейчас. Для создания соответствующего настроения праздника и чуда рекомендую прочитать эту заметку об удивительных результатах, к которым можно прийти, анализируя игру «Тайный Санта».

Всем продуктивной рабочей недели, а студентам безболезненной сессии!

Ваша Юля.