Posts Tagged ‘datasets’

Kaggle Datasets

14.09.2016

На сайте Kaggle есть открытые данные, на которых можно попрактиваться 🙂

Российские данные в R!

08.11.2014

Тем, кто хочет автоматически скачивать временные ряды с sophist.hse.ru, может пригодиться пакет sophisthse для R 🙂

Для data.mos.ru есть пакет datamos

А данные с finam.ru можно скачать с помощью пакета rusquant

Всем добра!

Art of R — обзор новостей из мира R

11.10.2014

Учёные используют R чтобы… отследить сезонность в перемещениях ураганов, а затем и предсказать их следующее появление! Для этого им понадобился пакет maps и немного данных. Это прекрасный пример визуализации событий на картах с помощью R, а ведь ещё можно не только окрашивать в цвета регионы по интенсивности признака, но и, например, анализировать преступность.

Пользователи R часто сталкиваются с проблемой с публикацией исполняемого кода графиков, особенно интерактивных. Так, до недавнего времени, легко вывесить в Интернет интерактивку из R Shiny можно было только через Linux. Теперь появился сервис plotly, позволяющий публиковать графики, интерактивные модели и презентации вместе с кодом и данными, по которым они строятся. Кстати, делать презентации в R c помощью Slidify просто, а результат поражает своей красотой.

Обилие команд R порой приводит к тому, что бывает трудно вспомнить их в нужный момент. Чтобы нужные команды всегда были под рукой, ребята из RDataMining.com сделали полезную шпаргалку, в которую не только удобно, но и приятно заглядывать. А если Вы увлекаетесь Data Mining, то обязательно посетите их сайт, который посвящён широкому кругу задач от классификации и кластеризации до анализа временных рядов и Big Data их реализации в R.

В Вышке прошёл семинар по TraMineR  — пакет для анализа последовательностей.  С его помощью можно, например, выявить наиболее частые карьерные треки индивидов, построить таблицу вероятностей и стоимостей перехода из одной группы в другую, сделать кластеризацию, и конечно же, построить красивые графики. Основные методы можно посмотреть в презентации семинара.

И, в завершение, ещё 14 причин, почему лучше использовать R, а не, например, Excel.

User, use R!

Пара статей со slate.com

21.02.2013

Открытые данные по убийствам из огнестрельного оружия (дата, возраст, пол, что-то еще)

Забавное равновесие Нэша в самолёте с опускающимися спинками сидений

Сумма джек-пота и объем продаж лотерейных билетов

01.04.2012

Данные по сумме джек-пота и объему продаж лотерейных билетов в Америке.

Необычные наборы данных…

01.10.2011

Рождаемость по дням года, США, 1978

Лекции по анализу панельных данных

21.09.2011

Экономический журнал ВШЭ, 2006: номер 2, номер 3, номер 4

Анализ панельных данных в пакете Stata (методические указания)

Про корреляцию и причинность…

09.09.2011