На сайте Kaggle есть открытые данные, на которых можно попрактиваться 🙂
Posts Tagged ‘datasets’
Kaggle Datasets
14.09.2016Российские данные в R!
08.11.2014Тем, кто хочет автоматически скачивать временные ряды с sophist.hse.ru, может пригодиться пакет sophisthse для R 🙂
Для data.mos.ru есть пакет datamos
А данные с finam.ru можно скачать с помощью пакета rusquant
Всем добра!
Art of R — обзор новостей из мира R
11.10.2014Учёные используют R чтобы… отследить сезонность в перемещениях ураганов, а затем и предсказать их следующее появление! Для этого им понадобился пакет maps и немного данных. Это прекрасный пример визуализации событий на картах с помощью R, а ведь ещё можно не только окрашивать в цвета регионы по интенсивности признака, но и, например, анализировать преступность.
Пользователи R часто сталкиваются с проблемой с публикацией исполняемого кода графиков, особенно интерактивных. Так, до недавнего времени, легко вывесить в Интернет интерактивку из R Shiny можно было только через Linux. Теперь появился сервис plotly, позволяющий публиковать графики, интерактивные модели и презентации вместе с кодом и данными, по которым они строятся. Кстати, делать презентации в R c помощью Slidify просто, а результат поражает своей красотой.
Обилие команд R порой приводит к тому, что бывает трудно вспомнить их в нужный момент. Чтобы нужные команды всегда были под рукой, ребята из RDataMining.com сделали полезную шпаргалку, в которую не только удобно, но и приятно заглядывать. А если Вы увлекаетесь Data Mining, то обязательно посетите их сайт, который посвящён широкому кругу задач от классификации и кластеризации до анализа временных рядов и Big Data их реализации в R.
В Вышке прошёл семинар по TraMineR — пакет для анализа последовательностей. С его помощью можно, например, выявить наиболее частые карьерные треки индивидов, построить таблицу вероятностей и стоимостей перехода из одной группы в другую, сделать кластеризацию, и конечно же, построить красивые графики. Основные методы можно посмотреть в презентации семинара.
И, в завершение, ещё 14 причин, почему лучше использовать R, а не, например, Excel.
User, use R!
Пара статей со slate.com
21.02.2013Открытые данные по убийствам из огнестрельного оружия (дата, возраст, пол, что-то еще)
Забавное равновесие Нэша в самолёте с опускающимися спинками сидений
Сумма джек-пота и объем продаж лотерейных билетов
01.04.2012Данные по сумме джек-пота и объему продаж лотерейных билетов в Америке.
Необычные наборы данных…
01.10.2011Рождаемость по дням года, США, 1978
Лекции по анализу панельных данных
21.09.2011Экономический журнал ВШЭ, 2006: номер 2, номер 3, номер 4
Анализ панельных данных в пакете Stata (методические указания)