bigdata project

19.04.2015 by

Вакансии для тех, кто освоил магию R :)

Рассадка на контрольную по ТВМС

03.04.2015 by

В приложенном файле находится поименная рассадка на контрольную работу по Теории вероятностей и Математической статистике План рассадки кр3

Мир R: обзор последних событий

30.03.2015 by

Доброго времени суток всем любителям R!

Пришла пора и мне вновь поделиться свежей порцией новостей мира R.

Начну с того, что на днях открыла для себя новый пакет leaflet. Автор данного поста об этом пакете на r-bloggers.com подошел к вопросу иллюстрации применения leaflet нестандартно: он решил обозначить на карте Лондона очаги эпидемии холеры в 1854 году, опираясь на данные John Snow`s Cholera data. Результат наглядно показал, что данный пакет отлично подходит для работы с картами, если нужно выделить какую-либо область на ней или же произвести расстановку точечных объектов. Более подробный код и результат можно найти здесь.

Несомненно, популярность R растет с каждым годом. Но задумывались ли вы когда-либо о том, насколько популярны различные пакеты программирования среди исследователей и как оценить и сравнить этот показатель от пакета к пакету? Данный пост наглядно демонстрирует ряд любопытных фактов. Во-первых, удивительно, но в 2014 году SPSS уверенно занимает первое место по количеству статей, приходящихся на данный пакет. За ним идут SAS и MATLAB. R немного отстает от MATLAB, занимая четвертое место в топе. При этом статистика показывает, что популярность R растет плавно, в то время как количество статей, использующих SPSS и SAS резко упало за последние 10 лет и продолжает следовать нисходящему тренду.

R пригодится и любителям мира финансов. С помощью пакета quantmod один из юзеров выгрузил ежедневные котировки компаний, которые входят в перечень NASDAQ 100, и измерил расстояние между офисами этих компаний и провел визуализацию полученных результатов. Оказалось, что в целом чем ближе компании друг к другу, тем более скоррелировано поведение их акций. Заинтригованы? Еще больше интересных фактов по теме здесь.

Надеюсь, вам понравилось. До новых встреч на Pokrovka11!

Ваша Юля.

Рекомендация по подготовке к КР № 3 по эконометрике-2

20.03.2015 by

КОНСУЛЬТАЦИЯ ПЕРЕД КОНТРОЛЬНОЙ РАБОТОЙ.

Пятница, 27 марта, ауд. 5214

ВНИМАНИЕ!!! ВРЕМЯ КОНСУЛЬТАЦИИ ИЗМЕНИЛОСЬ!!!

c 13:40 до 16:30 — Борзых (темы, кроме эндогенности)

с 16:40 — Башина (темы, кроме GARCH)

Ориентировочный список тем

Метод максимального правдоподобия
Логарифмическая функция правдоподобия
Информационная матрица Фишера
Тест отношения правдоподобия
Тест Вальда
Тест множителей Лагранжа
Logit- и probit-модель: оценки параметров методом максимального правдоподобия, тест отношения правдоподобия, тест Вальда, тест множителей Лагранжа, расчет предельного эффекта
ARMA-модели: слабая стационарность ARMA-процессов, тест Дики-Фуллера, интегрированный процесс, коинтеграция, процесс белого шума, процесс случаного блуждания, автокорреляционная (ACF) и частная автокорреляционная функции (PACF)
GARCH-модели: прогнозирование волатильности при помощи GARCH-моделей, вывод функции правдоподобия для GARCH-моделей, нахождение условных математических ожиданий и условных дисперсий различных компонент GARCH-модели

Динамические модели. Краткосрочное и долгосрочное воздействие.

Эндогенность. Причины. Последствия. Способы оценивания. Инструментальные переменные. Релевантность и валидность. Слабые инструменты. Тест Хансена.
Это ещё не все; список будет пополняться…

Литература
Магнус, Катышев, Пересецкий — раздел про временные ряды и logit- и probit-модели
Доугерти — раздел про временные ряды и logit- и probit-модели
Задачник по эконометрике Борзых Д. А. Часть 9, примеры 1–5
Презентация Борзых Д. А. по GARCH-моделям
Задачи к экзамену по теме GARCH-модели
Контрольная работа № 3 прошлого года

Канторович Г.Г. Лекции: Анализ временных рядов // Экономический журнал ВШЭ, 6(1-4), 7(1), 2002, 2003

Enders W. Applied Econometric Times Series, 3rd edition – John Wiley and Sons, 2009

Wooldridge J.M. Econometric Analysis of Cross Section and Panel Data

Wooldridge J.M. Introductory Econometric

Art of R — обзор мира R

15.03.2015 by

Учёные используют R, чтобы… исследовать паттерны в доходностях по казначейским векселям США (T-bills). Учёные выяснили, что они цикличность доходностей может объясняться периодическими заседаниями Комитета по открытому рынку. Данные были собраны полностью через R, а затем к ним были применены широкие возможности  R по анализу финансовых данных. Это пример ещё раз показывает, что использование R пригодится исследователям в самых различных областях — от финансов до психологии.

При  выполнении долгих вычислений бывает полезно знать, какую часть работы R уже сделал, а какую — нет. С помощью этого поста вы сможете сделать лёгкую полосу прогресса в форме диалогового окна для Вашего процесса и будете точно знать, когда самое время для того, чтобы сделать себе чай, в то время, когда Ваш R что-то считает.

Нужно построить много красивых графиков быстро? Пакет sjPlot, который недавно получил обновление, поможет в этом! Пакет помогает быстро построить опрятные графики, и не требует добавления множества опций, как в пакете ggplot2.

Помните: R ещё и прекрасное средство для изменения формата хранения данных. Так, использование R, по мнению авторов этого поста, порой является чуть ли не единственным бесплатным средством для изменения формата баз данных.

User, use R!

R новости или еще пару слов о визуализации

12.03.2015 by

Не знаешь, как разбавить монотонный текст исследовательской или курсовой работы? Как увеличить объем, не увеличивая шрифт, или просто порадовать преподавателя? Правильно – красивые графики решат все вышеперечисленные проблемы.

Все еще используешь Excel? – Стыд и позор! R это то, что тебе нужно, он не просто удивляет – R поражает в самое сердце.

Мы уже не раз отмечали, как важно уметь визуализировать данные, что можно строить графики – червячки, графики – кружочки, рисовать карты. Но этот ресурс просто фантастика! Потому как здесь представлена огромная линейка всевозможных вариантов графического представления данных, от привычных гистограмм до 3D изображений, в том числе и 3D scatter-plot! (p.s. карты и графики – кружочки тоже имеются). Скачай библиотеку plotly и начинай творить! Другими словами, море удовольствия, и абсолютно бесплатно!

Более того, в весьма обширной документации ты найдешь не только графики, но и коды к ним, а все любители программировать могут делать все то же самое не только в R, но еще в Python, MATLAB, Javascript, Julia и JSON.

Если ты не знаком ни с одним языком программирования  – не беда, просто загружай данные в свой аккаунт и строй все, что твоей душе угодно. По сложности – как Excel, так что справиться должен каждый :)

42

Вот так, как всегда много важного и интересного на pokRovka11, и помните, R — интереснее, чем вам кажется! :)

А уже совсем скоро не пропусти выпуск новостей от самого Андрея З. !

Домашнее задание № 3 по эконометрике-2 (дневное отделение, группы Борзых Д. А.)

12.03.2015 by

УРАМ и ББД:
ecm_601_HW2_2_var_A

ФР1 и ФР2:
ecm_601_HW2_2_var_B

R-новости

03.03.2015 by

Признаю, что новогодние каникулы R-новостей затянулись, и спешу исправить всё свежим весенним обзором :)

Для тех, кто пока не знает, как начать, есть маленькая схемка, а также цикл заметок для новичков Beginner’s Guide to R с агиткой, первыми шагами и, что самое важное, множеством ссылок на полезные ресурсы.

Хотите прочесть пару слов об Америке? У автора этой статьи есть по паре для каждого штата, к тому же с помощью R их можно нарисовать на изображениях самих штатов.

Как выбирать топливо для автомобиля, если на вашем компьютере установлен R? Вот так!

Для любителей визуализации данных на этой неделе есть несколько рекомендаций о том, как изображать кластеры на графике и сделать крутую инфографику в R, а также пример использования карт: визуализация вспышки холеры в Лондоне в 1854 году с помощью Google Maps и OpenStreetMaps.

И напоследок просто восхитительная статья, о том, нужно ли соблюдать баланс классов в выборке для лучшей работы классификаторов. В качестве примера используются логистическая регрессия, SVM и Random Forest — супер!

Нужны храбрые воины!

03.03.2015 by

Ура! 24-26 апреля состоятся 4-ая универсиада по эконометрике. От факультета экономики нужен основной состав: 3 бойца (любого пола) и еще дополнительно 7 человек могут принять участие в индивидуальном зачете. Участвовать могут только студенты 3 и 4 курсов.

Посему: всех желающих участовать в основном составе/индивидуально приглашаю написать мне письмо (boris.demeshev at gmail.com) с темой «универсиада по эконометрике» и прийти лично в пятницу 6 марта в шесть вечера в 112. В письме укажите, пожалуйста, курс, оценку по метрике и в каком зачете хотите участвовать. Мы проведем отбор, пару тренировочных встреч, обсудим прошлогодние варианты.

Борис Демешев

Лекции по эконометрике-2 (раздел GARCH-модели)

25.02.2015 by

Борзых Д. А. прочитает три лекции по моделям с условной гетероскедастичностью (GARCH).

Лекция № 1: 27.02 (пятница), 12:10—13:30 (ауд. 5214)
Лекция № 2: 4.03 (среда), 10:30—11:50 (ауд. 5215)
Лекция № 3: 6.03 (пятница), 12:10—13:30 (ауд. 5214)

Материалы:
GARCH_presentation

ecm_601_exam_trial_var


Отслеживать

Get every new post delivered to your Inbox.

Join 68 other followers