Збір та аналіз даних

Опис

Основна мета цього курсу – освоїти інструменти для автоматичного збору даних (перш за все, на R і Python). Максим викладатиме першу половину курсу (з акцентом на R), починаючи з бізнес, економічного і фінансового застосування веб-скребінга разом з відповідними етичними міркуваннями. Потім ми вивчимо прості інструменти для збору та аналізу даних, які не вимагають навичок програмування: Excel, Power BI і OpenRefine. Нарешті, ми розглянемо автоматичний збір даних в R з численними застосуваннями.

 

Частина Python представить зручні інструменти для роботи зі складними структурами даних, які бувають різних форматів. Ми зосередимося на перевагах Beautiful soup. Ще однією ключовою особливістю, яка робить Python популярним серед вчених і практиків, є простий інструментарій для обробки природної мови.

 

Протягом всього курсу студент буде працювати в групах над своїми завданнями. Курс розширить знання R і Python, отримані на перших двох курсах в послідовності. Очікується, що студенти принесуть в клас ноутбук (так як більша частина навчального часу буде проводитися в «лабораторному» стилі) з усіма встановленими необхідними програмами.