Математическая статистика и анализ данных на языке R
В рамках данного курса изучаются основные понятия и методы математической статистики, их реализация на языке R, у студентов формируются навыки статистической обработки данных, решения статистических задач интерпретации физического эксперимента, освоения основных инструментов статистического анализа и элементов data mining.
Рассматриваются такие понятия, как эмпирические характеристики, точечные и интервальные оценки параметров выборки, несмещенные, состоятельные, оптимальные и эффективны оценки, достаточные, полные статистики и др. Решаются задачи определения оценок параметров распределения и вида закона распределения, проверки статистических гипотез, непараметрического оценивания, линейного регрессионного анализа.
Курс предназначен для реализации решения задач статистического анализа данных на языке R. R-свободная среда вычислений с открытым исходным кодом в рамках проекта GNU. Что примечательно, язык R разработан математиками, специалистами в области статистики, сотрудниками статистического факультета Оклендского университета Робертом Джентльменом (Robert Gentleman) и Россом Айхэкой (Ross Ihaka). R широко используется как в академической среде для решения научно-исследовательских задач, так и специалистами в области больших данных, язык активно развивается. На сегодняшний день в репозитории CRAN (библиотеке) собраны более 11778 пакетов, в которых пользователю предлагается удобный функционал для решения задач статистического анализа. R фактически является стандартом для статистических программ, обладает обширными графическими возможностями для визуального исследования и представления данных.