Основы программирования на языке R
Development | Комментировать запись
Сегодня R — один из самых популярных скриптовых языков для статистического программирования. Спрос на R-программистов постоянно растет с начала 2010-х годов, и R по-прежнему пользуется статусом языка программирования, предназначенного для специалистов по данным.
Кроме того, в наши дни язык R был адаптирован для глубокого обучения, благодаря чему несколько статистиков смогли легко освоить глубокое обучение в своих областях, что сделало R незаменимой частью текущего развития ИИ.
Читайте также: Как установить язык R на удаленный сервер
История создания языка R
Языку R предшествовал язык под названием S (где S означает statistics, статистика), разработанный AT&T специально для выполнения статистических вычислений. AT&T начала работу над S в 1976 году, и этот язык был частью ее внутренней среды статистического анализа, ранее реализованной в виде библиотек FORTRAN.
Язык S был придуман Джоном Чемберсом. На выбор однобуквенного имени разработчиков вдохновил широко распространенный на то время язык программирования C.
Разработали язык R Росс Ихака и Росс Джентльмен. Это произошло в рамках проекта, задуманного в 1992 году в Оклендском университете в Новой Зеландии. Первая версия была выпущена в 1995 году, а первая стабильная бета-версия появилась в 2000 году.
Изначально R отличался от S тем, что поверх существующих функций S добавлял семантику лексической области действия. Однобуквенное имя R было теперь вдохновлено языком-предшественником S, но в этот раз дял названия взяли первую букву имен обоих авторов.
R был разработан под общедоступной лицензией GNU и свободно распространяется.
Позже корпорация TIBCO, которая купила язык программирования S у AT&T, преобразовала его в S-plus, добавив некоторые расширенные аналитические функции и возможности ООП.
Особенности программирования на R
- Независимость от платформы: данный язык работает на нескольких вычислительных платформах, таких как Windows, Linux и Mac OS.
- Портативность: он легко запускается на мобильных устройствах, планшетах и игровых консолях.
- Частые обновления: благодаря этому разработчики своевременно исправляют ошибки.
- Превосходная графика: язык совместим с графическими библиотеками, такими как ggplot2 и plotly, что обеспечивает качественную визуализацию.
- Универсальность: ежедневно сообщество разрабатывает и улучшает сотни пакетов для тех или иных целей.
Преимущества программирования на R
R по-прежнему остается более широко используемым языком статистического программирования по сравнению с S и S-plus, и это неудивительно, ведь он имеет много достоинств и преимуществ.
- R был разработан с целью создать реализацию S с открытым исходным кодом, поэтому R всегда будет оставаться открытым программным обеспечением.
- С R работают тысячи профессиональных ученых и статистиков, которые постоянно совершенствуют его.
- R совместим с Windows, Mac и Linux. Он работает практически везде и не занимает много места.
- Помимо функций статистической обработки, R также можно использовать в качестве общего языка программирования с возможностями функционального и объектно-ориентированного программирования.
- Благодаря поддержке ggplot2 и plotly R обладает гораздо более высококачественными возможностями визуализации по сравнению с некоторыми коммерческими продуктами.
- Графика, предоставляемая R, красивее по сравнению с другими языками и высоко ценится экспертами во всем мире.
- Изначально R не поставляется с графическим пользовательским интерфейсом. В качестве входных данных он принимает только команды, что позволяет легко сохранять их в виде сценариев и переносить их между доменами.
- Сеансами R можно эффективно управлять. История команд и данные сохраняются между сеансами, поэтому вы можете без особых хлопот продолжить работу с того места, где остановились.
- R поддерживается широким онлайн-сообществом разработчиков.
Недостатки R
R считается наименее критикуемым языком программирования. Однако, несмотря на все свои преимущества, R, как и любой другой язык, далек от совершенства. Прежде чем погрузиться в изучение R, полезно также помнить о недостатках этого языка.
- Слишком резкая кривая обучения: R — непростой язык. Новичкам трудно освоить его из-за интерфейса командной строки. Кроме того, широкий выбор пакетов может сначала сбить с толку. Такие IDE, как RStudio, в некоторой степени помогают смягчить этот недостаток.
- Высокие требования к физической памяти: в отличие от своего конкурента Python, R хранит все данные в физической памяти. Это затрудняет обработку огромных наборов данных. К счастью, в наши дни интегрировать Hadoop в R стало значительно проще, что в сильно упростило проблему.
- Медленное выполнение: код R требует значительной оптимизации, прежде чем он сможет работать так же быстро, как в MATLAB или Python. Чтобы избежать медленного выполнения, при разработке программы необходимо иметь глубокое понимание внутренней работы объектов.
Доступность языка R
R доступен как среда интерфейса командной строки в проекте CRAN (данная аббревиатура расшифровывается как Comprehensive R Archive Network). Однако новичкам проще начинать работу с помощью IDE, которых для R разработано довольно много.
- RStudio: самая популярная среда IDE для начала работы с R. Доступна как настольная, так и корпоративная ее версии.
- StatET: основанная на Eclipse IDE-среда для программирования R и сборки пакетов.
- ESS-R: R также поддерживает несколько статистических пакетов, таких как S-Plus, SAS, Stata и OpenBUGS/JAGS.