Установка R и R-studio на Linux
В качестве облачного сервиса, предоставляющего услуги по хостингу виртуальных машин мы выберем Google Cloud Platform с сервисом Compute Engine. Это очень удобное решение для тех, кто уже работает с другими сервисами от GCP.
Ранее я уже писал о том, как настроить и запустить VM на Google Cloud Platform через сервис Compute Engine. А сейчас перейдём к следующему шагу
Подготовка к установке
Для установки языка R в операционную систему Linux нам необходимо открыть терминал и вводить команды напрямую. Чтобы открыть терминал необходимо нажать на кнопку SSH.
Терминал откроется в новом окне. После открытия терминала начинаем последовательно вводить команды
Первичное обновление Linux
Необходимо обновить все пакеты, установленные в версии Ubuntu 16.04
sudo apt-get update
Выглядит это примерно так
Добавление ссылки на репозиторий Cran
Установка будет производиться напрямую из репозитория Cran, поэтому необходимо добавить ссылку в файл /etc/apt/sources.list. Редактировать файл будем при помощи текстового редактора nano
sudo nano /etc/apt/sources.list
Откроется содержимое файла. Спускаемся в самый низ и добавляем строчку
deb https://cran.rstudio.com/bin/linux/ubuntu xenial/
После этого нажимаем сочетание клавиш Ctrl+X для сохранения изменений. Нам предложат сохранить изменения — жмём Y
В последнем окне жмём Enter сохранения изменений в тот же файл.
Добавление публичного ключа
Ключ используется для удостоверения подлинности и надежности репозитория. И добавляется с помощью следующей команды:
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9
которая запрашивает ключ напрямую у сервера сертификации Ubuntu — keyserver.ubuntu.com
После чего обновляем кеш всех доступных пакетов
sudo apt update
Установка R и R-Studio
Установка R
Теперь можем установить необходимый нам пакет R с помощью команды:
sudo apt-get install r-base -y
Установка R-Studio
Помимо установки R, для удобства работы, нам нужно установить R Studio. И первым делом для этого нужно скачать установочный файл. Делаем это с помощью команды wget
wget https://download2.rstudio.org/rstudio-server-1.0.136-amd64.deb
Теперь, для того, чтобы провести установку R Studio, устанавливаем еще один пакет — gdebi. Gdebi — программа для установки .deb пакетов.
sudo apt-get install gdebi-core -y
И последней командой устанавливаем R Studio со скачанного файла:
sudo gdebi rstudio-server-1.0.136-amd64.deb
Теперь необходимо указать порт, при обращении к которому вы будете получать доступ в R Studio. Для этого нужно внести информацию в файл /etc/rstudio/rserver.conf. Делаем это с помощью команды
sudo nano /etc/rstudio/rserver.conf
и добавляем в файл следующую строку:
www-port=80
После этого задаем пароль для доступа в R Studio командой:
sudo passwd user_name
где, вместо user_name используем имя пользователя. При вводе пароля вам будет казаться, что ничего не происходит, но на самом деле введенные символы запоминаются. После второго успешного ввода вы увидите примерно следующее:
Осталось перезапустить серверный R-Studio и можно приступать к работе.
sudo service rstudio-server restart
Запуск R-Studio
Чтобы попасть в привычный интерфейс R-Studio нужно перейти по внешнему адресу, указанному в интерфейсе Compute Engine в колонке External_IP
При переходе вы скорее всего увидете ошибку:
Это происходит потому, что подключаемся мы по протоколу HTTPS через порт 443, а наш R-server работает через протокол HTTP через порт 8080.
Удалите букву s в URL
И перед вами будет привычный интерфейс R-Studio с окошком для ввода логина и пароля.
Вводим логин/пароль и пользуемся R-Studio в облаке
Дополнительные материалы
- Запуск скриптов R по расписанию
- Установка R-Studio через Docker
- Установка R-Studio через Docker
Установка R и R Studio
Для анализа данных нам понадобятся бесплатные средства обработки данных — мы будем использовать R, R Studio и Python (Питон). Смотрим откуда их брать:
Искать
Недавнее
- Машинное обучение с Apache Spark
- MLOps подход
- ML-pipeline в Apache Spark MLLib
- Анализ данных социальных сетей: подходы и методы
- Сверточная нейросеть в браузере (на JavaScript)
Тематика
- A/B (7)
- Artificial Intelligence (11)
- BI (1)
- Big Data (30)
- Data Mining (12)
- Data Science (40)
- Data Scientist (34)
- Datasets (1)
- Deep Learning (13)
- IR (1)
- JS (2)
- Machine Learning (34)
- MapReduce (2)
- Notes17 (5)
- Project Management (7)
- Python (9)
- R (17)
- Social Media (2)
- Spark (4)
- Text (2)
- Text Mining (2)
- Алгоритмы (21)
- Анализ данных (16)
- Англ (33)
- Базы данных (5)
- Бизнес (25)
- Визуализация (6)
- Заметки (16)
- Инструменты (15)
- Инфографика (4)
- Исследования (10)
- Маркетинг (21)
- Методы (16)
- Нейросеть (18)
- Новости (6)
- Обзор (4)
- Операционная Аналитика (7)
- Рекомендательные системы (1)
- Статистика (17)
- Цифровая экономика (2)
Data Scientist # 1
Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning
Данные — новый актив!
Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.
Установка R в Ubuntu 20.04
Язык программирования с открытым исходным кодом R широко используется для выполнения анализа данных и статистических вычислений. Он поддерживается фондом R Foundation for Statistical Computing и становится все более популярным и расширяемым языком с активным сообществом разработчиков. R предлагает много сгенерированных пользователем пакетов для определенных областей исследований, что позволяет применять его в разных сферах.
В этом обучающем модуле мы выполним установку R и покажем, как добавлять пакеты из официальных архивов Comprehensive R Archive Network (CRAN).
Предварительные требования
Для прохождения этого обучающего модуля вам потребуется сервер Ubuntu 20.04, имеющий:
- не менее 1 Гбайт оперативной памяти
- пользователя без привилегий root с привилегиями sudo .
Чтобы выполнить необходимую настройку, воспользуйтесь нашим руководством по первоначальной настройке сервера.
После выполнения всех предварительных требований мы можем начинать.
Шаг 1 — Установка R
Поскольку проект R быстро развивается, в репозиториях Ubuntu не всегда доступна последняя стабильная версия. Поэтому мы начнем с добавления внешнего хранилища, обслуживаемого CRAN.
Примечание. CRAN хранит репозитории в своей сети, но не все внешние репозитории можно считать надежными. Установку следует выполнять только из доверенных источников.
Вначале добавим актуальный ключ GPG.
-
sudo apt-key adv —keyserver keyserver.ubuntu.com —recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9
При запуске этой команды мы получим следующий вывод:
OutputExecuting: /tmp/apt-key-gpghome.cul0ddtmN1/gpg.1.sh --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9 gpg: key 51716619E084DAB9: public key "Michael Rutter " imported gpg: Total number processed: 1 gpg: imported: 1
Получив надежный ключ, мы можем добавить репозиторий.
Если вы не используете версию 20.04, найдите подходящий репозиторий в списке R Project Ubuntu, где перечислены имена для каждого выпуска. Версия Ubuntu 20.04 имеет кодовое название Focal Fossa, а последняя версия R — это версия 4.0.0. Поэтому для нижеуказанного репозитория следует использовать правила обозначения имен — focal-cran40 .
-
sudo add-apt-repository ‘deb https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/’
Среди отображаемых данных найдите следующие строки:
Output. Get:7 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ InRelease [3622 B] Get:8 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ Packages [15.6 kB] .
Теперь нам нужно запустить обновление , чтобы добавить манифесты пакетов из нового репозитория.
Убедитесь, что одна из строк вывода выглядит примерно так:
Output. Hit:5 https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/ InRelease .
Если в результате выполнения команды update выводится строка, похожая на описанную выше, это означает, что мы успешно добавили репозиторий. Мы можем быть уверены, что не установим случайно более старую версию.
Теперь мы готовы к установке R с помощью следующей команды.
Введите в диалоге y для подтверждения установки.
На момент написания этого документа последней стабильной версией R от CRAN была версия 4.0.1. Номер версии отображается при запуске R.
Поскольку мы планируем установить пример пакета для каждого пользователя системы, мы запустим R от имени пользователя root, чтобы библиотеки были автоматически доступны всем пользователям. Если вы запустите команду R без привилегий sudo , для вашего пользователя можно будет настроить личную библиотеку.
Output R version 4.0.0 (2020-04-24) -- "Arbor Day" Copyright (C) 2020 The R Foundation for Statistical Computing Platform: x86_64-pc-linux-gnu (64-bit) . Type 'demo()' for some demos, 'help()' for on-line help, or 'help.start()' for an HTML browser interface to help. Type 'q()' to quit R. >
Это подтверждает, что мы успешно установили R и вошли в интерактивную оболочку.
Шаг 2 — Установка пакетов R от CRAN
Одно из преимуществ R — большое количество доступных дополнительных пакетов. Для демонстрационных целей мы установим библиотеку txtplot , которая выводит графики ASCII, включая элементы scatterplot, line plot, density plot, acf и bar chart:
Примечание. На следующем экране показано, где будет установлен пакет.
Output. Installing package into ‘/usr/local/lib/R/site-library’ (as ‘lib’ is unspecified) .
Этот глобальный путь доступен, поскольку мы запустили R от имени пользователя root. Это расположение делает пакет доступным для всех пользователей.
После завершения установки мы можем выполнить загрузку txtplot :
Если сообщений об ошибках нет, это означает, что библиотека успешно загружена. Рассмотрим на практике пример, демонстрирующий базовую функцию вывода графика с ярлыками осей. В примере, предоставленном пакетом R datasets , содержатся данные о скорости автомобилей и тормозном пути, основанные на материалах 1920-х годов:
Output +----+-----------+------------+-----------+-----------+--+ 120 + * + | | d 100 + * + i | * * | s 80 + * * + t | * * * * | a 60 + * * * * * + n | * * * * * | c 40 + * * * * * * * + e | * * * * * * * | 20 + * * * * * + | * * * | 0 +----+-----------+------------+-----------+-----------+--+ 5 10 15 20 25 speed
Если вы хотите узнать больше о txtplot , используйте команду help(txtplot) в интерпретаторе R.
Любой предварительно скомпилированный пакет можно установить из CRAN с помощью команды install.packages() . Чтобы узнать больше о доступных пакетах, воспользуйтесь официальным перечнем пакетов, отсортированных по имени, в списке Доступные пакеты CRAN по именам.
Для выхода изR введите q() . Нажмите n в диалоге, если не хотите сохранять образ рабочего пространства.
Заключение
После успешной установки R на сервере вас может заинтересовать руководство по установке RStudio Server, помогающее установить среду IDE для только что развернутой серверной системы. Также вы можете узнать больше о настройке сервера Shiny server для конвертации кода R в интерактивные веб-страницы.
Дополнительную информацию об установке пакетов R с помощью различных инструментов можно найти в указаниях по установке из GitHub, BitBucket или других репозиториев. Это позволит вам использовать последние наработки активного сообщества.
Thanks for learning with the DigitalOcean Community. Check out our offerings for compute, storage, networking, and managed databases.
Как установить RStudio в Windows и Linux?
Язык программирования R является бесплатной средой программирования, доступной под лицензией GNU, поддерживаемой сообществом R для статистических вычислений. Этот язык наиболее широко известен своими мощными возможностями статистического анализа и интерпретации данных.
Для использования языка R необходимо установить окружение R и IDE.
Зачем использовать RStudio?
Предоставляет инструменты, которые позволяют использовать скрипты, вывод, текст и изображения в отчетах, документах Word и даже в html-файлах.
Использование Shiny (открытого пакета R) позволяет создавать интерактивный контент в отчетах и презентациях.
Установка RStudio в Windows
Шаг №1: Сначала необходимо настроить окружение R на компьютере. Вы можете скачать его с r-project.org.
Шаг №2: После скачивания R для платформы Windows, запускаем установщик.
Шаг №3: Скачиваем RStudio со страницы официального сайта:
Шаг №4: После загрузки запускаем установщик и следуем шагам установки.
Шаг №5: Проверяем установку RStudio.
Попробуйте найти RStudio в строке поиска Windows:
Запускаем приложение и пишем в консоль: