Как подготовить сервер к машинному обучению
Python, VPS | Комментировать запись
В статье «Искусственный интеллект: общие положения» мы обсудили популярность и распространенность ИИ и машинного обучения.
Машинное обучение – это исследования в области информатики, искусственного интеллекта и статистики. В центре внимания машинного обучения – подготовка алгоритмов для изучения закономерностей и прогнозирования данных (что делает его чрезвычайно важным для бизнеса). Машинное обучение особенно ценно, потому что оно позволяет использовать компьютеры для автоматизации процессов принятия решений.
Данный мануал поможет вам подготовить свой сервер к машинному обучению. Вы узнаете, какие инструменты нужны для предварительной обработки, анализа и визуализации данных. Также мы рассмотрим несколько современных библиотек, которые помогут вам начать работу с машинным и глубинным обучением.
Инструменты для исследования данных
В исследовании данных вам понадобятся:
- Python 3.5: Готовый к производству язык программирования с сильным акцентом на машинное обучение; он предоставляет несколько полезных пакетов для вычислений и анализа данных.
- R: Популярный статистический язык, предоставляющий инструменты для построения графиков и статистики.
- Jupyter Notebook: Веб-приложение с открытым исходным кодом, которое предоставляет удобный интерфейс для интерактивного создания кода и вычислений.
Читайте также:
Инструменты глубинного обучения
Для глубинного обучения рекомендуется использовать следующие инструменты:
- Theano: Библиотека Python, которая позволяет эффективно и быстро вычислять многомерные массивы. Выпущенная в 2010 году учеными-исследователями из Монреаля, библиотека Theano является одной из старейших систем глубокого обучения, которые используются в настоящее время.
- TensorFlow: Библиотека глубинного обучения с открытым исходным кодом, выпущенная в 2015 году компанией Google. Это самый популярный репозиторий машинного обучения на GitHub.
- Keras: Библиотека, которая предоставляет упрощенный интерфейс к библиотекам TensorFlow и Theano. Keras – это модульная и расширяемая библиотека, которая позволяет быстро создавать прототипы.
- PyTorch: Еще одна библиотека глубинного обучения с открытым исходным кодом, которая часто используется в качестве альтернативы TensorFlow.
Также вам понадобятся такие библиотеки:
- pandas: Библиотека Python для обработки и анализа данных.
- scikit-learn: Библиотека Python, которая содержит множество традиционных инструментов для машинного обучения.
- spaCy и gensim: Популярные библиотеки Python, которые позволяют выполнять расширенные задачи обработки естественного языка.
- dplyr: библиотека R для обработки данных.
- ggplot2: библиотека R для визуализации данных.
- Shiny: фреймворк R для создания интерактивных панелей и приложений.
Читайте также:
- Использование пакета pandas в Python 3
- Создание машинно-обучаемого классификатора с помощью Scikit-learn в Python
- Установка сервера Shiny Server в Ubuntu 14.04
Другие требования
Работа с алгоритмами машинного и глубинного обучения может потребовать много памяти. Потому рекомендуется иметь не меньше 2 Гб свободной памяти.
Кроме того, вам может пригодиться частная сеть, поддержка IPv6 и резервное копирование данных. Также следует защитить сервер с помощью SSH-ключей.
Читайте также:
Дальнейшие действия
Теперь ваш сервер готов к машинному и глубинному обучению. Теперь вы можете:
- Узнать больше о кодировании на Python 3 и написать собственное приложение.
- Персонализировать свой сервер, добавив другие библиотеки машинного обучения. В этом вам помогут руководства Установка пакетов R с помощью devtools в Ubuntu 16.04 и Общие инструменты Python: использование virtualenv, установка пакетов с помощью pip и управление пакетами
- Поэкспериментировать с визуализацией временных рядов в Python 3
- Попробовать стилизовать изображения с помощью нейросети, Python3 и PyTorch