Анализ данных (Программная инженерия)/Установка и настройка Python
Содержание
Windows
Установка готового пакета
Можно отдельно установить Python и все необходимые библиотеки и надстройки, однако это слишком долго. Поэтому воспользуемся уже собранным пакетом Python(X,Y).
- Загрузим Python(X,Y): страница загрузки, из раздела Current release.
- Установим его, причем обязательно не забыв поставить галочку для установки всех плагинов в Python(X,Y).
- Все готово.
По непонятным причинам в некоторых случаях установка происходит довольно криво. Попробуйте выполнить следующие команды в своем Python:
import numpy numpy.test()
Юнит-тесты могут сразу показать, все ли хорошо. Аналогично их стоит запустить для библиотек pandas, pylab, sklearn. Если вдруг вываливается ошибка, то можно попробовать установить Python и библиотеки другим способом.
Установку вручную
Минимальный набор для работы:
- Python 2.7
- IPython Notebook
- NumPy
- Matplotlib
- Pandas
- SciKit-Learn
Лучше ставить 32-битные версии, поскольку 64-битные не всегда работают корректно под Windows. Обратите внимание, что некоторые библиотеки будут иметь дополнительные зависимости в виде других библиотек, их тоже придется поставить.
Запуск IPython Notebook
Попробуем запустить IPython Notebook. Для этого запустим командную строку (нажать win+R и ввести cmd), и введем ipython notebook --pylab inline. Должен открыться браузер с запущенным из текущей директории IPython Notebook. Все ноутбуки будут сохраняться в текущую директорию, из которой был вызван IPython Notebook.
Mac OS X и Linux
Mac OS
Установка Python через brew
официального сайта Если у вас нет питона, то придется поставить brew с вытекающей от туда установкой Xcode. Следуйте указаниям с сайта Homebrew и у вас все получится. Устанавливаем свежую версию Python и virtualenv:
brew install python --with-brewed-openssl
Устанавливаем фортран (нужен для сборки NumPy и SciPy):
brew install gcc pkg-config freetype
Создаем виртуальное окружение:
pip install virtualenv virtualenv shad-env source shad-env/bin/activate
Устанавливаем необходимые пакеты питона:
pip install ipython[notebook] numpy scipy pandas scikit-learn matplotlib
Ручная установка Python
Можно попробовать поставить все вручную, список необходимых библиотек см. в разделе для Windows.
Сторонний туториал
Linux
Для сохранения здоровья, используйте Ubuntu 12.04 LTS или выше. Устанавливаем необходимые тулзы для Python:
sudo apt-get install python-pip python-dev python-virtualenv build-essential
Устанавливаем пакеты, необходимые для сборки NumPy, SciPy и Matplotlib:
sudo apt-get install libatlas-base-dev gfortran sudo apt-get build-dep python-matplotlib
Создаем виртуальное окружение питона (virtualenv).
virtualenv shad-env source shad-env/bin/activate
Ставим необходимые для курса пакеты:
pip install ipython[notebook] numpy scipy pandas matplotlib scikit-learn
Почему не сделать apt-get install Вы можете сделать что-то вроде
sudo apt-get install ipython-notebook python-numpy python-scipy python-pandas python-matplotlib
и установить питоновские пакеты в систему из репозитория Debian. Однако, пакеты debian содержат достаточно старые версии python-пакетов (к примеру, IPython Notebook у вас будет значительно менее модный). Свежие версии загружаются утилитой pip из репозитория PyPI.
Запуск IPython Notebook
Для того, чтобы графики встраивались в отчёт, а не открывались в отдельном окне, IPython Notebook нужно запускать следующим образом:
ipython notebook --pylab inline
Либо в уже запущенном Notebook выполнить
%pylab inline
Использование virtualenv
virtualenv позволяет заключить в отдельный каталог необходимые версии python-пакетов и использовать только их. Используя virtualenv, Вы можете устанавливать свежие версии пакетов из Python Package Index, при этом не получить проблем с несовместимостью версий пакетов с установленными в системе. Нормальным решением также является установка python-пакетов через pip в системные каталоги. Для этого не нужно ничего с virtualenv, но запускать pip при этом следует от рута:
sudo pip install ipython[notebook] numpy scipy pandas matplotlib scikit-learn
Но напоминаем, пакеты могут конфликтовать с системными, может фейлиться сборка, могут импортироваться старые версии и возникать другие проблемы... Для создания виртуального окружения необходимо сказать
virtualenv yourenv
при этом будет создан каталог yourenv с чистым окружением без каких либо пакетов. Для использования виртуального окружения можно использовать команды из соответствующего каталога:
yourenv/bin/python script.py yourenv/bin/pip install ... # установка пакетов в виртуальное окружение yourenv/bin/ipython
Для того чтобы не говорить префикс yourenv/bin, удобно в текущей сесии командной строки выставить необходимые переменные окружения (активировать виртуальное окружение):
source yourenv/bin/activate (yourenv)$ pip install ... # установка пакетов в виртуальное окружение (yourenv)$ ipython
После активации, у приглашения командной строки появится префикс (yourenv). Для того, чтобы деактивировать виртуальное окружение, необходимо сказать
(yourenv)$ deactivate python # префикс пропал, python будет выполняться в системном окружении