Анализ данных (Программная инженерия)/Установка и настройка Python

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Windows

Установка готового пакета

Можно отдельно установить Python и все необходимые библиотеки и надстройки, однако это слишком долго. Поэтому воспользуемся уже собранным пакетом Python(X,Y).

  1. Загрузим Python(X,Y): страница загрузки, из раздела Current release.
  2. Установим его, причем обязательно не забыв поставить галочку для установки всех плагинов в Python(X,Y).
  3. Все готово.

По непонятным причинам в некоторых случаях установка происходит довольно криво. Попробуйте выполнить следующие команды в своем Python:

import numpy
numpy.test()

Юнит-тесты могут сразу показать, все ли хорошо. Аналогично их стоит запустить для библиотек pandas, pylab, sklearn. Если вдруг вываливается ошибка, то можно попробовать установить Python и библиотеки другим способом.

Установку вручную

Минимальный набор для работы:

  • Python 2.7
  • IPython Notebook
  • NumPy
  • Matplotlib
  • Pandas
  • SciKit-Learn

Лучше ставить 32-битные версии, поскольку 64-битные не всегда работают корректно под Windows. Обратите внимание, что некоторые библиотеки будут иметь дополнительные зависимости в виде других библиотек, их тоже придется поставить.

Запуск IPython Notebook

Попробуем запустить IPython Notebook. Для этого запустим командную строку (нажать win+R и ввести cmd), и введем ipython notebook --pylab inline. Должен открыться браузер с запущенным из текущей директории IPython Notebook. Все ноутбуки будут сохраняться в текущую директорию, из которой был вызван IPython Notebook.

Mac OS X и Linux

Mac OS

Установка Python через brew

официального сайта Если у вас нет питона, то придется поставить brew с вытекающей от туда установкой Xcode. Следуйте указаниям с сайта Homebrew и у вас все получится. Устанавливаем свежую версию Python и virtualenv:

brew install python --with-brewed-openssl

Устанавливаем фортран (нужен для сборки NumPy и SciPy):

brew install gcc pkg-config freetype

Создаем виртуальное окружение:

pip install virtualenv
virtualenv shad-env
source shad-env/bin/activate

Устанавливаем необходимые пакеты питона:

pip install ipython[notebook] numpy scipy pandas scikit-learn matplotlib

Ручная установка Python

Можно попробовать поставить все вручную, список необходимых библиотек см. в разделе для Windows.

Сторонний туториал

Туториал.

Linux

Для сохранения здоровья, используйте Ubuntu 12.04 LTS или выше. Устанавливаем необходимые тулзы для Python:

sudo apt-get install python-pip python-dev python-virtualenv build-essential

Устанавливаем пакеты, необходимые для сборки NumPy, SciPy и Matplotlib:

sudo apt-get install libatlas-base-dev gfortran
sudo apt-get build-dep python-matplotlib

Создаем виртуальное окружение питона (virtualenv).

virtualenv shad-env
source shad-env/bin/activate 

Ставим необходимые для курса пакеты:

pip install ipython[notebook] numpy scipy pandas matplotlib scikit-learn 

Почему не сделать apt-get install Вы можете сделать что-то вроде

sudo apt-get install ipython-notebook python-numpy python-scipy python-pandas python-matplotlib

и установить питоновские пакеты в систему из репозитория Debian. Однако, пакеты debian содержат достаточно старые версии python-пакетов (к примеру, IPython Notebook у вас будет значительно менее модный). Свежие версии загружаются утилитой pip из репозитория PyPI.

Запуск IPython Notebook

Для того, чтобы графики встраивались в отчёт, а не открывались в отдельном окне, IPython Notebook нужно запускать следующим образом:

ipython notebook --pylab inline

Либо в уже запущенном Notebook выполнить

%pylab inline

Использование virtualenv

virtualenv позволяет заключить в отдельный каталог необходимые версии python-пакетов и использовать только их. Используя virtualenv, Вы можете устанавливать свежие версии пакетов из Python Package Index, при этом не получить проблем с несовместимостью версий пакетов с установленными в системе. Нормальным решением также является установка python-пакетов через pip в системные каталоги. Для этого не нужно ничего с virtualenv, но запускать pip при этом следует от рута:

sudo pip install ipython[notebook] numpy scipy pandas matplotlib scikit-learn

Но напоминаем, пакеты могут конфликтовать с системными, может фейлиться сборка, могут импортироваться старые версии и возникать другие проблемы... Для создания виртуального окружения необходимо сказать

virtualenv yourenv

при этом будет создан каталог yourenv с чистым окружением без каких либо пакетов. Для использования виртуального окружения можно использовать команды из соответствующего каталога:

yourenv/bin/python script.py
yourenv/bin/pip install ... # установка пакетов в виртуальное окружение
yourenv/bin/ipython

Для того чтобы не говорить префикс yourenv/bin, удобно в текущей сесии командной строки выставить необходимые переменные окружения (активировать виртуальное окружение):

source yourenv/bin/activate
(yourenv)$ pip install ... # установка пакетов в виртуальное окружение
(yourenv)$ ipython 

После активации, у приглашения командной строки появится префикс (yourenv). Для того, чтобы деактивировать виртуальное окружение, необходимо сказать

(yourenv)$ deactivate
python   # префикс пропал, python будет выполняться в системном окружении