Анализ данных (Программная инженерия)/Установка и настройка Python
Содержание
Windows
Установка готового пакета
Можно отдельно установить Python и все необходимые библиотеки и надстройки, однако это слишком долго. Поэтому воспользуемся уже собранным пакетом Python(X,Y).
- Загрузим Python(X,Y): страница загрузки, из раздела Current release.
- Установим его, причем обязательно не забыв поставить галочку для установки всех плагинов в Python(X,Y).
- Все готово.
По непонятным причинам в некоторых случаях установка происходит довольно криво. Попробуйте выполнить следующие команды в своем Python:
- import numpy
- numpy.test()
Юнит-тесты могут сразу показать, все ли хорошо. Аналогично их стоит запустить для библиотек pandas, pylab, sklearn. Если вдруг вываливается ошибка, то можно попробовать установить Python и библиотеки другим способом.
Установку вручную
Минимальный набор для работы:
- Python 2.7
- IPython Notebook
- NumPy
- Matplotlib
- Pandas
- SciKit-Learn
Лучше ставить 32-битные версии, поскольку 64-битные не всегда работают корректно под Windows. Обратите внимание, что некоторые библиотеки будут иметь дополнительные зависимости в виде других библиотек, их тоже придется поставить.
Запуск IPython Notebook
Попробуем запустить IPython Notebook. Для этого запустим командную строку (нажать win+R и ввести cmd), и введем ipython notebook --pylab inline. Должен открыться браузер с запущенным из текущей директории IPython Notebook. Все ноутбуки будут сохраняться в текущую директорию, из которой был вызван IPython Notebook.
Mac OS X
Если у вас нет питона, то придется поставить brew с вытекающей от туда установкой Xcode. Следуйте указаниям с сайта Homebrew и у вас все получится. Устанавливаем свежую версию Python и virtualenv:
- brew install python --with-brewed-openssl
Устанавливаем фортран (нужен для сборки NumPy и SciPy):
- brew install gcc pkg-config freetype
Создаем виртуальное окружение:
- pip install virtualenv
- virtualenv shad-env
- source shad-env/bin/activate
Устанавливаем необходимые пакеты питона:
- pip install ipython[notebook] numpy scipy pandas scikit-learn matplotlib
Linux
Для сохранения здоровья, используйте Ubuntu 12.04 LTS или выше. Устанавливаем необходимые тулзы для Python:
- sudo apt-get install python-pip python-dev python-virtualenv build-essential
Устанавливаем пакеты, необходимые для сборки NumPy, SciPy и Matplotlib:
- sudo apt-get install libatlas-base-dev gfortran
- sudo apt-get build-dep python-matplotlib
Создаем виртуальное окружение питона (virtualenv).
- virtualenv shad-env
- source shad-env/bin/activate
Ставим необходимые для курса пакеты:
- pip install ipython[notebook] numpy scipy pandas matplotlib scikit-learn
Почему не сделать apt-get install Вы можете сделать что-то вроде
- sudo apt-get install ipython-notebook python-numpy python-scipy python-pandas python-matplotlib
и установить питоновские пакеты в систему из репозитория Debian. Однако, пакеты debian содержат достаточно старые версии python-пакетов (к примеру, IPython Notebook у вас будет значительно менее модный). Свежие версии загружаются утилитой pip из репозитория PyPI.