アドホック分析環境とは?
ビッグデータ分析におけるアドホック分析では、
今回と次回で、
JupyterとPandasとは?
Jupyterは、
Pandasは、
各種ツールのインストール
利用環境
- Ubuntu 14.
04 - Python 3.
4 - Pandas (0.
16. 2) - Jupyter (Jupyterhub 0.
2.0)
Python3のインストール
Ubuntu14.
$ sudo apt-get update $ sudo apt-get upgrade $ sudo apt-get install git gcc g++ make openssl libssl-dev libbz2-dev libreadline-dev libsqlite3-dev python-dev libmysqlclient-dev
$ cd /usr/local/ $ git clone git://github.com/yyuu/pyenv.git ./pyenv $ mkdir -p ./pyenv/versions ./pyenv/shims $ echo 'export PYENV_ROOT="/usr/local/pyenv"' | sudo tee -a /etc/profile.d/pyenv.sh $ echo 'export PATH="${PYENV_ROOT}/shims:${PYENV_ROOT}/bin:${PATH}"' | sudo tee -a /etc/profile.d/pyenv.sh $ source /etc/profile.d/pyenv.sh $ sudo visudo #Defaults secure_path="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin" Defaults env_keep += "PATH" Defaults env_keep += "PYENV_ROOT" $ pyenv install -v 3.4.3 $ pyenv global 3.4.3 $ pyenv rehash
$ pip install --upgrade pip $ pip install pandas
$ apt-get install npm nodejs-legacy $ npm install -g configurable-http-proxy $ pip install zmq jsonschema # 可視化用ライブラリ $ apt-get build-dep python-matplotlib $ pip install matplotlib # MySQL接続用ライブラリ $ pip install mysqlclient ipython-sql $ pip install ipython[notebook] jupyterhub $ passwd ubuntu $ jupyterhub
※今回は複数のユーザの利用を想定してJupyterhubというマルチクライアント用のツールを使いました。しかし一人で利用するケースでは、
さて、
http://'IP address':8000/
data:image/s3,"s3://crabby-images/893bb/893bb11c08a68dc553be48be06a2cc3430541488" alt="図1 ログイン画面 図1 ログイン画面"
ユーザの認証は、
data:image/s3,"s3://crabby-images/bcec0/bcec027d88c1c49cdd22a431e3e8c1b518505ef5" alt="図2 Top画面 図2 Top画面"
Jupyterの基本的な使い方
“Hello World”してみる
トップ画面で、
とりえあず、Shift+Enter
で実行できます。
print('Hello World!')
data:image/s3,"s3://crabby-images/584e9/584e92f4a2f8dd65286faa86aa9fb48ecf2de7a0" alt="図3 helloworld 図3 helloworld"
Pythonが実行できることを確認できましたね。
このNotebookでの作業内容は .ipynb という拡張子を持つファイルに自動で保存されます。
また、
%matplotlib inline
そして、
import matplotlib.pyplot as plt plt.plot(range(100))
data:image/s3,"s3://crabby-images/a81af/a81af0bdd1ccc61b6d45d93ba7c25b27afa7997e" alt="図4 visualize 図4 visualize"
このように%
を先頭に付けることで、!
を付与すると、
この他、
data:image/s3,"s3://crabby-images/02833/02833affb7a62d51f1bf3bf41fc34b3fbbe40f87" alt="図5 markdown 図5 markdown"
また、
data:image/s3,"s3://crabby-images/727b4/727b4c1a2f49c06533bfb39765b68a57fc155b7c" alt="図6 github 図6 github"
Jupyterまとめ
今回はJupyterのインストールと起動、
次回は、