Anacondaはインストールできましたでしょうか? インスールできたら、(Windowsなら)スタートメニューから、"jupyter notebook"を選べば、ブラウザベースで動く、Pythonのインターフェースが起ち上がるはずです。この"jupyter notebook"が、Pythonで統計解析するためのインターフェースになります。なかなかよくできています。
さて、Pythonでいじくるデータをまずは用意しないといけません。流行りのビットコインの価格を分析することにします。ビットコインの日足データは、このサイトで手に入ります。データソースや信頼性はよくわかりませんが、とりあえずはこのデータで遊んでみましょう。
●CryptoCurrency Market Capitalizations: Historical data for Bitcoin
https://coinmarketcap.com/currencies/bitcoin/historical-data/
まずは、テキストエディタやエクセルなんかを使って、泥臭くCSVファイルを作ってください。データ分析の基本ですね。こういう手作業からはじまります。
それで、jupyter notebookを使って、CSVファイルを読み込み、いろいろ解析しましょう。
データを読み込んで、Close価格でチャートを描くまでの流れが以下です。
まず、In[1]はおまじないです。
numpyというのは数値計算のライブラリ、pandasはエクセルのテーブルのようなデータを扱うためのものです。そして、matplotlibというのがグラフを描くためのライブラリです。
CSVファイルは、このように一発で読み込めます。
.head(5)というのは、最初の5行を表示せよ、という意味です。
次のコマンドはちょっと難しいですが、日付をこのデータフレームのインデックスにしています。
さらに、今回は価格だけをとりあえず分析するので、"Close"だけにします。
最後に、チャートはこんなに簡単に描画できます。
.shift()で、一行ずらすことができます。あとで、日次リターンを計算する時に使います。
さて、Pythonでいじくるデータをまずは用意しないといけません。流行りのビットコインの価格を分析することにします。ビットコインの日足データは、このサイトで手に入ります。データソースや信頼性はよくわかりませんが、とりあえずはこのデータで遊んでみましょう。
●CryptoCurrency Market Capitalizations: Historical data for Bitcoin
https://coinmarketcap.com/currencies/bitcoin/historical-data/
まずは、テキストエディタやエクセルなんかを使って、泥臭くCSVファイルを作ってください。データ分析の基本ですね。こういう手作業からはじまります。
それで、jupyter notebookを使って、CSVファイルを読み込み、いろいろ解析しましょう。
データを読み込んで、Close価格でチャートを描くまでの流れが以下です。
まず、In[1]はおまじないです。
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
%matplotlib inline
numpyというのは数値計算のライブラリ、pandasはエクセルのテーブルのようなデータを扱うためのものです。そして、matplotlibというのがグラフを描くためのライブラリです。
CSVファイルは、このように一発で読み込めます。
btc_df=pd.read_csv("BTCUSDdata.csv")
.head(5)というのは、最初の5行を表示せよ、という意味です。
次のコマンドはちょっと難しいですが、日付をこのデータフレームのインデックスにしています。
btc_df=pd.read_csv("BTCUSDdata.csv", index_col="Date", parse_dates=True)
さらに、今回は価格だけをとりあえず分析するので、"Close"だけにします。
btc_cls_df = btc_df["Close"]
最後に、チャートはこんなに簡単に描画できます。
btc_cls_df.plot()
.shift()で、一行ずらすことができます。あとで、日次リターンを計算する時に使います。