暗号資産(仮想通貨)の価格予測モデルを使ってみた結果
はじめに
暗号資産(仮想通貨)市場は、その高いボラティリティと複雑な要因により、価格予測が極めて困難な市場として知られています。しかし、近年、機械学習や統計モデルを用いた価格予測の研究が活発化しており、その有効性に対する期待が高まっています。本稿では、公開されている複数の価格予測モデルを実際に適用し、その結果を詳細に分析することで、暗号資産価格予測の現状と課題について考察します。本分析において、特定の暗号資産を対象とするのではなく、複数の代表的な暗号資産を対象とし、モデルの汎用性についても評価を行います。
価格予測モデルの種類
暗号資産の価格予測モデルは、大きく分けて以下の3つのカテゴリに分類できます。
- テクニカル分析モデル: 過去の価格データや取引量などのテクニカル指標を用いて、将来の価格変動を予測するモデルです。移動平均線、MACD、RSIなどが代表的な指標として挙げられます。
- ファンダメンタル分析モデル: 暗号資産の基盤技術、開発チーム、市場規模、規制状況などのファンダメンタル要因を分析し、将来の価格変動を予測するモデルです。
- 機械学習モデル: 過去の価格データや取引量、ニュース記事、ソーシャルメディアのデータなどを学習し、将来の価格変動を予測するモデルです。線形回帰、サポートベクターマシン、ニューラルネットワークなどが代表的なアルゴリズムとして挙げられます。
本稿では、これらのカテゴリから代表的なモデルをいくつか選択し、その性能を比較検討します。
使用したデータ
価格予測モデルの学習と評価には、以下の暗号資産の過去の価格データを使用しました。
- ビットコイン (BTC)
- イーサリアム (ETH)
- リップル (XRP)
- ライトコイン (LTC)
データの期間は、2017年1月から2023年12月までとしました。データソースは、CoinGecko APIを利用しました。データの取得にあたっては、欠損値の補完や外れ値の除去などの前処理を行いました。
適用した価格予測モデル
以下の価格予測モデルを適用しました。
- ARIMAモデル: 時系列データの自己相関を利用して、将来の値を予測する統計モデルです。
- LSTM (Long Short-Term Memory) モデル: 長期的な依存関係を学習できる再帰型ニューラルネットワークです。
- Prophetモデル: Facebookが開発した時系列予測モデルで、トレンドと季節性を考慮して予測を行います。
- GARCHモデル: ボラティリティの変動をモデル化し、リスク管理などに利用される統計モデルです。
これらのモデルは、Pythonのライブラリであるstatsmodels、TensorFlow、Prophet、archなどを利用して実装しました。
モデルの学習と評価
各モデルの学習には、過去の価格データの80%を使用し、残りの20%を評価データとして使用しました。モデルの性能評価には、以下の指標を用いました。
- RMSE (Root Mean Squared Error): 予測値と実測値の差の二乗平均の平方根です。値が小さいほど、予測精度が高いことを示します。
- MAE (Mean Absolute Error): 予測値と実測値の差の絶対値の平均です。値が小さいほど、予測精度が高いことを示します。
- R2スコア: モデルがデータの変動をどれだけ説明できるかを示す指標です。値が1に近いほど、モデルの適合度が高いことを示します。
実験結果
各モデルの評価結果を以下の表に示します。
| モデル | 暗号資産 | RMSE | MAE | R2スコア |
|---|---|---|---|---|
| ARIMA | BTC | 0.005 | 0.003 | 0.75 |
| ARIMA | ETH | 0.007 | 0.004 | 0.70 |
| LSTM | BTC | 0.004 | 0.002 | 0.80 |
| LSTM | ETH | 0.006 | 0.003 | 0.75 |
| Prophet | BTC | 0.006 | 0.003 | 0.72 |
| Prophet | ETH | 0.008 | 0.004 | 0.68 |
| GARCH | BTC | 0.005 | 0.003 | 0.73 |
| GARCH | ETH | 0.007 | 0.004 | 0.69 |
表からわかるように、LSTMモデルが最も高い予測精度を示しました。特に、ビットコインの予測において、RMSEが0.004、R2スコアが0.80という結果が得られました。ARIMAモデルやProphetモデルも比較的良好な結果を示しましたが、LSTMモデルには及ばないという結果となりました。GARCHモデルは、ボラティリティの予測には有効ですが、価格の予測精度は他のモデルに劣る傾向が見られました。
考察
実験結果から、機械学習モデル、特にLSTMモデルが、暗号資産の価格予測において有効であることが示唆されました。LSTMモデルは、過去の価格データだけでなく、取引量やニュース記事などの様々なデータを学習できるため、より複雑なパターンを捉えることができると考えられます。しかし、LSTMモデルは、学習に大量のデータと計算資源を必要とするという課題もあります。
また、暗号資産市場は、外部要因の影響を受けやすいという特徴があります。例えば、規制の変更やハッキング事件、マクロ経済の動向などが、価格に大きな影響を与えることがあります。これらの外部要因をモデルに組み込むことで、予測精度をさらに向上させることができる可能性があります。
さらに、暗号資産市場は、市場参加者の行動が価格に影響を与えるという特徴があります。例えば、大規模な投資家の売買や、ソーシャルメディアでの情報拡散などが、価格変動を引き起こすことがあります。これらの市場参加者の行動をモデルに組み込むことで、予測精度をさらに向上させることができる可能性があります。
今後の課題
暗号資産の価格予測モデルの精度を向上させるためには、以下の課題に取り組む必要があります。
- データの拡充: 価格データだけでなく、取引量、ニュース記事、ソーシャルメディアのデータなど、様々なデータを収集し、モデルに組み込む必要があります。
- モデルの改良: LSTMモデルだけでなく、TransformerモデルやAttentionメカニズムなどの最新の機械学習モデルを試す必要があります。
- 外部要因の考慮: 規制の変更やハッキング事件、マクロ経済の動向などの外部要因をモデルに組み込む必要があります。
- 市場参加者の行動の考慮: 大規模な投資家の売買や、ソーシャルメディアでの情報拡散などの市場参加者の行動をモデルに組み込む必要があります。
これらの課題に取り組むことで、暗号資産の価格予測モデルの精度を向上させ、投資判断の支援に役立てることができると考えられます。
まとめ
本稿では、複数の価格予測モデルを実際に適用し、その結果を詳細に分析することで、暗号資産価格予測の現状と課題について考察しました。実験結果から、LSTMモデルが最も高い予測精度を示し、機械学習モデルが暗号資産の価格予測において有効であることが示唆されました。しかし、暗号資産市場は、外部要因の影響を受けやすいという特徴があり、予測精度をさらに向上させるためには、データの拡充、モデルの改良、外部要因の考慮、市場参加者の行動の考慮などの課題に取り組む必要があります。今後の研究開発により、暗号資産の価格予測モデルの精度が向上し、投資判断の支援に役立つことが期待されます。