Hello there, ('ω')ノ
🔧 ステップ1:Kaggleアカウントの作成
まずはKaggleのアカウントが必要です。まだ持っていない場合は、以下の手順で作成しましょう。
- Kaggle公式サイトにアクセス
- 右上の「Sign In」→「Sign up」からアカウント作成
- Googleアカウントやメールアドレスで登録できます
📂 ステップ2:コンペティションページにアクセス
次に、以下のページにアクセスします:
👉 House Prices: Advanced Regression Techniques
このページでは、コンペの概要・評価方法・提出方法・データの詳細などが確認できます。
📦 ステップ3:データのダウンロード(Kaggle Notebookを使う方法)
Kaggleでは、ノートブック上で直接データを読み込むことができるので、ローカル環境にダウンロードしなくてもOKです。
✅ 方法1:Kaggleノートブックを新規作成
- コンペページの「Code」タブをクリック
- 「New Notebook(新しいノートブック)」をクリック
- 新規ノートブックが開いたら、以下のコードをセルに入力して実行します:
import pandas as pd # データの読み込み train_df = pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/train.csv") test_df = pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/test.csv") # データの表示(確認用) train_df.head()
ノートブック内では、/kaggle/input/... のパスを使うことで、Kaggleが提供するデータセットにアクセスできます。
💡 補足:データセットの構成
このコンペティションのデータセットには以下のファイルが含まれています:
train.csv:訓練データ(住宅の特徴と価格が含まれる)test.csv:テストデータ(特徴のみ。価格は含まれていない)data_description.txt:各カラム(特徴量)の説明sample_submission.csv:提出用のサンプルファイル
💻 ローカル環境で作業したい場合
もしKaggleではなく自分のPCで作業したい場合は、以下の手順でデータをダウンロードします:
- コンペページ上部の「Data」タブをクリック
- 「Download All」ボタンを押してZIPファイルを保存
- 解凍して
train.csvなどのファイルを確認
Pythonで読み込むには以下のようにします:
import pandas as pd train_df = pd.read_csv("パス/train.csv") test_df = pd.read_csv("パス/test.csv")
✨ まとめ
| ステップ | 内容 |
|---|---|
| 1 | Kaggleアカウントを作成 |
| 2 | コンペページにアクセス |
| 3 | ノートブックで新規作成 |
| 4 | /kaggle/input/パスからデータを読み込む |
| 5 | 必要に応じてローカル環境でも利用可能 |
Best regards, (^^ゞ