以下の内容はhttps://cysec148.hatenablog.com/entry/2025/10/07/061831より取得しました。


Kaggle上でデータセットを準備する手順

Hello there, ('ω')ノ

🔧 ステップ1:Kaggleアカウントの作成

まずはKaggleのアカウントが必要です。まだ持っていない場合は、以下の手順で作成しましょう。

  1. Kaggle公式サイトにアクセス
  2. 右上の「Sign In」→「Sign up」からアカウント作成
  3. Googleアカウントやメールアドレスで登録できます

📂 ステップ2:コンペティションページにアクセス

次に、以下のページにアクセスします:

👉 House Prices: Advanced Regression Techniques

このページでは、コンペの概要・評価方法・提出方法・データの詳細などが確認できます。


📦 ステップ3:データのダウンロード(Kaggle Notebookを使う方法)

Kaggleでは、ノートブック上で直接データを読み込むことができるので、ローカル環境にダウンロードしなくてもOKです。

✅ 方法1:Kaggleノートブックを新規作成

  1. コンペページの「Code」タブをクリック
  2. 「New Notebook(新しいノートブック)」をクリック
  3. 新規ノートブックが開いたら、以下のコードをセルに入力して実行します:
import pandas as pd

# データの読み込み
train_df = pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/train.csv")
test_df = pd.read_csv("/kaggle/input/house-prices-advanced-regression-techniques/test.csv")

# データの表示(確認用)
train_df.head()

ノートブック内では、/kaggle/input/... のパスを使うことで、Kaggleが提供するデータセットにアクセスできます。


💡 補足:データセットの構成

このコンペティションのデータセットには以下のファイルが含まれています:

  • train.csv:訓練データ(住宅の特徴と価格が含まれる)
  • test.csv:テストデータ(特徴のみ。価格は含まれていない)
  • data_description.txt:各カラム(特徴量)の説明
  • sample_submission.csv:提出用のサンプルファイル

💻 ローカル環境で作業したい場合

もしKaggleではなく自分のPCで作業したい場合は、以下の手順でデータをダウンロードします:

  1. コンペページ上部の「Data」タブをクリック
  2. 「Download All」ボタンを押してZIPファイルを保存
  3. 解凍してtrain.csvなどのファイルを確認

Pythonで読み込むには以下のようにします:

import pandas as pd

train_df = pd.read_csv("パス/train.csv")
test_df = pd.read_csv("パス/test.csv")

✨ まとめ

ステップ 内容
1 Kaggleアカウントを作成
2 コンペページにアクセス
3 ノートブックで新規作成
4 /kaggle/input/パスからデータを読み込む
5 必要に応じてローカル環境でも利用可能

Best regards, (^^ゞ




以上の内容はhttps://cysec148.hatenablog.com/entry/2025/10/07/061831より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14