Kaggle 上很多竞赛数据集比较大,下载是个问题,不过,其提供了 kaggle api,一遍快速下载.

1. Kaggle api 配置

1.1. kaggle api 安装

pip install kaggle

1.2. API Token 申请

在 Kaggle 账户的 My Account 页面申请,找到如下图处:

注:没有 Kaggle 账户的话需要注册一个.

点击 Create New API Token,即可下载一个 kaggle.json 文件.

然后,在Ubuntu系统中,将该 kaggle.json 文件放在 /home/username/.kaggle/ 路径.(如果该路径不存在,则手动新建.)

cd ~
ls -a
mkdir .kaggle
cd ~/.kaggle/

# 设置权限
chmod 600 ~/.kaggle/kaggle.json

2. Kaggle 数据集下载

在配置完成以后,即可在 Kagge 竞赛的 Data 页面下载数据,如:

cd /path/to/save/datas
kaggle competitions download -c diabetic-retinopathy-detection

速度还是比较快的.

3. Kaggle API 参数

Kaggle API 命令行工具:

#competitions
kaggle competitions {list, files, download, submit, submissions, leaderboard}

#datasets
kaggle datasets {list, files, download, create, version, init}

#kernels
kaggle kernels {list, init, push, pull, output, status}

#config
kaggle config {view, set, unset}

具体可参考:Github - kaggle-api.

Last modification:May 14th, 2019 at 04:55 pm