Google Colab 是一个基于云端的 Jupyter Notebook 环境,可以免费使用 GPU/TPU,非常适合深度学习和科研原型开发。
但很多初学者一开始都会踩一些坑,本文总结常见问题和入门方法。
常见问题
1、理解 Colab 的本质
Colab ≠ 本地电脑,它本质上是Google 提供的临时云端 Linux 虚拟机。当你运行 notebook 时,其实是在远程服务器执行代码。
2、为什么路径是 /content?
很多人会疑惑:我的文件在 OneDrive,本地明明有,为什么 Colab 里是 /content?原因是:/content 是 Colab 虚拟机的工作目录,你的本地文件默认不会自动同步,每次重启 runtime,/content 会被清空。可以用:
!pwd 或 !ls查看当前目录。
3、!cd 为什么不生效?
! 调用的是 shell 子进程,每一行都是独立 shell,所以 cd 不会被保留。正确做法是%cd annotated-transformer
或!cd annotated-transformer && pip install -r requirements.txt
4、如何访问本地文件?
Colab 访问本地文件有三种方式。
方法 1:手动上传
from google.colab import files
files.upload()
适合小文件。
方法 2:挂载 Google Drive
from google.colab import drive
drive.mount('/content/drive')
然后:
!ls /content/drive/MyDrive
适合科研数据。
方法 3:从 GitHub 拉取
!git clone https://github.com/your_repo.git
%cd your_repo
!pip install -r requirements.txt
科研项目推荐这种方式。
入门方法
由于Colab 的生命周期有以下重要特性:
- 运行时间有限(空闲会断开)
- 重启后 /content 清空
- GPU 资源共享
因此建议:
- 代码放 GitHub
- 数据放 Google Drive
- 不要依赖 /content
推荐的科研使用结构
GitHub (代码)
↓
Colab clone
↓
Google Drive (数据)
典型初始化模板:
-
挂载 Drive from google.colab import drive drive.mount(‘/content/drive’)
-
克隆代码 !git clone https://github.com/xxx/project.git %cd project
-
安装依赖 !pip install -r requirements.txt