colab使用

新手避坑 + 入门说明

Posted by Alessia on February 26, 2026

Google Colab 是一个基于云端的 Jupyter Notebook 环境,可以免费使用 GPU/TPU,非常适合深度学习和科研原型开发。

但很多初学者一开始都会踩一些坑,本文总结常见问题和入门方法。

常见问题

1、理解 Colab 的本质

Colab ≠ 本地电脑,它本质上是Google 提供的临时云端 Linux 虚拟机。当你运行 notebook 时,其实是在远程服务器执行代码。

2、为什么路径是 /content?

很多人会疑惑:我的文件在 OneDrive,本地明明有,为什么 Colab 里是 /content?原因是:/content 是 Colab 虚拟机的工作目录,你的本地文件默认不会自动同步,每次重启 runtime,/content 会被清空。可以用: !pwd!ls查看当前目录。

3、!cd 为什么不生效?

! 调用的是 shell 子进程,每一行都是独立 shell,所以 cd 不会被保留。正确做法是%cd annotated-transformer!cd annotated-transformer && pip install -r requirements.txt

4、如何访问本地文件?

Colab 访问本地文件有三种方式。

方法 1:手动上传

from google.colab import files
files.upload()

适合小文件。

方法 2:挂载 Google Drive

from google.colab import drive
drive.mount('/content/drive')

然后:

!ls /content/drive/MyDrive

适合科研数据。

方法 3:从 GitHub 拉取

!git clone https://github.com/your_repo.git
%cd your_repo
!pip install -r requirements.txt

科研项目推荐这种方式。

入门方法

由于Colab 的生命周期有以下重要特性:

  • 运行时间有限(空闲会断开)
  • 重启后 /content 清空
  • GPU 资源共享

因此建议:

  • 代码放 GitHub
  • 数据放 Google Drive
  • 不要依赖 /content

推荐的科研使用结构

GitHub (代码)
        ↓
Colab clone
        ↓
Google Drive (数据)

典型初始化模板:

  1. 挂载 Drive from google.colab import drive drive.mount(‘/content/drive’)

  2. 克隆代码 !git clone https://github.com/xxx/project.git %cd project

  3. 安装依赖 !pip install -r requirements.txt