name: Screenshot Tests
on:
  pull_request:
    branches: [main]

jobs:
  screenshots:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4

      - uses: actions/setup-node@v4
        with:
          node-version: 22

      - name: Install dependencies
        run: npm ci

      - name: Build application
        run: npm run build

      - name: Run screenshot tests
        run: npm run test:visual
        env:
          SCANU_API_KEY: ${{ secrets.SCANU_API_KEY }}

      - name: Upload diff artifacts
        if: failure()
        uses: actions/upload-artifact@v4
        with:
          name: visual-diffs
          path: test-results/
          retention-days: 14

要点：

固定 Node 版本以确保构建一致性。
在失败时上传差异产物，以便审查者可以检查实际图像。
将 API 密钥存储为 secrets，绝不放在代码中。

分支预览和暂存环境

为了获得最准确的结果，应针对已部署的预览环境而非本地构建运行截图测试。预览部署（Vercel、Netlify、Cloudflare Pages）提供的 URL 比 localhost 更接近生产环境的行为。

工作流变为：

PR 触发预览部署。
预览上线后，针对预览 URL 触发截图测试。
将结果与主分支基准线进行比较。

这种方式可以捕获本地构建可能遗漏的环境特定问题（CDN 字体、生产 CSS、服务端渲染内容）。

定时扫描实现广泛覆盖

PR 检查应该快速执行，因此通常只覆盖高优先级页面。用定时扫描来补充，覆盖完整的页面清单：

on:
  schedule:
    - cron: '0 3 * * 1-5'  # Weekdays at 3 AM

jobs:
  broad-scan:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - run: npm ci
      - run: npm run test:visual:full

定时扫描针对生产或暂存 URL 运行，测试所有页面在所有浏览器和断点上的表现。它们可以捕获通过较窄的 PR 矩阵漏掉的回归问题。

告警和通知

如果没有人看到结果，自动化测试就毫无用处。配置以下告警：

PR 检查失败 — 在 PR 上发表评论，包含差异摘要和比较面板的链接。
定时扫描回归 — 向页面负责人发送邮件通知或发布到团队频道。
阈值突破 — 当某个页面在多次运行中持续超过一定差异百分比时发出告警。

ScanU 支持已完成运行的邮件通知。将其与 CI 平台的通知系统结合使用，实现全面覆盖。详情请参阅功能页面了解通知选项。

在截图测试中处理不稳定的 UI

不稳定的视觉测试是团队放弃截图测试的头号原因。提前解决常见原因：

动画和过渡

在截图捕获期间禁用 CSS 动画，或等待动画完成。一种简单的方法：

/* Applied only during screenshot capture */
*, *::before, *::after {
  animation-duration: 0s !important;
  transition-duration: 0s !important;
}

营收关键页面（定价、结账）：严格阈值，阻断策略。
内容页面（博客、文档）：中等阈值，警告策略。
含动态元素的营销页面：宽松阈值，仅供参考。

跟踪阈值变更

记录每次阈值调整及其原因。如果阈值随着时间只升不降，需要调查是否真实回归被掩盖了。

行之有效的审查流程

即使拥有最好的工具，如果审查流程出了问题也无济于事。以下是一个可扩展的审查工作流：

CI 发布结构化摘要 — 变更数量、受影响的页面、严重程度。
审查者打开差异查看器 — 并排、叠加或高亮模式来理解变化。
审查者检查上下文 — 哪个浏览器、哪个设备、哪个页面状态。Firefox 移动端的差异与 Chrome 桌面端的差异是不同的。
审查者做出决策 — 批准（更新基准线）、拒绝（修复代码）或暂缓（需要调查）。
记录决策 — 简短说明理由。这有助于未来的审查者，并创建审计追踪记录。

分步指南：从零开始实现自动化截图测试

如果你从零开始，请按以下顺序操作：

选择关键页面 — 挑选 10-15 个代表你最重要用户旅程的页面。
在 ScanU 中创建项目 — 添加你的页面并选择浏览器/设备组合。参阅工作原理了解详细步骤。
捕获初始基准线 — 运行第一次测试并批准结果作为起始基准线。
添加 CI 任务 — 使用上述配置，让 CI 在每个 PR 上触发截图测试。
定义审查策略 — 决定哪些页面阻止合并，哪些仅作为警告。
运行第一个 PR 测试 — 创建一个包含视觉变更的 PR，验证端到端的工作流。
逐步扩展 — 随着信心的增长，添加更多页面、更多浏览器和定时扫描。

需要跟踪的指标

衡量以下指标以确保截图测试的投资获得回报：

合并前发现的回归 — 有多少视觉 Bug 在到达生产环境前被阻止。
误报率 — 失败中有多少百分比是噪声而非真实问题。目标低于 10%。
平均审查时间 — 差异在被审查前等待多长时间。PR 检查应保持在 4 小时以内。
发布后视觉事故 — 部署后用户报告的 UI Bug。这个数字应该随时间递减。
覆盖率 — 你的关键页面中有多少比例已有活跃的视觉测试。

继续使用 ScanU

自动化截图测试不需要复杂的基础设施。ScanU 处理截图捕获、基准线管理和差异生成，让你的团队专注于审查结果并自信地交付。在定价页面比较方案，在常见问题中查看实施细节，在功能页面探索完整平台。

在 CI/CD 中自动化截图测试：从 Pull Request 到发布

在 CI/CD 中自动化截图测试：从 Pull Request 到发布

为什么自动化对截图测试至关重要

端到端流程

第一步：Pull Request 触发测试运行

第二步：将截图与基准线进行比较

第三步：将结果发布到 PR

第四步：团队审查并做出决策

第五步：合并关卡执行策略

第六步：自信地发布

设置 PR 检查

分支预览和暂存环境

定时扫描实现广泛覆盖

告警和通知

在截图测试中处理不稳定的 UI

动画和过渡

动态时间戳和日期

懒加载内容

第三方组件

字体加载竞态

设置和调优阈值

从严格开始，谨慎放宽

按页面类型分类

跟踪阈值变更

行之有效的审查流程

分步指南：从零开始实现自动化截图测试

需要跟踪的指标

继续使用 ScanU

相关文章

Visual Testing in CI/CD Pipelines: Build Reliable Release Gates

Integrating Visual Testing Into Your CI/CD Pipeline

无需 DevOps 负担的视觉回归测试：为什么云端方案更胜一筹