返回首页
0%

Roo Code 启发

2025年4月29日
阅读时间:15min
前路启发

Roo Code 办公时间 - 2025年4月22日 | 特邀嘉宾:来自 Google 的 Paige Bailey | 第三集

嘉宾介绍与背景

  • Paige Bailey: 来自 Google DeepMind 团队,负责 Gemini API、AI Studio、Gemma(Google 的开放模型系列)以及 Jax 等项目 。她致力于将 DeepMind 的研究成果推向世界 。
  • 个人经历:
    • 自 2009 年左右开始接触机器学习 。
    • 拥有地球物理学和应用数学背景,研究生攻读计算机科学 。
    • 曾在雪佛龙 (Chevron) 的石油和天然气行业工作 。
    • 早期(约 2009-2010 年)为开源工具和库(如传统数据科学栈)做贡献 。
    • 热爱开发者工具 (DevTools) 。
    • 于 2017-2018 年加入 Google Brain,从事机器学习框架工作 。
    • 疫情期间曾在 GitHub 工作一年,参与 VS Code 的机器学习功能及 Code Spaces 等项目,并早期测试了 Copilot 扩展 。
    • 几年前回到 Google,专注于模型以及 AI 在软件开发中的应用 。

关于 Gemini 和 Google AI 的问答

  • 模型训练与 Agent 能力: Google 在训练新模型(如 Gemini)时,确实会考虑 Agent 和工具使用/函数调用等能力,并将相关数据纳入训练过程 。
  • AI Studio (AI.dev): 这是与最新 Gemini 模型互动和体验其功能(包括工具使用和函数调用)的最佳平台 。AI Studio 可以与 LangChain、Crew AI 等框架集成以实现 Agent 任务 。
  • Gemini 2.5 Pro 的工具使用: 该模型原生支持工具使用和函数调用,并且在这方面的能力比之前的模型(如 2.0 Flash)有显著提升 。用户可以通过 API 直接使用这些功能。
  • 原生函数调用 vs XML 标签: 有反馈称,对于工具使用,XML 标签可能比原生函数调用更可靠一些 。Paige 对比较两者性能的基准测试结果表示好奇。如果原生函数调用结合结构化输出(如 JSON)时表现不可靠,应视为 Bug 并反馈给 Google。
  • Gemini 的推理方式 (Thinking Mode): Gemini 2.5 Flash 模型引入了“思考模式 (Thinking Mode)”和“思考预算 (Thinking Budget)” 。启用后,模型会展示其解决问题的计划步骤(例如加载数据、聚类、可视化等) 。用户可以调整“思考预算”来平衡响应速度和输出的可靠性/详细程度 。
  • Diff 格式: Gemini 模型支持 Diff 格式进行代码编辑,但具体格式可能因模型而异 。建议查看 Aider 等代码编辑排行榜以了解不同模型的具体 Diff 格式偏好 。
  • Google 对 AI 模型的未来愿景: Google 采取多层次模型策略(Pro、Flash、Nano),以适应不同场景需求(高性能、生产环境、移动设备端) 。目标是平衡开发者需求(提供 API 和开放模型如 Gemma)和消费者应用(集成到 Google 产品中) 。通过开放 API 让开发者构建应用,有助于 Google 了解模型应用方向并反哺模型训练 。
  • Gemma 模型与工具调用: Gemma 3 模型系列最近发布了,包括量化检查点,可以在本地运行(如 12B 模型) 。可以通过微调 (fine-tuning) 使 Gemma 模型更擅长工具调用 。Gemma 3 团队也在努力将更多相关数据纳入模型训练中 。创建一个针对函数调用微调的 Gemma 版本可能会很受欢迎 。
  • 专门的编码模型: Google 曾推出过 Code Gemma(Gemma 的代码微调变体) 。虽然不能透露未发布计划,但通过持续预训练或微调 Gemma 等开放模型以适应特定软件开发任务(如代码生成、特定框架应用生成)是很有价值的 。利用上下文窗口提供示例(few-shot prompting)也是提升代码生成质量的有效方法 。
  • A2A 协议: 这是由 Google Cloud 团队推动的 Agent 间通信协议,旨在为 Agent 间安全、一致地共享数据(尤其涉及支付等场景)提供标准,而非取代 MCP 服务器 。

关于开发者和行业

  • 给学生的建议: 现在是创造东西的最佳时机 。借助免费开源工具(如 VS Code、Roo Code)和具有免费额度的模型 API(如 Gemini 2.5 Pro/Flash),创造力是主要限制因素 。不一定需要传统大学教育才能进入科技行业并构建应用或业务 。
  • "Vibe Coding": 这个概念指快速将想法转化为实现,缩短开发周期,非常吸引人 。它使得更多人能将想法变为现实 。但也带来了挑战,如 API 密钥泄露、安全知识缺乏、对底层技术(如数据持久性)不了解等 。未来需要构建更多安全和质量检查工具,帮助新���避免风险 。
  • 预算控制: 用户(特别是学生和爱好者)希望能有更严格的预算控制机制(硬限制),以避免意外产生高额费用 。Paige 会将此反馈给 Vertex AI 团队 。建议在 AI Studio 生成 API 密钥且不绑定信用卡,以利用免费额度并避免意外收费 。可以在 AI Studio 查看用量数据 。
  • 未来团队结构: AI 将深刻改变企业团队结构 。小型、高度专注的团队能借助 AI 工具产生巨大影响 。企业需要重新评估可被自动化的工作,让人力解放出来从事更有价值的任务 。Google 内部已有大量代码由 AI 生成(之前数据是 25%,此后比例还在增长),这加速了开发进程,使构建和维护系统更容易、更愉快 。AI 也被用于代码审查、迁移、文档维护(如自愈文档)等任务 。
  • 编程能力的未来: 编程能力本身不会消失或变得无用,但其重要性可能会相对降低 。未来可能不再需要掌握传统企业级软件开发技能才能构建和部署应用 。更重要的是解决问题的直觉、构建什么以及如何构建的方法论 。AI 工具就像电动工具,让构建过程更快、更容易 。
  • Google 与科研界的合作: Google DeepMind 与科学和学术界有深入合作 。例如 AlphaFold 的创建者最近获得了诺贝尔化学奖 。推出了 DeepMind Co-scientist 项目(一个多 Agent 系统)来加速科学突破 。Google 提供学术资助(特别是针对 Gemma 模型),并与大学教授、研究生等共同设计解决方案 。Google 内部也在进行广泛的前沿研究(自动驾驶、聚变、量子计算等)并拥有强大的外部合作关系 。
  • Google for Startups: 该项目为符合条件的 AI 初创公司提供高达 35 万美元的云积分(两年内、无股权要求),可用于 Gemini API、Cloud Run、GCS 存储、计算资源等 。资格要求通常是获得机构投资(来自加速器、VC 基金或认证投资者)的 AI 公司 。

关于 Roo Code 的讨论

  • Paige 对 Roo Code 的使用与评价: Paige 每天都使用 Roo Code,并同时尝试其他类似工具 。她特别喜欢 Roo Code 监控成本、为不同任务设置不同模型(如一个用于复杂推理,一个用于轻量任务)以及任务编排(Boomerang 任务)等功能 。她也喜欢 Roo Code 能够提出后续问题以澄清需求的功能 。她主要搭配 Gemini 2.5 Pro 和 Flash 使用 Roo Code,效果很好 。
  • 使用 Gemini 2.5 Pro 的挑战:
    • 成本问题:在支持缓存之前,长上下文窗口可能导致成本较高 。
    • 不一致性:作为预览/实验性模型,有时在遵循指令(如工具使用的格式)方面可能存在不一致 。Roo Code 团队正在努力改进工具以处理这类“软失败” 。
    • Diff 编辑:不同模型在 Diff 编辑方面表现各异,需要针对性优化 。
    • Vertex AI 设置复杂性:对于非企业用户,设置 Vertex AI 可能比较困惑 。
  • 对 Roo Code 的建议:
    • 简化部署流程:提供从 IDE 到可公开访问 URL 的更便捷路径,方便分享成果 。
    • 增强代码库理解工具:帮助开发者(尤其是接触遗留代码库的)理解代码、发现问题并进行更新维护 。
    • 自动化维护任务:利用 Roo Code 的能力(如 Boomerang 模式)处理依赖更新、代码库维护等任务 。
  • 合作机会: Google 可以将 Roo Code 加入“可信测试者计划 (Trusted Testers Program)”,使其能提前接触新模型并与模型团队进行更紧密的设计合作 。也可以探讨通过 Google Labs 进行创业公司合作(包括积分和伙伴关系) 。欢迎 Roo Code 社区向 Google 提交 PR 。
  • Paige 向 Roo Code 社区提问:
    • 对于使用 Gemini 2.5 Pro/Flash 结合 Roo Code 的用户,Google 如何能提供更好的支持(文档、教程、演示)?
    • 目前从在 IDE 中完成工作到将其发布上线,开发者遇到的主要障碍或差距是什么?Google 如何帮助弥合这些差距?

结束语

  • 双方对此次交流表示感谢,认为非常有价值 。Paige 会将收集到的反馈转达给 Google 产品团队 。

Roo code-办公时间-25年4月22日 | 特别嘉宾来自谷歌的佩奇・贝利