W34-一些AI实践分享

最直观的是多模型协作的用法：用 Gemini-2.5-pro 来提问，再让 Claude 来写，相当于 Claude 在给 Gemini 打工。这样的搭配能让模型各展所长，一问一答之间产生更高的效率和更好的输出质量。

输入的质量直接决定了输出的质量。结构化表述往往比随意的自然语言描述要高效得多，模型更容易抓住重点；角色提示词也并非摆设，在测试任务、编码任务这类场景下，角色设定会带来明显的差异；而在编码任务中，模型的表现更依赖于上下文的完整性，比起角色设定，是否能在输入中填充足够的上下文信息，对结果影响更大。

对提示词的进一步理解，要严肃地把它当成一门工程来看。相比微调这类需要耗费更多资源的方法，提示工程能在更短时间内带来性能的飞跃。看过泄露出来的各家系统提示词之后，动辄几千行的内容，本质就是自然语言写成的工程化代码。它们里边有流程，有约束，有优先级，完全像一份庞大的配置文件。

不同模型对提示词的偏好差异也很明显。OpenAI 的 GPT 系列在 JSON 结构化输入下更稳定，逻辑一致性更好；Anthropic 的 Claude 系列则在 XML 或者标签化风格下表现得更稳健。同一段提示词，分别交给 GPT 和 Claude 的提示词优化器去处理，观察产出的结果风格，能直观感受到两家在模型偏好上的差异。

关于账号封禁，我觉得用户政策最严格的应该就是 Claude。我去年注册的一个账号，今年四月份被封，里面还有余额，甚至连一封解释邮件都没收到。不过我发现了一个好用的方法，用 Apple iCloud 的隐私邮箱注册，这样对第三方来说只会看到苹果的中继服务，身份追踪的难度就大大增加了。

关于 Claude Code 的体验。它的自定义 slash 和 hooks 功能很强大，灵活扩展性强，便于迁移，而且 CC 可以和主流 IDE 的terminal 集成，体验流畅。我目前的最常用组合是 Windsurf 搭配 Claude Code，既能保持 IDE 的顺手感，又能充分利用 CC 的扩展能力。

上一页W31-《Context Engineering for AI Agents》下一页W35-美团二季报

最后更新于4个月前