W34-一些AI实践分享
最直观的是多模型协作的用法:用 Gemini-2.5-pro 来提问,再让 Claude 来写,相当于 Claude 在给 Gemini 打工。这样的搭配能让模型各展所长,一问一答之间产生更高的效率和更好的输出质量。
输入的质量直接决定了输出的质量。结构化表述往往比随意的自然语言描述要高效得多,模型更容易抓住重点;角色提示词也并非摆设,在测试任务、编码任务这类场景下,角色设定会带来明显的差异;而在编码任务中,模型的表现更依赖于上下文的完整性,比起角色设定,是否能在输入中填充足够的上下文信息,对结果影响更大。
对提示词的进一步理解,要严肃地把它当成一门工程来看。相比微调这类需要耗费更多资源的方法,提示工程能在更短时间内带来性能的飞跃。看过泄露出来的各家系统提示词之后,动辄几千行的内容,本质就是自然语言写成的工程化代码。它们里边有流程,有约束,有优先级,完全像一份庞大的配置文件。
不同模型对提示词的偏好差异也很明显。OpenAI 的 GPT 系列在 JSON 结构化输入下更稳定,逻辑一致性更好;Anthropic 的 Claude 系列则在 XML 或者标签化风格下表现得更稳健。同一段提示词,分别交给 GPT 和 Claude 的提示词优化器去处理,观察产出的结果风格,能直观感受到两家在模型偏好上的差异。
关于账号封禁,我觉得用户政策最严格的应该就是 Claude。我去年注册的一个账号,今年四月份被封,里面还有余额,甚至连一封解释邮件都没收到。不过我发现了一个好用的方法,用 Apple iCloud 的隐私邮箱注册,这样对第三方来说只会看到苹果的中继服务,身份追踪的难度就大大增加了。
关于 Claude Code 的体验。它的自定义 slash 和 hooks 功能很强大,灵活扩展性强,便于迁移,而且 CC 可以和主流 IDE 的terminal 集成,体验流畅。我目前的最常用组合是 Windsurf 搭配 Claude Code,既能保持 IDE 的顺手感,又能充分利用 CC 的扩展能力。
最后更新于