重复提问让大模型准确率飙升各方观点

BigNews

01.1819:11

关注

观点:

观点组1: 结构化提示词框架如CO-STAR能有效提升AI输出的相关性与个性化程度
观点作者：作者
观点内容：使用CO-STAR框架撰写提示词，即明确上下文、目标、风格、语气、受众和响应格式，可大幅提升AI生成内容的质量。例如为老一辈Facebook用户撰写广告时，参考戴森风格并设定简洁有说服力的语气，输出更具商业价值和社会适应性的文案。

观点作者：小索奇
观点内容：好的提示词应包含明确角色、限定范围和给出示例三个要素，相当于给AI搭梯子而非指迷宫。通过限定应用场景、用户群体和功能模块，能让模型输出具备落地性的需求文档或专业代码，避免空泛回复。

观点组2: 重复提示词能显著提升大模型在非推理任务中的准确率，且几乎不增加延迟
观点作者：Google Research
观点内容：通过将问题复制粘贴两遍，可显著提升大模型在非推理任务上的准确率，在Gemini、GPT-4o等模型上实验显示准确率从21.33%提升至97.33%，最高提升达76个百分点。该方法利用了Transformer架构的因果盲点，第二遍输入使模型获得类似‘上帝视角’的注意力效果，从而更准确对齐上下文，且预填充阶段高度可并行，用户几乎感受不到延迟增加。

观点作者：谷歌研究人员
观点内容：LLM按顺序处理文本时容易忽略后置信息，重复输入提示词能让模型在第二遍处理时已‘看过’完整内容，从而使预测更稳定准确。测试中70项对比赢下47项，无一败绩，尤其在长文本检索任务中效果显著，且无需改变工作流或升级模型即可实现高准确率抽取。

观点作者：行业研究者
观点内容：提示重复在七项基准测试中持续提升主流模型表现，虽增加预填充开销，但硬件效率抵消了延迟影响，适用于非推理场景下的信息检索与抽取任务，企业可在流水线中整合此技巧以提升性能而不增加生成成本。

观点组3: 多轮追问与反馈闭环是优化模型输出质量的关键路径
观点作者：技术分析员
观点内容：多提问题本身不能直接提高模型准确度，但通过‘问题反馈+数据迭代’闭环可间接优化效果。需设计六类高质量提问来暴露知识库解析、分词、检索或模型理解短板，并记录预期与实际回答形成日志用于后续优化。

观点作者：小索奇
观点内容：采用多轮追问迭代方式引导模型逐步细化输出，比一次性写超长提示词更高效。例如先让模型列大纲，再针对某一部分展开说明，可获得逻辑清晰、细节丰富的结果，甚至包含延伸问题，极大提升内容实用性。

观点组4: 提示工程优化应结合安全考量，防止指令放大带来的越狱风险
观点作者：Google Research
观点内容：重复提示可能放大某些指令的显著性，潜在提升越狱成功率，需专门实验评估其安全影响。防御者也可利用该机制，在系统提示开头重复安全规则，增强模型对约束条件的注意力，构建更稳健的防护机制。

观点作者：行业研究者
观点内容：企业在应用提示重复策略时需关注重复注入攻击等安全风险，安全团队应加强监控，评估对现有流水线的影响，确保在提升准确率的同时不牺牲系统的可控性与安全性。