DeepSeek官方发布R1模型推荐设置,这才是正确用法


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
来源 | 机器之心
就在刚刚,DeepSeek 官网 X 帐号下场推荐了部署 DeepSeek-R1 的设置。DeepSeek 强调官方部署的版本跟开源版本模型完全一致。
内容分为四项。
第一项是:不要使用系统提示词。这个建议其实已经被很多开发者提出过了。
第二项是:温度参数设置为 0.6。
第三项,DeepSeek 分享了用于搜索和文件上传的官方提示词。
对于文件上传,建议用户按照模板创建提示,其中 {file_name}、{file_content} 和 {question} 是参数。
filetemplate = \
“””[file name]: {filename}
[file content begin]
{file_content}
[file content end]
{question}”””
对于网页搜索,参数包括 {search_results}、{cur_data} 和 {question} 。
对于中文查询,使用的提示词是:
对于英文查询,使用的提示词是:
第四项则是一个指南,说明了可以如何缓解模型绕过思考的问题。为了确保模型进行彻底的推理,我们建议强制模型对每个输出都以 <think>\n 为其响应的开头。」

(文:机器学习算法与自然语言处理)

欢迎分享

发表评论