本文探索了如何将AI聊天机器人融入日常科研任务工作中(如文献综述、修改和撰写学术论文和以及编程代码),旨在评估如何安全地应用使用该技术以生产生更优质的科研成果并提高生产力工作效率。本文强调了一些关键教训经验,具体如下:
(1)设计合适的提问词
人们普遍认为,聊天机器人是“智能”的,其可理解用户所提的任何问题。然而,事实并非如此。为了有效使用聊天机器人,有必要设计一个合适的提问词。
优秀的提问设计存在诸多细微差别,但基本原则相同,具体如下:
1)用户应明确说明希望模型做什么
实例:“Summarize…”(总结…)或“Explain…”(解释…)
2)要求模型扮演一个角色或人物
实例:“You are a professional copy editor(你是专业的文字编辑)”
3)指定模型应如何回答或确切的输出格式
实例1:“Explain it to someone who has a basic understanding of epigenetics”(向对表观遗传学有基本了解的人解释)
实例2:“Export as an analysis-friendly JSON or CSV file”(导出为便于分析的JSON或CSV文件)
以下是用于修改手稿摘要的提问实例,以供参考:
实例:“You are a professional copy editor with ample experience handling scientific texts. Revise the following abstract from a manuscript so that it follows a context–content–conclusion scheme.
(1) The context portion communicates to the reader the gap that the paper will fill. The first sentence orients the reader by introducing the broader field. Then, the context is narrowed until it lands on the open question that the research answers. A successful context section distinguishes the research’s contributions from the current state of the art, communicating what is missing in the literature (that is, the specific gap) and why that matters (that is, the connection between the specific gap and the broader context).
(2) The content portion (for example, 'here, we ...’) first describes the new method or approach that was used to fill the gap, then presents an executive summary of results.
(3) The conclusion portion interprets the results to answer the question that was posed at the end of the context portion. There might be a second part to the conclusion portion that highlights how this conclusion moves the broader field forward (for example, 'broader significance’).
你是一名在处理科学文本方面经验丰富的专业文字编辑。请修改以下手稿摘要,使其符合背景-内容-结论框架。
1)背景部分向读者传达论文将填补的空白。第一句通过介绍更广泛的领域来引导读者。然后,背景缩小到本研究要回答的开放性问题上。一个优秀的背景是将研究贡献与当前技术水平区分开,说明文献中缺少什么(即具体差距)以及为什么这很重要(即具体差距与更广泛背景之间的联系)。
2)内容部分(例如,“在这里,我们......”)首先介绍用于填补研究空白的新方法或新途径,然后提供结果的概要。
3)结论部分解释结果以回答背景部分末尾提出的问题。结论部分可能还有第二部分,强调该结论如何推动更广泛领域地发展(例如,“更广泛的意义”)。
(2)找到合适的任务
在考虑聊天机器人的潜在应用时,应先明确以下几个方面:1)这项任务需多少创造力;2)若模型引导错误会发生什么;3)任务哪些方面只有人才能做出贡献;4)哪些方面更机械化--通常也更无聊?
以一项研究的文献综述阶段为例,此过程的目标是生成一份精炼的论文列表并总结其主要思想。确定研究问题需要创造性思维,故无法完全依靠聊天机器人完成。这一过程需要仔细阅读论文,找出研究空白、提出假设,并开始思考如何通过实验解决问题。研究者可能希望尽可能多地了解每篇论文(包括图、表和补充材料)。聊天机器人可能会遗漏关键信息,甚至可能会妨碍研究者建立创造性和逻辑性之间联系。然而,这一过程的后期目标将有所不同。研究者可能试图快速“阅读”(即总结)与自己工作不太相关的论文。在该情况下,使用聊天机器人风险较小。
此外,使用专业工具(如SciSpace)搜索论文、评估其相关性以及与文本“聊天”可取得一定进展。然而,使用ChatGPT等一般工具则无法获得相同效果。因此,无论选择哪种工具,都要同时使用标准搜索引擎,以最大限度地增加相关论文数量。
(3)多写作,少阅读
使用聊天机器人写作比使用其阅读风险更小。举例而言,让LLM“阅读”一篇论文时,用户必须相信其可准确提取出最重要的观点,因为用户可能不会阅读该论文。然而,使用LLM写作时,用户可完全控制输出结果,并在出现无意义或不准确的文本时及时发现。
当开始撰写论文时,即便明确了想表达什么,但经常需要聊天机器人来辅助撰写论文。此时,可向聊天机器人提供本学科论文框架。另一种方法是,用户可先在无帮助情况下写作,然后使用聊天机器人修改文本(例如,将背景-内容-结论框架应用到于段落),查看聊天机器人的建议并采纳好的建议。