封面

前阵子写论文找参考文献,我让 DeepSeek 帮忙推荐几篇 Transformer 在目标检测领域的综述。

它给了我五篇,格式完美——作者、期刊、年份、DOI 一应俱全。我还觉得挺靠谱,顺手就往论文里引了两篇。

后来导师让我把参考文献的原文都下载一遍核对。我拿 DOI 去搜,第一篇——链接无效。第二篇——Google Scholar 查无此文。作者名字搜了一圈,根本不存在这个人。

五篇里有三篇是 AI 编的。格式像真的,内容是假的。

当时我后背发凉。如果没核实就交了,轻则被导师骂,重则学术不端。

后来我在小红书上看到一个研究生发帖吐槽:”怎样防止 DeepSeek 编造文献啊,我都快病了。”底下一堆人附和。说明这不是个例。


AI 为什么会编文献?

第一章配图

先说清楚一件事:AI 不是在骗你,它只是在”预测”。

当你说”给我找五篇关于 XXX 的文献”,AI 的逻辑是:你要”文献”,文献应该有作者、标题、期刊、年份、DOI——那我就生成一个”看起来像文献”的东西。

它不知道这个文献是否真实存在。它没有”真假”的概念,只有”像不像”的概念。

训练数据里有大量的论文引用格式,所以它能生成格式完美的假文献。越像真的,越危险。


我现在的做法

第二章配图

踩过一次坑之后,我总结了一套流程,每次用 AI 查文献都会走一遍。

第一,改变提问方式。

“给我找五篇论文”这种问法最容易触发编造。我现在会这样问:

“Transformer 在目标检测领域有哪些主要的研究方向?每个方向的代表性研究者是谁?请提供他们的 Google Scholar 主页链接。如果你不确定,直接告诉我’需要自己核实’。”

逐步提问,让 AI 先给方向和人名,再由我自己去找具体论文。这样即使 AI 给的人名有误,我也能在搜索过程中发现。

第二,在 prompt 里加一句话。

我现在每次让 AI 帮忙查文献,都会在开头加一段:

“你的回答必须基于事实。如果你不知道,就说’我不知道’。不要猜测、不要编造。如果不确定,明确标注’这个信息需要核实’。”

加了这句之后,AI 编造的概率明显降低了。不是百分之百杜绝,但至少它会在不确定的地方标注出来。

第三,用联网搜索的工具交叉验证。

Perplexity AI 是我现在查文献的主力工具。它会实时联网搜索,每条信息都带来源链接。Claude 的 web search 功能也可以。

关键是:不要只用一个工具。用 DeepSeek 给了方向,再用 Perplexity 去验证,最后在 Google Scholar 上确认论文确实存在。

第四,每篇引用的文献,DOI 必须点一遍。

这是最笨但最有效的方法。DOI 链接点开能到论文原文,就是真的。点开是 404 或者跳转到错误页面,就是假的。

每篇花 10 秒钟。十篇参考文献,两分钟。这两分钟能救你一命。

第五,作者和期刊也要核实。

AI 编造的文献,作者名字往往”看起来像真名但查无此人”。在 Google Scholar 上搜一下作者名,看有没有这个人的主页和其他论文。期刊名也一样,去 JCR 或者期刊官网查一下是否存在。


一个正确使用 AI 查文献的完整流程

第三章配图

现在我的流程是这样的:

第一步,用 AI 梳理研究方向和代表性学者(不要直接要论文标题)。

第二步,在 Google Scholar 上搜索这些学者,找到他们的真实论文。

第三步,用 AI 帮我总结这些真实论文的核心内容(把 PDF 丢给它读)。

第四步,写进论文之前,每篇 DOI 都点一遍确认。

AI 最擅长的不是”帮你找文献”,而是”帮你读文献”。 找的活交给 Google Scholar,读的活交给 AI,各干各擅长的事。


说到底

第四章配图

AI 编造文献这件事,不是 AI 的错,也不是你的错。它是工具的局限性。

知道这个局限性之后,你要做的就是一件事:永远不要不核实就引用。

AI 给的信息,至少花五分钟核实。这五分钟,是你学术信誉的保险。


本文来自「研路炼钢」