DeepSeek 给我编了一篇根本不存在的论文

前阵子写论文找参考文献，我让 DeepSeek 帮忙推荐几篇 Transformer 在目标检测领域的综述。

它给了我五篇，格式完美——作者、期刊、年份、DOI 一应俱全。我还觉得挺靠谱，顺手就往论文里引了两篇。

后来导师让我把参考文献的原文都下载一遍核对。我拿 DOI 去搜，第一篇——链接无效。第二篇——Google Scholar 查无此文。作者名字搜了一圈，根本不存在这个人。

五篇里有三篇是 AI 编的。格式像真的，内容是假的。

当时我后背发凉。如果没核实就交了，轻则被导师骂，重则学术不端。

后来我在小红书上看到一个研究生发帖吐槽：”怎样防止 DeepSeek 编造文献啊，我都快病了。”底下一堆人附和。说明这不是个例。

AI 为什么会编文献？

第一章配图

先说清楚一件事：AI 不是在骗你，它只是在”预测”。

当你说”给我找五篇关于 XXX 的文献”，AI 的逻辑是：你要”文献”，文献应该有作者、标题、期刊、年份、DOI——那我就生成一个”看起来像文献”的东西。

它不知道这个文献是否真实存在。它没有”真假”的概念，只有”像不像”的概念。

训练数据里有大量的论文引用格式，所以它能生成格式完美的假文献。越像真的，越危险。

我现在的做法

第二章配图

踩过一次坑之后，我总结了一套流程，每次用 AI 查文献都会走一遍。

第一，改变提问方式。

“给我找五篇论文”这种问法最容易触发编造。我现在会这样问：

“Transformer 在目标检测领域有哪些主要的研究方向？每个方向的代表性研究者是谁？请提供他们的 Google Scholar 主页链接。如果你不确定，直接告诉我’需要自己核实’。”

逐步提问，让 AI 先给方向和人名，再由我自己去找具体论文。这样即使 AI 给的人名有误，我也能在搜索过程中发现。

第二，在 prompt 里加一句话。

我现在每次让 AI 帮忙查文献，都会在开头加一段：

“你的回答必须基于事实。如果你不知道，就说’我不知道’。不要猜测、不要编造。如果不确定，明确标注’这个信息需要核实’。”

加了这句之后，AI 编造的概率明显降低了。不是百分之百杜绝，但至少它会在不确定的地方标注出来。

第三，用联网搜索的工具交叉验证。

Perplexity AI 是我现在查文献的主力工具。它会实时联网搜索，每条信息都带来源链接。Claude 的 web search 功能也可以。

关键是：不要只用一个工具。用 DeepSeek 给了方向，再用 Perplexity 去验证，最后在 Google Scholar 上确认论文确实存在。

第四，每篇引用的文献，DOI 必须点一遍。

这是最笨但最有效的方法。DOI 链接点开能到论文原文，就是真的。点开是 404 或者跳转到错误页面，就是假的。

每篇花 10 秒钟。十篇参考文献，两分钟。这两分钟能救你一命。

第五，作者和期刊也要核实。

AI 编造的文献，作者名字往往”看起来像真名但查无此人”。在 Google Scholar 上搜一下作者名，看有没有这个人的主页和其他论文。期刊名也一样，去 JCR 或者期刊官网查一下是否存在。

一个正确使用 AI 查文献的完整流程

第三章配图

现在我的流程是这样的：

第一步，用 AI 梳理研究方向和代表性学者（不要直接要论文标题）。

第二步，在 Google Scholar 上搜索这些学者，找到他们的真实论文。

第三步，用 AI 帮我总结这些真实论文的核心内容（把 PDF 丢给它读）。

第四步，写进论文之前，每篇 DOI 都点一遍确认。

AI 最擅长的不是”帮你找文献”，而是”帮你读文献”。 找的活交给 Google Scholar，读的活交给 AI，各干各擅长的事。

说到底

第四章配图

AI 编造文献这件事，不是 AI 的错，也不是你的错。它是工具的局限性。

知道这个局限性之后，你要做的就是一件事：永远不要不核实就引用。

AI 给的信息，至少花五分钟核实。这五分钟，是你学术信誉的保险。

本文来自「研路炼钢」

文章作者: insistgang

文章链接: https://insistgang.top/posts/ai-fake-paper.html

AI工具学术论文

相关推荐

2026-03-20

投稿 SCI，我因为漏了一个文件被退回过

辛辛苦苦写了几个月的论文，投出去当天就被退回了。不是质量问题，是文件不齐。编辑的回复很客气：”请补充完整后重新提交。”打开投稿系统一看——原来还需要单独上传 Title Page。就这么一个文件，耽误了将近两周。后来我才知道，这种事太常见了。据说超过 30% 的 SCI 投稿因为文件不齐被退回。不是论文写得不好，是基本功没做到位。从那以后我给自己列了一份清单，每次投稿前逐项打钩。今天分享出来，希望你不要踩我踩过的坑。五类文件，缺一类都可能被退 SCI 投稿的文件大致分五类：核心文件、图表文件、投稿信、审稿人建议、声明文件。核心文件是入场券，少一张都进不了评审环节。包括正文（Manuscript）、标题页（Title Page）、摘要（Abstract）、关键词（Keywords）。正文的格式要注意：双倍行距、页码标注、部分期刊还要求行号。这些看起来是小事，但格式不对编辑会直接退回。标题页是最容易漏的。大多数期刊要求盲审，正文里不能出现作者信息，所以作者姓名、单位、通讯作者邮箱这些要单独放在 Title Page 里上传。我第一次投稿就栽在这里。摘要一般 1...

2026-03-29

我用 AI 烧了很多钱，但论文一个字没多

研二下学期，我突然意识到自己在干一件很蠢的事。我的 AI 工具全家桶我手上有多少个 AI 工具？数一下：Claude Code、Kimi Code、Qwen Code、Codex、OpenClaw、MiniMax——光命令行工具就六个。再加上各种 API key：Anthropic、智谱、豪卓云、MiniMax……每个月订阅费加起来不是小数目。每出一个新工具，我第一时间注册、配置环境、跑通 demo、写个使用心得、发个朋友圈。然后呢？然后就没有然后了。我的论文还是那个论文，草稿还是那个草稿，该画的图一张没画完。我以为我在提效，其实我在逛街回过头看，我使用 AI 的方式，本质上跟逛淘宝没有区别。逛淘宝的人觉得自己在”挑选最好的商品”，实际上大部分时间花在了浏览、比较、加购物车上，最后真正需要的东西可能一件都没买。我也是。我觉得自己在”寻找最高效的工具”，实际上大部分时间花在了安装、配置、测评、切换上，最后真正用工具完成的成果可能一个都没有。更讽刺的是，我还专门写了一篇公众号文章来对比这六个工具的优劣——那篇文章本身花了三个小时。三个小时，够我把论文结论...

2026-03-05

研究生写论文的第一课，不是写，是抄

景哥说：”你别自己在那瞎弄，你得看别人的。看别人的咋写的，咋表达的。” 我的论文被AI”打架”打回来了前阵子我把自己那篇井盖检测的论文发给景哥看，想让他帮忙把把关。景哥收到之后，做了一件我没想到的事——他把我的论文同时丢给了Gemini和Claude，让两个AI互相挑毛病。结果是：”你那篇论文公式太多了，我让Gemini和Claude打架，疯狂的说一堆致命的问题。” 我当时心态还挺稳的。毕竟论文还在改，有问题正常。但接下来景哥说的话，才是真正让我重新审视自己写论文方式的开始。 “你模仿的那篇，没啥参考价值” 我之前写论文的方法很朴素：读了一些论文，觉得差不多理解了方法，就开始动笔写。格式嘛，找了一篇看起来结构类似的文章照着来。景哥问我：”你打算和这个发一样的期刊吗？” 我说不是。他说：”那你模仿它干嘛。” 然后他点开我参考的那篇论文，直接下了判断：”这个做的一般，写的也不行。没啥参考价值，而且还是本科毕业论文。” 我才意识到，我连”该模仿谁”都没搞清楚，就开始模仿了。景哥的论文写作方法论接下来的对话，景哥系统地给我拆解了一套论文写作的底层逻辑。不是那种教...

2026-03-20

论文被拒，可能不是你方法不行，是故事没讲好

我有一个很深的体会：同样水平的工作，讲法不同，结果可能天差地别。去年我帮一个师兄看论文初稿，方法扎实、实验充分、数据也不错。但读完之后我的感觉是——“所以呢？这个工作为什么重要？” 问题出在哪？他写的不是”论文”，他写的是”实验报告”。方法一二三，实验一二三，结果一二三，平铺直叙，没有任何张力。审稿人看完可能也是同样的感觉：”技术没问题，但我不知道为什么应该接收这篇。” 后来导师帮他改了引言，只改了两段话，把”我们做了什么”换成了”这个领域有什么问题→现有方法为什么解决不了→我们怎么解决的”。重投之后，过了。方法没变，数据没变，变的是叙事。讲故事不是吹牛先澄清一件事：学术论文里的”讲故事”，不是夸大结果，不是捏造数据，不是花言巧语。它的本质是：帮助审稿人在最短时间内理解你的工作的价值。审稿人不会主动帮你梳理逻辑。他们每个月审大量论文，没有时间去猜你想表达什么。如果你的论文需要”阅读理解”才能看懂贡献，那大概率会被拒。好的叙事，就是降低审稿人的认知负担。你帮他省时间，他给你好评价。这不是讨好，是专业。四件事决定你的论文叙事质量第一，问题要在第一段就点出来。 ...

2026-03-20

为什么你用 AI 编程工具只能产出"AI 垃圾"？

我现在每天都在用 Claude Code、Gemini CLI、Cursor 这些工具写代码。但说实话，刚开始的时候，产出的东西确实很”AI”——紫色渐变、千篇一律的布局、通用模板感极强。后来慢慢摸索，产出质量才开始上来。我发现差距不在工具本身，而在你怎么用它。这段时间我总结了一个”六阶模型”，也算是对自己从菜鸟到现在的一个复盘。看看你卡在哪一层。第一阶段：命令式使用大部分人刚上手都是这个状态：打开工具，输入”给我做一个 XX 网站”，然后等结果。结果出来了，能跑，但丑。而且千篇一律——因为你没给 AI 任何关于审美、目标用户，品牌调性的信息，它只能给你一个”安全但平庸”的方案。我刚用 Claude Code 的时候就是这样，让它帮我写一个数据可视化页面，出来的东西功能上没问题，但视觉上一看就是 AI 生成的。突破点：从”给我做 XX”变成”我要做 XX，目标是 YY，风格是 ZZ，你觉得我还需要考虑什么？”。把 AI 从命令执行器变成合作伙伴，质量立刻不一样。第二阶段：对话式协作到了这个阶段，你开始跟 AI “聊”了。不再只是下指令，而是让它先提问、先...

2026-03-29

你每天都在消费Token，但你积累数字资产了吗？

我发现一个现象：很多人用AI用得很勤，每天和大模型聊几十轮，生成PPT、写文案、做总结，但聊完就关了，什么都没留下。 Token花了，结果没攒下来。最近和朋友聊了一整晚，从AI工具怎么用，聊到怎么靠AI建立自己的长期壁垒。聊完之后我越来越确信一件事：在AI时代，最值钱的不是你会用什么工具，而是你积累了多少数字资产。 01 AI最大的价值，不是帮你干活很多人对AI的理解停留在”效率工具”——帮我写个文案、做个PPT、总结个文档。这些当然有用，但这只是AI价值的表层。我朋友说了一句话让我印象很深：”你脑子里想法很多的时候，就去跟大模型对话。不用管它回答得对不对，聊完你就知道自己想要什么了。” 这其实是AI的一个隐藏功能：它是一面镜子，帮你把模糊的想法变成清晰的结构。我自己也有这个习惯。很多时候不是真的要AI给我答案，而是在对话过程中，我的思路自己就理清了。AI做了什么？它只是逼着你把想法说出来、写下来、结构化。学习也是同样的道理。我之前让Claude读完一整份专业文档，分析重点，然后出题给我做。出题、做题、出题、做题，循环下来，效率比自己啃书快了好几倍。但关键不是...