AI 生成图表的「morged」错别字与质量困境
当一个技术文档中出现「continvoucly morged」这样的文字,而不是正确的「continuously merged」,你会怎么想?这并非打字错误,而是人工智能生成内容的典型失误。这个看似荒谬的词汇,正成为技术社区讨论 AI 生成内容问题的标志性符号。
当一个技术文档中出现「continvoucly morged」这样的文字,而不是正确的「continuously merged」,你会怎么想?这并非打字错误,而是人工智能生成内容的典型失误。这个看似荒谬的词汇,正成为技术社区讨论 AI 生成内容问题的标志性符号。
一张图表的 15 年旅程
2010 年,一位开发者设计了一张 Git 分支模型示意图,用于解释 Git 工作流程。这张图在 Apple Keynote 中精心制作,颜色、曲线和布局都经过反复调整,确保能清晰展示分支随时间的变化关系。原文中提到:「我设计了这张图,还发布了源文件,让其他人可以在此基础上改进。」这张图迅速传播开来,被广泛用于书籍、博客、教学视频和团队维基中,成为 Git 社区的标准参考。
15 年后,微软官方学习平台发布了一个 AI 生成的版本。这个版本不仅没有标注来源,还出现了多个明显错误:箭头方向错误、时间轴写成「tirm」、关键文字「continuously merged」被错误地显示为「continvoucly morged」。更令人惊讶的是,这个错误版本曾被发布在微软官方文档中,且持续存在数月之久。
「Morged」的意外走红
这个错误迅速在技术社区引起热议。Hacker News 上,「morged」一词意外走红,成为描述 AI 生成拙劣抄袭的新网络热词。网友甚至提议将其作为「morgery」(名词)来描述这种现象。一位用户建议采用「morge」作为动词,意指「使用大语言模型生成明显抄袭已知/著名作品的内容」。相关讨论中,有人计划印制 T 恤纪念这个新词,还有人调侃:「Morge it! Morge it and let them flee like the dogs they are!」
微软的一位高管在 Bluesky 上回应称:「看起来是供应商的问题,我们已成立团队进行事后分析,试图弄清原因。」但社区对此并不买账。一位评论者指出:「在一家拥有 30 万人的公司,要让错误内容到达公众面前,必须有多人失误,或者至少应该如此。如果一个错误能单人发布,这就是系统性失败。」
AI 生成内容的深层问题
这个案例揭示了 AI 生成内容的深层问题:当 AI 系统将人类创作的内容进行「洗版权」处理,表面看似原创,实则质量严重下降。正如原作者所言:「真正令人沮丧的是缺乏流程和关怀——取走精心设计的作品,用机器洗掉指纹,当作自己的发布。这不是受启发而改进,而是把好的东西变得更糟。」
从技术角度看,AI 生成内容的问题在于其「记忆」机制。大型语言模型在训练时会「记住」大量数据,但生成时可能只是对训练数据的低质量复现,而非真正理解。对于图像生成,AI 更容易出现这种「记忆」错误,因为图像生成模型往往直接从训练数据中复制特征,再进行不恰当的修改。一位开发者指出:「这不仅仅是复制,而是『版权洗白』——通过 AI 处理,试图掩盖原始来源。」
类似问题的广泛存在
类似问题也出现在其他平台。LinkedIn 上充斥着 AI 生成的错误技术图表和文本;YouTube 上出现 AI 生成的虚假历史视频和错误技术教程。一位用户分享了在 YouTube 看到的「费曼解释为什么不能往返火星」视频,但费曼已于 1988 年去世,远早于火星探测器计划。另一位用户发现 YouTube 上有「二战机械师用一根电线修复整个盟军飞机机队」的虚假故事。
LinkedIn 上,有人将 ChatGPT 生成的错误技术内容发布为自己的专业见解。一位评论者写道:「LinkedIn 是一个化装舞会,装扮成商业论坛。没有人展示真实的自我,每个人都在用 LLM BFF(大语言模型最佳朋友)打磨他们的独角兽潜力,或者发布 100% 真实的生活改变故事,最终却变成销售话术。」
技术社区的担忧
当 AI 生成内容泛滥,真实的人类创作可能变得稀缺。一位评论者指出:「人类的集体文化,到 2021 年为止,被捕捉在一个有限但庞大的比特流中。现在,我们正以越来越快的速度稀释这些比特。当生成内容超过手工创作内容的那一刻,真实的东西将变得稀有。」
这种担忧并非空穴来风。一些 AI 生成的内容已经进入训练数据,形成恶性循环。一位开发者警告:「如果 AI 生成的内容被用于训练新的 AI 模型,那么未来所有内容都可能变成『AI slop』的变体。」
为何如此难以解决?
微软的案例暴露了技术文档生成流程的严重缺陷。一位评论者指出:「在微软,一个供应商就能发布错误内容到官方平台,而没有多层审核。」更令人担忧的是,微软官方明确表示:「我们正在努力向 Microsoft Learn 添加 AI 生成内容的文章。随着时间推移,更多文章将包含 AI 生成的文本和代码示例。」
这引发了一个根本问题:当 AI 生成内容泛滥,如何保证技术文档的准确性和可靠性?一位开发者建议:「要解决这个问题,需要更严格的审核流程和更透明的 AI 生成内容标注。对于开发者来说,重要的是保持警惕,不要轻易接受 AI 生成的内容作为权威参考。」
未来何去何从?
技术社区正在寻找解决方案。一些开发者尝试用 Mermaid 等文本生成图表工具,而非依赖图像生成 AI。一位用户分享:「使用 LLM 驱动 Mermaid 生成图表,比在光栅空间操作的 AI 更准确。」但这也只是权宜之计。
更大的挑战在于文化层面。当 AI 生成内容变得无处不在,人类如何区分真实与虚假?一位评论者写道:「当 AI 能生成『直升机腿』的 QWOP 游戏(本应是人腿),这种意外的创造性令人惊喜;但当 AI 生成错误的技术文档,这种『创造性』就变成了危险。」
在 AI 时代,技术文档的可靠性不再是默认属性,而是需要主动维护的品质。正如一位开发者所言:「AI 不会取代人类,但用 AI 的人会取代不用 AI 的人。关键在于如何用好这个工具,而不是被工具所用。」

更多推荐



所有评论(0)