ChatGPT,能成为新的“维基百科”吗?

2023年05月13日21:03:10 科技 9842

22 年前,2001 年初,维基百科 wikipedia 横空出世,在其后的互联网时代,成为人们获取知识的重要平台。

但在刚开始,人们对维基「人人可编辑」的组织形式产生过质疑。甚至有电视主持人讽刺其为「wikiality」,即如果在维基百科上编造条目,只要有足够多的人同意,它就会成为现实。

后来,随着《自然》(nature)杂志的调查研究,发现维基百科准确度接近大英百科全书,google 开始把维基百科放到搜索结果的首项,维基社区和内容贡献者也持续壮大,维基百科用了很多年时间终于取得了公众的信任。

诞生之初遭到质疑,越来越多人参与去完善,而后平反收到大众认可,继而成为日常的工具,这一过程,仅诞生半年的 chatgpt 正在经历,不仅于此,它还成为了维基百科的挑战者。

不久前,维基媒体基金会召开 2023-2024 年度计划的电话会议,会议中提及了 35 次 ai,讨论的主题也是围绕 chatgpt 带来的挑战。

但维基百科所担心的挑战,并不是被 chatgpt 取代。而是更深刻地考验:未来的维基百科,会由 chatgpt 来撰写吗

维基百科的内容哪里来的?

要想知道 chatgpt 能否撰写维基百科,得先知道维基百科目前内容来源于哪里。

维基百科主要是由来自互联网上的志愿者共同合作编写而成,任何使用网络进入维基百科的用户都可以编写和修改里面的文章。它是互联网上一个极大的自由内容、公开编辑、多语言的网络百科全书协作计划。

截至 2021 年初,所有语种的维基百科条目数量达 5500 万条,如何确保内容上的准确,全靠维基社群志愿者们的筛查。

在 chatgpt 出现前,维基百科已经长期在用 ai 去减少一些人力成本。应用最多的就是把现有条目直接机器翻译,再由人工编辑校对。

2016 年时,资深科学家 aaron halfaker 开发了一套开源机器学习算法,可以自动识别维基百科里那些恶意破坏条目和编辑假消息的行为;2020 年,mit 的研究人员也为维基百科推出过基于 ai 的修改功能,可以精确定位维基百科句子中的特定信息,并自动替换为类似于人类编辑的语言。

ChatGPT,能成为新的“维基百科”吗? - 天天要闻

wikipedia 关于 chatgpt 的页面|wikipedia

以及如维基社群所述,人工智能非常擅长总结把一篇很长的技术类条目,总结成儿童都能理解的版本,让 ai 去生成儿童版的维基百科效果很好

翻译、检查、概括简化已有内容,维基百科一直以来对 ai 的应用仅限于此,直到大型语言模型 chatgpt 的出现。

目前仍以文字方式交互为主的 chatgpt,除了回答用户直接的提问以外,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等等。

chatgpt 可以写出相似真人的文章,并在许多知识领域给出详细和清晰的回答。哪怕 chatgpt 生成内容的事实准确度还需要人工去二次查阅,但这时维基百科面临的问题已经很明显了:志愿者能否用 chatgpt 来撰写维基百科条目?

能不能和想不想

纽约市维基媒体分会的老维基人 richard knipel 就用 chatgpt 在维基百科上起草了一个名为「艺术作品标题」的新条目,knipel 表示,chatgpt 给出的版本一般但语法正确,定义了艺术作品标题的概念,给出了从古至今的例子。他在草稿基础上只做了轻微修改。

但另一位编辑在条目上标注,将会进行大量修改并完善。如今,我们再点进这一条目,会发现它增加了大量内容和理论索引,还梳理出了目录,给出了图片案例。像 knipel 这样的维基人认为,chatgpt 可以作为生成维基百科条目草稿、骨架的工具,在此基础上,人工再验证内容,编辑和充实条目

但另一派维基人则认为,在维基百科条目的创作里 chatgpt 应该完全被禁用。一位维基百科编辑就表示「我们应该强烈呼吁不使用 ai 工具来生成条目草稿,即使这些条目随后会被人工审阅。chatgpt 太擅长引入那些看起来很有道理的谎言。」

ChatGPT,能成为新的“维基百科”吗? - 天天要闻

chatgpt起草,人工简单编辑的版本|wikipedia

ChatGPT,能成为新的“维基百科”吗? - 天天要闻

人工大量干预后产生的版本|wikipedia

但另一派也反驳这种说法,就像 knipel 认为,修改并丰富不完善的信息,这就是维基百科在实践中一直运作的方式。chatgpt 将继续存在并飞速发展,利用它同时强调人工干预的必要性怎么就不行呢?把 chatgpt 上来就视作洪水猛兽实在有些偏颇。

但在想不想之前,我们先看看能不能。chatgpt 还够不够格直接编写维基百科呢?

3 月 30 日时,维基百科创始人 jimmy wales 在接受 evening standard 采访时讨论了这个议题。wales 认为,让 chatgpt 能独立写一个完整的维基条目,目前还有一段距离,但距离多远就难说了。「chatgpt 的一大问题是会胡编乱造,业内把这种情况称为 hallucinating(幻觉)——我称之为编瞎话。」(one of the issues with the existing chatgpt is what they call in the field 『hallucinating』—i call it lying.)

「chatgpt 有一种凭空捏造的倾向,这对维基百科来说真的不太行。」wales 在采访里说道。实践中也是如此,你在维基百科上搜一个词,维基百科可能会反馈「该条目不存在」,但你问 chatgpt,它可能会给你生成一段没由头的假消息。

chatgpt 会「说瞎话」,这种事已经不新鲜了。但 chatgpt 诞生仅半年,它的自我迭代能力已经令人咋舌,让 chatgpt「句句吐真言」,似乎只是时间问题,那维基百科现在担忧的是什么呢?

人力有限,算力「无限」

维基百科团队并没有那么担心内容到底来源于人类还是 ai,它担心的是内容质量是否过关。

在维基媒体基金会在电话会议总结报告里,「挑战」被放到了开篇,其中最大比重的部分,也是维基百科团队最大的担忧在于:维基百科涌入大量 ai 生成的内容,把真正高质量的、正确的信息给淹没了

「wiki 项目有大量高质量的、可靠的,结构化的、分类好的内容。这就是我们带给世界的价值。最让我害怕的不是人们使用 gpt 之类的大语言模型来获取知识,而是需要巡查的 ai 生成的内容会爆炸式增长。

对高质量内容来说,创作比消费的时间成本高很多,就像一篇较为完整的维基条目,需要许多人参与撰写,花许多时间,走过很多流程后完成,对读者来说几分钟就阅读完了。

像维基百科这种平台,为了保证内容质量,还需要专业人士核查一条条目中每个信息、数据、引用是否来源准确,筛查和编辑的成本同样很高。因此 ai 生成内容越多,人工核查的时间也更长。而且哪怕 chatgpt 给出了正确的结论,但它并不会直接给出结论的论据来源何处,人工还需要再找到论据。到最后,修正可能比撰写耗时更长

ChatGPT,能成为新的“维基百科”吗? - 天天要闻

wikipedia 的条目下会有很多延展阅读链接|wikipedia

目前维基百科志愿者们已经发现了许多 chatgpt 自动生成内容上的问题。比如 chatgpt 很容易太笼统地概括定义,导致表意不明。还有 chatgpt 遣词造句过于肯定,不够匹配维基百科想呈现的客观中性的文字风格。

科技分类资讯推荐

小米YU7支持车外呼叫小爱开前备箱:三个条件都满足才能用 - 天天要闻

小米YU7支持车外呼叫小爱开前备箱:三个条件都满足才能用

快科技7月2日消息,小米YU7上首发了车外小爱同学的功能,在车外有8个麦克风和1个扬声器。无论在哪个角度,都可以很容易使用语音控车,比如在车外直接让小爱同学打开前备箱。这也让很多网友和准车主疑惑,会不会存在安全问题?对此,小米汽车在最新一期问答中表示,出于安全的考量,在车外通过小爱同学打开小米YU7的前备箱,...
小米汽车辟谣YU7交付插队费:都是假的 - 天天要闻

小米汽车辟谣YU7交付插队费:都是假的

快科技7月2日消息,小米汽车日前发布第166集答网友问。对于“网上有人自称小米汽车交付专员,宣称可以提前交付车辆,是真的吗?”小米汽车表示:如有收到类似短信,请大家切勿相信,更不要涉及金钱交易,以避免经济损失。涉及类似“提前交付”、“提前交付需转账给个人”或“支付插队费”等信息,请大家一定要仔细甄别。涉...
甜品上市!七彩虹iGameRTX 5050 Ultra显卡:温控性能两开花 - 天天要闻

甜品上市!七彩虹iGameRTX 5050 Ultra显卡:温控性能两开花

据悉,一线显卡品牌七彩虹的又一甜品级装备iGameGeForce RTX 5050 Ultra系列显卡现已正式上架各大电商平台和线下授权零售商!该系列RTX5050显卡搭载8GBGDDR6高速显存,2560个CUDACores,配合革命性DLSS4多帧生成技术,3A游戏全特效畅玩无压力,内容创作如虎添翼!更配备强劲的散热系统,性能与温控双优表现,让每一分预算
光追入门但超流畅!映众RTX5050 8GB曜夜发布 - 天天要闻

光追入门但超流畅!映众RTX5050 8GB曜夜发布

映众GeForceRTX 5050 8GB曜夜显卡现已和大家见面。基于NVIDIABlackwell架构打造,以紧凑双槽设计、高效散热及AI加速能力,为新一代RTX50系入门级市场注入新活力。作为GeForceRTX 50系列的入门主力,映众RTX5050 8GB曜夜凭借NVIDIABlackwell架构的革新设计,在AI与图形处理效率上有着不俗的性能表现。
从SEO到CRO:搜索优化的时代变革 - 天天要闻

从SEO到CRO:搜索优化的时代变革

在数字营销领域,搜索引擎优化(SEO)曾经是获取流量的黄金法则。我们习惯于在搜索引擎输入关键词,然后结果页面中寻找答案。但随着ChatGPT、DeepSeek等生成式AI的崛起,这个延续了二十多年的搜索模式正在被彻底改写。当AI能够直接生成完整答案时,传统的SEO策略突然变得力不从心——这就是为什么我们需要重新认识AI时代的...
全球可持续交通创新联盟可持续航空燃料专委会成立 - 天天要闻

全球可持续交通创新联盟可持续航空燃料专委会成立

7月1日,全球可持续交通创新联盟的第一个国际性专委会—可持续航空燃料专委会成立。该专委会的成立旨在整合产业链力量,构建“技术创新-产业协同-价值共享”三位一体的生态体系,为中国乃至全球能源绿色转型和航空业低碳未来发展提供“中国方案”。启动仪式上,中国能建联合行业头部企业共同发布《可持续航空燃料(SAF)产...
张勇出局,蒋凡上位:阿里权力大地震 - 天天要闻

张勇出局,蒋凡上位:阿里权力大地震

英雄难过美人关。京东创始人刘强东,曾因“明州事件”一度沉寂,事隔七年之后才真正重回公众视野。当年的天猫总裁蒋凡,亦因一场“桃色风波”消失在镁光灯下,直至近期才锋芒再现。
2025第25周销量最高的30款机型曝光 前三只有一款国产 - 天天要闻

2025第25周销量最高的30款机型曝光 前三只有一款国产

【CNMO科技消息】近日,有数码博主曝光了2025年第25周(6月16日到6月22日)中国智能手机市场上销量最高的30款机型: 第一名,iPhone 16 Pro 第二名,iPhone 16 Pro Max 第三名,OPPO Reno 14 第四名,iPhone 16 第五名,REDMI K80 第六名,小米15 第七名,华为nova 14 第八名,荣耀40