倒反天罡,AI越来越强,人类开始“自证清白”

marsbitОпубликовано 2026-05-29Обновлено 2026-05-29

Введение

AI日益强大的生成能力正迫使人类进入一个“自证清白”的时代。近期,文学圈接连发生争议:英联邦短篇小说奖的获奖作品被AI检测工具判为“100%AI生成”,诺贝尔文学奖得主的新书也因提及使用AI辅助而被质疑由AI代笔。与此同时,绘画领域的创作者们不得不通过录屏、直播、展示图层甚至“对赌”的方式来证明自己的作品纯手工完成。 当前“鉴AI”主要依赖人眼观察和第三方检测工具,但这些方法并不可靠。检测工具基于统计特征进行模式识别,容易误判——例如,非母语写作因其规整性常被误判为AI生成。而“肉眼鉴别”同样漏洞百出,甚至闹出将莫奈真迹误认为AI仿作的笑话。 技术层面,为AI生成内容添加“水印”是潜在的解决方案,包括元数据标记和隐形水印,已在图像、视频领域有所应用。然而,这些标记可能在后处理中丢失,且文本水印的推进尤为缓慢,部分由于准确率、用户接受度等顾虑。OpenAI曾推出文本检测工具但因准确率低而下线,其内部开发的文本水印工具也未能公开发布。 这场“鉴AI”风潮的背后,是人类对AI逼近乃至混淆人类创造力的深层焦虑。在缺乏完美鉴别手段的当下,创作者不得不承担额外的“自证”成本。未来,只有当“AI参与”成为常态,“人类原创”变得稀有,这场普遍的信任拉锯战或许才会失去意义。

AI越来越像人,于是人类开始被迫证明自己不是AI。

仅仅在本月,文学圈就发生了两件事。

一件,是英联邦短篇小说奖的一篇获奖作品,被第三方AI检测工具判定为“100%AI生成”。主办方用Claude复核,却没有得到相似的结果。

另一件,是诺贝尔文学奖得主的新小说还没发布,就被质疑是用AI写的。

AI越来越强,文本、图像和视频都越来越难靠肉眼分辨。但与此同时,人类手里的判断工具却并没有同样可靠。

于是,一种新的秩序出现了。

文学奖获奖者要解释自己的作品,诺奖作家要解释自己的创作方式,画师要录屏、开直播、展示图层,普通博主也可能被评论区质疑“AI味太重”。

过去是机器努力通过图灵测试,证明自己像人。

现在,越来越多人开始参加一场反向图灵测试:证明自己不是机器。

01

诺贝尔文学奖得主都逃不过“鉴AI”

今年5月,英联邦短篇小说奖的一篇获奖作品,引发了一场大型“鉴AI”争议。

引发争议的是特立尼达和多巴哥作家贾米尔·纳齐尔(Jamir Nazir)的短篇小说。

这篇作品获得了2026年英联邦短篇小说奖加勒比地区奖,并发表在文学杂志Granta上。很快,有读者和业内人士开始质疑,这篇小说的语言里有明显的AI痕迹:比喻混杂、句式整齐、修辞像是被批量生成出来的。

随后,AI检测工具Pangram给出了一个看起来非常确定的判断:100%AI生成。

100%这个数字看上去像铁证,可它并没有立刻变成裁决。

英联邦基金会表示,所有入围作者都确认没有使用AI辅助;Granta也没有办法仅凭一个检测结果,就认定作者违规。

于是,事情进入了一个极其荒诞的环节。Granta杂志尝试用Claude复核这篇小说,想让另一个AI来判断它是不是AI写的。

结果,Claude没有给出能够一锤定音的答案,也就是说,Pangram言之凿凿判成“100%AI生成”的作品,Claude却表示确定不了。

诺贝尔文学奖得主奥尔加·托卡尔丘克(Olga Tokarczuk)最近也遭遇了争议。

事件的起因,是她在采访中谈到,自己会使用AI辅助构思、资料整理、初步研究和事实核查。

这个说法很快引发外界讨论。要命的是托卡尔丘克马上要发新书,于是大家都在热议她的新小说是不是AI写的。

随后,托卡尔丘克不得不公开澄清,自己将于2026年秋季出版的波兰语新书,并不是由AI或其他人代写。她强调,几十年来,她一直独自写作。

说到底,现在AI确实越来越强了,鉴AI正在变得越来越困难。

去年底,《纽约客》刊发了一篇实验性文章。研究者用多位作家的作品微调模型,让AI学习并模仿他们的个人风格。

实验中,创意写作专业的学生在不知情的情况下阅读人类文本和AI文本,并判断自己更喜欢哪一段。结果,在接近三分之二的案例里,他们更偏好AI生成版本。

这比“AI能写小说”更麻烦。

《纽约客》作者Vauhini Vara在文章中还写道,朋友和专业读者会把AI生成的句子认成她自己的写法,也会把她真正写下的原文批评成“像AI”。

02

全程录像“自证清白”的画师欲哭无泪

“恐怖谷效应”绝不仅限于一个长得和人类似像非像的实体,在AI输出的文本和图像、视频越来越逼近人类,甚至连最有人味的“风格”都攻克的时候,人类不可避免地被激起存在主义危机。

这是现在流行“空口鉴AI”的一个核心动因。

换句话说,大家“鉴AI”是可以理解的,背后其实是某种恐惧——这是人吗?这是AI吗?我又是谁?我们是谁?

但是可以理解不代表伟光正,“鉴AI”正在给各种领域的创作者带来麻烦,让后者在创作之余还要平添“自证清白”的成本。

论AI带来的冲击,绘画圈是不陌生的。我们早在几年前就讨论过AI对绘画圈的冲击,以及很多画师对AI的抵制。

然而在当下,画师们面对的麻烦已经不仅仅是需要放着AI炼化自己的成果,而是自己手搓的作品被“鉴AI”。

在社交平台搜索“画画UP自证”,会看到很多案例。

有的画师被“鉴AI”之后,录屏展示所有的图层,以证明作品是出自自己之手。

但很多时候,这并不足够。

一位插画师朋友告诉我们,现在很多插画师会在绘画的时候全程录屏,防止被“鉴AI”的时候难以自证,这也是目前最稳妥的做法。

如果没有录屏,或者是有录屏“证据”但是仍然被怀疑是“印着描摹的”,那么还有下一步——对赌。

是的,绘画界因为AI已经发展出了“鉴AI”方和“被鉴AI”方的对赌。在我们看到的一个案例当中,发帖人摆出若干理由如“头发断联”“肩颈结构有问题”等,鉴别某画师的作品疑似是将AI图垫在下方描图或者照着AI图临摹。

双方以2000元对赌,最终画师“自证成功”,发帖人给AI画师支付2000元。

一般来说,“对赌”当中的“自证”环节,是双方约定时间进行一场绘画直播。而且直播需要多机位,比如一个机位展示屏幕作图过程,另一个机位录制画师画画的样子,以免有人“代笔”。

从很多画师的“自证帖”当中不难看出无奈的情绪,他们往往会感慨“终究轮到我了”,并发誓“这是第一次也是最后一次自证”。

就这样,一边痛恨“空口鉴AI”,另一边真的轮到自己了却不得不“自称清白”,实在难受。

有“鉴AI”但是画师“自证”失败的案例吗?有。但是这依旧不能让“鉴AI”的行为变得理直气壮一些。毕竟“鉴AI”的成本,几乎没有。

而“鉴AI”的手段,更是粗糙——靠人眼。

这里就不得不提到最近的一个笑料,一个X用户发了一张图,说是自己用AI生成的“莫奈风格图”,还让大家“尽可能详细地说明它为什么不如真正的莫奈”。

帖子后来700万浏览量,评论区不少人开始认真“鉴AI”,说它缺少深度、颜色不统一、没有人味、构图不如真迹,甚至有人从笔触和空间感上分析得头头是道。

结果反转是:那张图本来就是莫奈真迹。

03

“鉴AI”到底谁说了算?

所以这其实是对AI越来越像人的恐惧,与没有完美“鉴AI”手段之间的矛盾。

“鉴AI”手段的粗糙,是让创作者集体陷入“自证清白”的另一个重要因素。

除了“人眼鉴别”的方式之外,正如前文提到的文学比赛冠军得主的作品,“鉴AI”的另一个主要方式是第三方检测工具Pangram。

AI检测工具在文本领域常用,容易制造一种错觉:它会给出一个百分比,比如“80%AI生成”“100%AI生成”。这个数字看上去很像结论,甚至像某种技术鉴定。

但文本检测和DNA鉴定不是一回事。它判断的其实是“这段文字在统计特征上更像什么”。

AI检测工具,也是在看“看起来像不像AI写的”。

Pangram在官网上解释,自己的AI检测器会用自然语言处理技术和大量人类写作、AI写作数据,分析AI文本中的结构、风格和语义模式。Pangram的技术报告也称,它的核心是一个基于Transformer的神经网络分类器,训练目标就是区分大型语言模型写出的文本和人类写出的文本。

也就是说,这类工具不是拿着一篇文章去查“AI文本数据库”,看它有没有命中某个已知样本。

它更像是在做模式识别。这篇文字的词汇选择、句子节奏、结构安排、语义连接方式,更接近它见过的人类文本,还是更接近它见过的AI文本。

更麻烦的是,这其中有太多特殊情况。如果一篇文章是人类写初稿,再用AI润色几句话,怎么算?如果是AI生成提纲,人类重新写成全文,怎么算?如果一段英文资料被AI翻译成中文,作者再人工修改,检测工具还能不能判断?如果一个学生本来就是非英语母语写作者,句子更规整、更模板化,会不会更容易被误伤?

在绘画领域也一样。有的画师就哀嚎——确实结构画得有问题,那是因为我技艺还需要修炼,不是因为这是AI画的呀!

2023年,斯坦福大学研究者测试了7个AI文本检测器。

他们选取了91篇非英语母语学生写的托福作文——这些作文来自托福官方考试语料,本身就是学生在真实考试环境下手写完成的,因此可以确认并不是AI生成。

结果其中89篇至少被一个检测器标记为AI生成;平均误报率达到61.22%;还有18篇被7个检测器一致判定为AI生成。也就是说,这些学生明明是在写一门外语,却因为表达更规整、更接近模板,被工具当成了机器。

当然,2023年、2024年的检测工具不能简单等同于今天的检测工具。过去几年里,商业检测器确实在迭代,一些新工具在特定测试里的表现已经明显提升。

但问题并没有得到解决。

“误判”没有被完全消除,就会给矛盾留下缝隙。

毕竟,工具给出的本来是概率,但落到人身上,就变成了指控。

04

说好的“水印”呢?

更大的问题在于,AI公司是不是应该做“来源标记”?

给所有AI内容打上原生“水印”、去不掉的那种,不就可以解决鉴别问题?

很多人一听到“水印”,想到的还是图片角落里的logo、视频画面上的平台标识,或者“AI生成”几个大字。

但今天的AI水印早就不只是这种肉眼可见的记号。

行业里大致有两类做法:一类是元数据,比如C2PA和Content Credentials,相当于给数字内容附上一张“身份说明”,记录它由什么工具生成、什么时候生成、经历过哪些编辑;

另一类是隐形水印,把人眼难以察觉、但机器可以识别的信号嵌进图像、音频、视频甚至文本里。

在图像和视频领域,这些方案已经开始落地。

谷歌DeepMind的SynthID可以给Imagen、Veo、Lyria、Gemini等工具生成的内容嵌入隐形水印。

Meta表示,Meta AI生成或编辑的图像会加入可见水印、不可见水印和元数据;OpenAI也为DALL·E 3和ChatGPT生成图片加入C2PA内容凭证,并在后来引入SynthID隐形水印。Adobe、微软、谷歌、Meta、OpenAI等公司也都参与了C2PA和内容凭证生态。

这说明,AI公司也清楚只靠肉眼判断“像不像AI”是不够的。它们已经在尝试用元数据、内容凭证、隐形水印和平台标签,为AI生成内容留下机器可读的来源信号。

但这些方案并不完美。元数据可以在截图、压缩、转发、重新上传时丢失;可见水印可以被裁掉或遮住;隐形水印更耐用,但也可能被后期处理、扰动或再生成削弱。

更关键的是,这些方案通常只能识别接入了对应系统,并且保留了对应标记的内容。也就是说,谷歌的SynthID主要识别带有SynthID的内容,OpenAI的内容凭证主要说明内容来自OpenAI系统。只要内容来自没有接入标记的模型,或者经过多次搬运,来源链就可能断掉。

到了文本,问题更复杂。

文本当然也可以做水印。它的原理是在模型生成文字时,悄悄改变某些词的选择概率,让最终文本呈现出一种人眼读不出来、但检测器可以识别的统计模式。简单说,就是让AI留下自己的“用词指纹”。

谷歌已经公开了SynthID-Text,称它可以给Gemini生成的文本嵌入水印。OpenAI也很早就被期待解决这个问题。2023年7月,OpenAI、谷歌、Meta、亚马逊、Anthropic、微软等公司达成自愿承诺,表示将研发机制,帮助用户识别AI生成内容,包括水印和内容来源标记。

但几年过去,图像、音频、视频的标记方案不断推进,文本却仍然没有一个清晰、默认启用、公众可用的通用答案。

OpenAI曾在2023年推出过AI Text Classifier,用来判断一段文字是否由AI生成,但上线时就提醒用户不要把它作为决策的唯一依据。

半年后,OpenAI因为准确率太低将其下线。

2024年,《华尔街日报》又报道称,OpenAI内部其实已经开发出一种文本水印工具,在足够长的ChatGPT生成文本上,有效率可以达到99.9%。但OpenAI最终没有公开发布它。

原因也不完全是技术问题。报道提到,OpenAI担心文本水印引发用户反弹、影响产品使用,也担心非英语用户承受额外污名化。

还有调查显示,接近30%的ChatGPT用户表示,如果启用文本水印,他们可能会减少使用。

到最后,回到“鉴AI”与“自证清白”的两方拉扯上,以上提到的所有水印方案,还不能做到万无一失。

人类有一句话是“道高一尺魔高一丈”,还有一句话是“上有政策下有对策”,只要人类还相信这两句话,“鉴AI”就不会停止。

也许有一天,“AI参与”成为默认状态,“人类原创”变得异常稀有,这场大规模的“鉴AI”与“自证清白”的拉扯才会失去意义。

本文来自微信公众号“直面AI”(ID:faceaibang),作者:小金牙,编辑:王靖

Связанные с этим вопросы

Q文章中提到AI越来越强导致出现了一种什么新的社会现象?

A文章中提到,出现了一种新的社会秩序:人类开始被迫证明自己不是AI,进行所谓的“反向图灵测试”。这意味着作家、画师等创作者需要自证清白,解释自己的创作过程,以应对被质疑作品是AI生成的指控。

Q英联邦短篇小说奖的争议事件中,检测工具Pangram和Claude分别给出了什么不同的判定结果?

A在英联邦短篇小说奖的争议事件中,AI检测工具Pangram将获奖作品判定为“100%AI生成”。然而,当杂志社用Claude模型进行复核时,Claude无法给出确定的答案,即无法确认该作品是否由AI生成。这凸显了不同AI检测工具结果可能不一致的问题。

Q文章认为画师们为了“自证清白”,主要采取了哪些方法?

A画师们为了应对“鉴AI”指控,主要采取的方法有:1. 录屏展示所有的图层,以证明绘画步骤。2. 在绘画时全程录屏,作为最稳妥的自证手段。3. 在遭遇严重质疑时,与指控方“对赌”,并通过约定时间进行多机位直播绘画过程来证明自己(例如一个机位展示屏幕,另一个机位展示画师本人)。

Q当前文本“鉴AI”工具存在的主要技术局限性是什么?

A当前文本“鉴AI”工具(如Pangram)的主要技术局限性在于:它们不是精确匹配已知AI文本数据库,而是通过分析文本的统计特征(如结构、风格、语义模式)来判断其更像人类写作还是AI写作。这本质上是一种概率判断,容易导致误判。例如,非英语母语者的规整写作风格、AI润色过的文本等都容易被误判为AI生成,而不同工具之间也可能得出矛盾的结论。

QAI公司提出的“水印”解决方案目前存在哪些问题与不足?

AAI公司提出的“水印”解决方案目前存在的主要问题与不足包括:1. 元数据(如C2PA)可能在截图、压缩、转发过程中丢失。2. 可见水印容易被裁剪或遮盖。3. 隐形水印(如SynthID)虽然更耐用,但仍可能被后期处理削弱。4. 更重要的是,这些方案通常是“各自为政”的,只能识别特定系统生成并保留了标记的内容,对未接入标记的模型或经过多次搬运的内容无效。在文本领域,尽管技术上可行,但出于用户体验、潜在污名化等顾虑,尚未有广泛部署的通用文本水印方案。

Похожее

Anthropic's IPO Launch: Commercial Miracle or Valuation Bubble?

Anthropic has confidentially filed for an IPO, led by Morgan Stanley and Goldman Sachs, potentially going public by October. Following its latest $650 billion funding round, its pre-IPO valuation stands at $965 billion, with projections reaching up to $2 trillion at listing, which would make it the highest-valued private company ever. The article, written by Fu Sheng, addresses skepticism that this represents an AI bubble akin to the 2000 dot-com crash. It argues the current situation differs fundamentally. Unlike the internet bubble era, which relied on speculative narratives with little revenue, Anthropic's valuation is backed by unprecedented, measurable financial performance. Key data points include: * **Revenue Growth:** ARR skyrocketed from $10 billion in early 2025 to $470 billion by May 2026, targeting $100 billion by year-end—a growth curve unmatched in business history. * **Profitability:** It achieved operating profitability in Q2 2026 with an estimated $5.6 billion profit. * **Efficiency:** With ~3,000 employees and ~$470 billion ARR, its revenue per employee exceeds $10 million. Products like Claude Code, launched less than a year ago, already generate $25 billion in annualized revenue. * **Enterprise Adoption:** It boasts a strong enterprise client base, with 8 of the Fortune 10 and over 1,000 large firms spending over $1 million annually on Claude. The valuation is framed using a traditional SaaS model (e.g., a 10x Price-to-Sales multiple on $100 billion revenue). The author contends the core question for analysts has shifted from "How big could this be?" to "How much is it earning and will earn next quarter?" The discussion extends beyond Anthropic to a broader paradigm shift: the transition from a "carbon-based" to a "silicon-based" economy. Companies are increasingly prioritizing investment in compute and AI capabilities over human resources, as these directly scale productivity and competitive advantage. Anthropic's IPO is thus positioned not just as a corporate milestone, but as a price anchor for this new economic era.

链捕手5 ч. назад

Anthropic's IPO Launch: Commercial Miracle or Valuation Bubble?

链捕手5 ч. назад

Торговля

Спот
Фьючерсы

Популярные статьи

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

2025 год — год институциональных инвесторов, в будущем он будет доминировать в приложениях реального времени.

1.8k просмотров всегоОпубликовано 2025.12.16Обновлено 2025.12.16

Неделя обучения по популярным токенам (2): 2026 может стать годом приложений реального времени, сектор AI продолжает оставаться в тренде

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на AI (AI) представлены ниже.

活动图片