马斯克资助的 ChatGPT 与 AIGC 对内容生态的挑战

DoraFactoryPublished on 2022-12-08Last updated on 2022-12-08

Abstract

在这个舆论时常反转的时代,只要一个消息听起来合理,许多人就会认为这是正确的。

在这个舆论时常反转的时代,只要一个消息听起来合理,许多人就会认为这是正确的。

Elon Musk 创立的 OpenAI 基金会的最新聊天机器人 ChatGPT 以其强大写作、对话能力席卷了网络世界。ChatGPT 是一种由人工智能驱动的聊天机器人,它以一种令人信服的对话方式与用户互动。ChatGPT 对问题深思熟虑和全面的回答(即使不准确)令用户震惊,包括学术界和科技行业。

该工具迅速走红。周一,Open AI 的联合创始人、著名的硅谷投资者 Sam Altman 在 Twitter 上表示,ChatGPT 的用户已突破 100 万。

知名的科技投资人 Box 首席执行官 Aaron Levie 也表示:「当一项新技术调整了你对计算的想法时,会有一种特定的感觉。谷歌、 火狐、 AWS 、iPhone 都做到了。OpenAI 正在通过 ChatGPT 做到这一点。」

与其他人工智能工具一样,ChatGPT 也可能扰乱创意产业、延续偏见和传播错误信息。如 Stack Overflow 暂时禁止用户分享 ChatGPT 生成的回复。因为 ChatGPT 很容易与用户互动,且可以快速生成大量回答,这让网站充斥着许多第一眼看起来是正确的答案,但在仔细检查后就能发现其中的错误。

因此,本文,我们将讨论最近流行的 AIGC 工具 ChatGPT 及此类工具对内容生态审核制度的挑战。

01. 什么是 ChatGPT

Generative Pre-trained Transformer (GPT),是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。

2018 年,NLP(自然语言处理)的预训练模型元年,GPT-1 诞生,此时的 GPT-1 仅是一个语言理解工具而非对话式 AI。2019 年 GPT-2 采用更多的网络参数与更大的数据集进行训练,此时的 GPT-2 展现出普世且较强的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。随后,GPT-3 出现,作为一个无监督模型(自监督模型),几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。GPT-3 的出现使人们看到了通用人工智能的希望。

今天,ChatGPT 的到来,也被视为文本生成器 GPT-3 的下一个迭代,为 GPT-4 到来拉开序幕。

ChatGPT 是一种大型语言模型,通过大量在线信息进行训练并创建其响应。注册 ChatGPT 后,用户可以要求人工智能系统回答一系列问题,这些问题包括开放性问题:例「生命的意义是什么?『加密货币值得投资』?」「什么是 Hacker Movement」等。

02. ChatGPT 如何工作的?

谈到 ChatGPT 的算法模型, 其前身 InstructGPT 仍值得关注。

2022 年初,OpenAI 发布了 InstructGPT。开发人员通过结合监督学习 + 人类反馈强化学习,提高 GPT-3 的输出质量。在这种学习中,人类对模型的潜在输出进行排序,强化学习算法则对产生类似于高级输出材料的模型进行奖励。

训练数据集以创建提示开始,其中一些提示是基于 GPT-3 用户的输入,比如「解释什么是 Hacker Movement」或「给一个小学生解释 Hacker」。

开发人员将提示分为三个部分,并以不同的方式为每个部分创建响应:

人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的 GPT-3 ,将它变成 InstructGPT 以生成每个提示的现有响应。

下一步是训练一个模型,使其对更好的响应做出更高的奖励。对于第二组提示,经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后,一个奖励模型(另一个预先训练的 GPT-3)学会了为评分高的响应计算更高的奖励,为评分低的回答计算更低的奖励。

开发人员使用第三组提示和强化学习方法近端策略优化(Proximal Policy Optimization, PPO)进一步微调了语言模型。给出提示后,语言模型会生成响应,而奖励模型会给予相应奖励。PPO 使用奖励来更新语言模型。

ChatGPT 和 InstructGPT 算法模型基本一样。不同之处在于数据如何被收集和训练。

InstructGPT :给一个输入就给一个输出,再跟训练数据对比,对了有奖励,不对有惩罚;

ChatGPT: 给一个输入,模型给出多个输出,然后人(AI 训练师)对输出结果排序,让模型使得这些结果从「更像人话」到「没有逻辑」排序。

与其他 AI 聊天机器人不同,本着构建更加负责任的强人工智能原则, ChatGPT 可以回答后续问题、承认错误、挑战不正确的问题并拒绝不适当的请求。

写在这里记起,科幻小说家艾萨克·阿西莫夫(Isaac Asimov)为机器人设定的行为准则—机器人三定律:

第一法则:机器人不得伤害人类,或坐视人类受到伤害;

第二法则:机器人必须服从人类命令,除非命令与第一法则发生冲突;

第三法则:在不违背第一或第二法则之下,机器人可以保护自己。

03. ChatGPT 等 AIGC 工具对内容生态的挑战

不可置疑的是 AIGC 对很多领域产生了积极的影响。如,文本创作、音乐创作、游戏文本生成等。随着 AIGC 工具的成熟,其甚至可自主编程、拼接生成新的协议。

但,此类工具向内容生态提出一个全新的问题即:如何应对 AIGC 的真实性。以 ChatGPT 为例:

在训练的强化学习 (RL) 阶段,对于问题,并没有真相和问题标准答案的具体来源;

训练模型更加谨慎,可能会拒绝回答(以避免提示的误报);

监督训练可能会误导 / 偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的 / 排名靠前的响应。

人工智能生成的答案有数千个,而这些答案通常需要具有专业知识的人详细阅读,才能确定答案实际上是错误的,这些错误信息很容易破坏以志愿者为基础的高质量问答社区。

纸质新闻时代,每个事实都必须包含权威的一手或二手资料来源,但现在已经很少有出版物有事实核查员,这就把责任推给了记者和编辑。信息爆炸时代,以人为媒介传播的虚假信息尚且让审核机制「头疼」,很难想象当人工智能开始传播虚假信息,所带来的挑战。尤其是在这个舆论时常反转的时代,只要一个消息听起来合理,许多人就会认为这是正确的。

Trending Cryptos

Related Reads

TechFlow Intelligence Bureau: Anthropic IPO Odds Exceed 80%, Iran Closes Strait of Hormuz Again, Triggering Oil Price Volatility

**Market Digest** **AI & Tech:** Anthropic is widely expected to announce an IPO before November 2026, raising questions about balancing its trillion-dollar valuation ambitions with its core "AI safety" mission. Brands are increasingly adopting AI-generated virtual influencers for marketing. Cloudflare introduced temporary accounts for AI agents to ease automation workflows. **Infrastructure & Hardware:** Google's IPv6 traffic surpassed 50%, marking a major internet milestone. Goldman Sachs warned that massive projected AI capital expenditure ($5.3T) is approaching credit saturation limits, potentially curbing the "AI arms race." **Space & Robotics:** SpaceX's IPO saw a historic $370M retail buying frenzy in three days. Hyundai Motor Group plans to acquire full ownership of Boston Dynamics. Elon Musk speculated about future "septillion-dollar" investments in antimatter for interstellar travel. **Energy & Geopolitics:** Iran's military announced another closure of the strategic Strait of Hormuz, accusing Israel of violating a ceasefire, causing oil market volatility. However, ship-tracking data indicated some traffic continued. Concurrently, Iran resumed crude loadings at Kharg Island, potentially releasing up to 20 million barrels to the market. **Finance & Macro:** A European CLO (collateralized loan obligation) experienced its first post-2008-crisis-era equity tranche default, raising alarms in credit markets. Nomura warned that new Federal Reserve Chair Wash's perceived hawkish debut speech could signal a significant policy shift. **The Undercurrent:** Seemingly disparate events—the Strait of Hormuz tension, the European CLO default, and warnings on AI spending—point to a tightening of global liquidity and rising marginal costs across energy, credit, and tech investment. Meanwhile, capital continues chasing grand narratives like space exploration and advanced AI, highlighting a divergence where old-world leverage frays as new-world stories grow more ambitious.

marsbit5h ago

TechFlow Intelligence Bureau: Anthropic IPO Odds Exceed 80%, Iran Closes Strait of Hormuz Again, Triggering Oil Price Volatility

marsbit5h ago

Trading

Spot
Futures

Hot Articles

Discussions

Welcome to the HTX Community. Here, you can stay informed about the latest platform developments and gain access to professional market insights. Users' opinions on the price of ETH (ETH) are presented below.

活动图片