马斯克资助的 ChatGPT 与 AIGC 对内容生态的挑战

DoraFactory发布于2022-12-08更新于2022-12-08

文章摘要

在这个舆论时常反转的时代，只要一个消息听起来合理，许多人就会认为这是正确的。

Elon Musk 创立的 OpenAI 基金会的最新聊天机器人 ChatGPT 以其强大写作、对话能力席卷了网络世界。ChatGPT 是一种由人工智能驱动的聊天机器人，它以一种令人信服的对话方式与用户互动。ChatGPT 对问题深思熟虑和全面的回答（即使不准确）令用户震惊，包括学术界和科技行业。

该工具迅速走红。周一，Open AI 的联合创始人、著名的硅谷投资者 Sam Altman 在 Twitter 上表示，ChatGPT 的用户已突破 100 万。

知名的科技投资人 Box 首席执行官 Aaron Levie 也表示：「当一项新技术调整了你对计算的想法时，会有一种特定的感觉。谷歌、火狐、 AWS 、iPhone 都做到了。OpenAI 正在通过 ChatGPT 做到这一点。」

与其他人工智能工具一样，ChatGPT 也可能扰乱创意产业、延续偏见和传播错误信息。如 Stack Overflow 暂时禁止用户分享 ChatGPT 生成的回复。因为 ChatGPT 很容易与用户互动，且可以快速生成大量回答，这让网站充斥着许多第一眼看起来是正确的答案，但在仔细检查后就能发现其中的错误。

因此，本文，我们将讨论最近流行的 AIGC 工具 ChatGPT 及此类工具对内容生态审核制度的挑战。

01. 什么是 ChatGPT

Generative Pre-trained Transformer （GPT），是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。

2018 年，NLP（自然语言处理）的预训练模型元年，GPT-1 诞生，此时的 GPT-1 仅是一个语言理解工具而非对话式 AI。2019 年 GPT-2 采用更多的网络参数与更大的数据集进行训练，此时的 GPT-2 展现出普世且较强的能力，并在多个特定的语言建模任务上实现了彼时的最佳性能。随后，GPT-3 出现，作为一个无监督模型（自监督模型），几乎可以完成自然语言处理的绝大部分任务，例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。GPT-3 的出现使人们看到了通用人工智能的希望。

今天，ChatGPT 的到来，也被视为文本生成器 GPT-3 的下一个迭代，为 GPT-4 到来拉开序幕。

ChatGPT 是一种大型语言模型，通过大量在线信息进行训练并创建其响应。注册 ChatGPT 后，用户可以要求人工智能系统回答一系列问题，这些问题包括开放性问题：例「生命的意义是什么？『加密货币值得投资』？」「什么是 Hacker Movement」等。

02. ChatGPT 如何工作的？

谈到 ChatGPT 的算法模型，其前身 InstructGPT 仍值得关注。

2022 年初，OpenAI 发布了 InstructGPT。开发人员通过结合监督学习 + 人类反馈强化学习，提高 GPT-3 的输出质量。在这种学习中，人类对模型的潜在输出进行排序，强化学习算法则对产生类似于高级输出材料的模型进行奖励。

训练数据集以创建提示开始，其中一些提示是基于 GPT-3 用户的输入，比如「解释什么是 Hacker Movement」或「给一个小学生解释 Hacker」。

开发人员将提示分为三个部分，并以不同的方式为每个部分创建响应：

人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的 GPT-3 ，将它变成 InstructGPT 以生成每个提示的现有响应。

下一步是训练一个模型，使其对更好的响应做出更高的奖励。对于第二组提示，经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后，一个奖励模型（另一个预先训练的 GPT-3）学会了为评分高的响应计算更高的奖励，为评分低的回答计算更低的奖励。

开发人员使用第三组提示和强化学习方法近端策略优化（Proximal Policy Optimization， PPO）进一步微调了语言模型。给出提示后，语言模型会生成响应，而奖励模型会给予相应奖励。PPO 使用奖励来更新语言模型。

ChatGPT 和 InstructGPT 算法模型基本一样。不同之处在于数据如何被收集和训练。

InstructGPT ：给一个输入就给一个输出，再跟训练数据对比，对了有奖励，不对有惩罚；

ChatGPT：给一个输入，模型给出多个输出，然后人（AI 训练师）对输出结果排序，让模型使得这些结果从「更像人话」到「没有逻辑」排序。

与其他 AI 聊天机器人不同，本着构建更加负责任的强人工智能原则， ChatGPT 可以回答后续问题、承认错误、挑战不正确的问题并拒绝不适当的请求。

写在这里记起，科幻小说家艾萨克·阿西莫夫（Isaac Asimov）为机器人设定的行为准则—机器人三定律：

第一法则：机器人不得伤害人类，或坐视人类受到伤害；

第二法则：机器人必须服从人类命令，除非命令与第一法则发生冲突；

第三法则：在不违背第一或第二法则之下，机器人可以保护自己。

03. ChatGPT 等 AIGC 工具对内容生态的挑战

不可置疑的是 AIGC 对很多领域产生了积极的影响。如，文本创作、音乐创作、游戏文本生成等。随着 AIGC 工具的成熟，其甚至可自主编程、拼接生成新的协议。

但，此类工具向内容生态提出一个全新的问题即：如何应对 AIGC 的真实性。以 ChatGPT 为例：

在训练的强化学习（RL）阶段，对于问题，并没有真相和问题标准答案的具体来源；

训练模型更加谨慎，可能会拒绝回答（以避免提示的误报）；

监督训练可能会误导 / 偏向模型倾向于知道理想的答案，而不是模型生成一组随机的响应并且只有人类评论者选择好的 / 排名靠前的响应。

人工智能生成的答案有数千个，而这些答案通常需要具有专业知识的人详细阅读，才能确定答案实际上是错误的，这些错误信息很容易破坏以志愿者为基础的高质量问答社区。

纸质新闻时代，每个事实都必须包含权威的一手或二手资料来源，但现在已经很少有出版物有事实核查员，这就把责任推给了记者和编辑。信息爆炸时代，以人为媒介传播的虚假信息尚且让审核机制「头疼」，很难想象当人工智能开始传播虚假信息，所带来的挑战。尤其是在这个舆论时常反转的时代，只要一个消息听起来合理，许多人就会认为这是正确的。

你可能也喜欢

TechFlow 情报局：Anthropic IPO 赔率超 80%，伊朗再关霍尔木兹海峡引发油价震荡

**Anthropic有望2026年前IPO，AI安全承诺与万亿美元估值引关注。** AI虚拟网红成为品牌营销新趋势，成本低且可控。马斯克宣称未来需投入巨额资金研发反物质推进技术，用于星际旅行。伊朗再次关闭霍尔木兹海峡，引发油价震荡，但实际船只仍在部分通行，市场猜测其为谈判筹码。同时，伊朗恢复原油出口，约2000万桶原油将流入市场。高盛警告，全球约5.3万亿美元的AI资本支出可能触及信贷上限。Cloudflare推出AI代理临时账户功能，降低自动化门槛。Google IPv6流量占比突破50%，标志互联网进入新时代。现代汽车拟收购波士顿动力全部股份，加码机器人业务。 SpaceX上市引发散户狂热，三天净买入达3.7亿美元。欧洲出现后危机时代首次CLO股权违约，信贷市场拉响警报。乌克兰袭击俄石油设施，导致克里米亚燃料供应中断。野村证券警告，美联储新主席表态鹰派，政策紧缩力度可能超预期。 **今日暗线**：伊朗局势、欧洲信贷违约与AI投资饱和，均指向全球流动性收紧与边际成本上升。与此同时，资本仍在追逐如太空旅行、反物质等宏大叙事，新旧经济杠杆交替显现。

marsbit6分钟前

TechFlow 情报局：Anthropic IPO 赔率超 80%，伊朗再关霍尔木兹海峡引发油价震荡

marsbit6分钟前

ETH/BTC比率跌回2023年初水平，交易员争论以太坊价值

ETH/BTC汇率已回落至2023年初水平，目前在0.027附近，远低于2021年接近0.088的峰值。分析师Woetoe指出，以太坊相对于比特币处于历史低位，这引发了市场辩论：这是否是一个反向投资的机会，还是意味着以太坊面临结构性衰退？与此同时，ETH/USDT的美元计价图表显示出回调风险。SwallowAcademy的分析认为，在强劲的周初开盘后，ETHUSDT正进入看跌修正阶段，价格结构已被破坏，可能下探至1723美元甚至更低。当前局面呈现出一种有趣的风险组合：从相对价值看，ETH看似便宜，但技术图表却显示疲软和下行压力。对于以太坊多头而言，当务之急并非争论估值，而是需要重新夺回技术强势地位，并开始再次跑赢比特币。市场正在观察，这种廉价状态会持续多久，关键取决于其技术走势能否得到改善。

bitcoinist13分钟前

bitcoinist13分钟前

猎手反遭围猎，最能赚钱的MEV Bot被黑了

知名MEV Bot地址Jaredfromsubway.eth近期遭遇针对性的“反MEV蜜罐攻击”，损失超过750万美元。攻击者并非利用传统漏洞，而是通过精心部署66个伪装成主流资产的虚假合约与流动性池，制造套利机会诱骗该Bot自动执行交易并授权，最终利用后门逻辑盗取资产。 Jaredfromsubway.eth是以太坊网络上最活跃、盈利最高的MEV Bot之一，擅长通过“三明治攻击”等策略捕获交易滑点收益，历史累计收益达数千万美元级别，甚至曾狙击过Vitalik Buterin的交易。此次事件表明，即使是链上生态中的顶级“掠食者”也面临日益复杂的安全威胁。攻击者通过长期布局，利用了MEV Bot自动化策略的逻辑缺陷进行精准收割。事后，有冒充账户在社交媒体上虚假宣称悬赏追回资金，相关开发者已提醒用户警惕诈骗风险。

Odaily星球日报1小时前

Odaily星球日报1小时前

在熊市做音乐：一个比特币乐队的生存实验

在加密熊市背景下，比特币乐队Orange Pill Jam坚持创作与录音，探索金融主权、隐私和体制腐败等主题。乐队风格多元，接受比特币支付，在传统流媒体平台数据平平，但在特定社群备受喜爱。他们致力于制作既能让非比特币用户欣赏，又不刻意迎合比特币圈层的音乐。乐队起源于2022年卢加诺的Plan B论坛，主唱Mermaid为致谢比特币内容创作者而写的歌促成了乐队的形成。创作中，Mermaid负责歌词与旋律轮廓，制作人Michi则以其鼓手背景赋予节奏与身体感，两人在碰撞中形成乐队独特的张力。歌曲如《Cypherpunks' Manifesto》和《自由之火》探讨数字隐私、个人主权等理念，并将萨尔瓦多比特币合法化等真实体验融入其中。面对AI生成音乐的冲击，他们认为机器无法替代人类在创造新流派和捕捉意图与本能间微妙节奏的能力。乐队采用Copyleft模式，开放音乐分享与混音，接受各种货币赞助。在熊市与算法主导的流媒体环境中，他们面临收入与曝光的现实挑战，但坚持认为其音乐中不可复制的人类创造力与具体体验，是内容泛滥时代最宝贵的价值。他们的创作本身，即是对比特币信仰与人类艺术生命力的一次实验。

marsbit1小时前

marsbit1小时前

谷歌AI人才接连流失，是压力测试还是“讣告”前奏？

谷歌接连失去三位顶级AI人才：工程副总裁、Transformer架构提出者之一Noam Shazeer加入OpenAI；DeepMind副总裁、AlphaFold核心人物John Jumper加入Anthropic；对话式AI先驱Daniel De Freitas的动向也引人关注。这些流失触及了Transformer、对话式AI和科学AI等关键领域，引发市场对谷歌竞争力的担忧。然而，将此事视为谷歌的“讣告”可能为时过早。这更应被看作一次压力测试。人才流失本身反映了谷歌仍是AI顶级人才的核心储备库，正因其重要才成为竞争对手IPO前夜的重点挖掘对象。谷歌的优势在于其远超单一模型的“全栈”能力：拥有自研TPU、云基础设施、Gemini等模型矩阵，以及搜索、YouTube、安卓等覆盖数十亿用户的终端产品，构成了强大的集成生态和分发网络。此外，谷歌通过巨额投资和云服务与Anthropic等对手形成深度绑定，在“AI淘金热”中同时扮演“掘金者”和“卖水人”的角色。尽管面临创新者困境，核心搜索业务转型挑战以及大公司决策迟缓等问题，但谷歌正通过积极整合Gemini、重塑搜索体验、战略性收购（如Character.AI）等方式应对。AI竞赛是长期游戏，谷歌凭借其技术栈、资源与生态，仍是少数有能力在多层面参与竞争的公司。当前的动荡是一次严峻考验，但并非终局。

marsbit1小时前