BIP-110 Protocol: The Necessary Path to Bitcoin's Million-Dollar Milestone?

marsbitXuất bản vào 2026-02-09Cập nhật gần nhất vào 2026-02-09

Tóm tắt

This article argues that Bitcoin's path to reaching a $1 million valuation depends on maintaining its core monetary promise: a fixed supply of 21 million coins enforced by a decentralized, permissionless node network. The author identifies a systemic attack on this network, enabled by a vulnerability (CVE-2023-50428) in Bitcoin Core that allows non-monetary data (like Ordinals inscriptions and BRC-20 tokens) to bypass spam filters via Taproot transactions. While Bitcoin Knots patched this, Bitcoin Core not only refused to fix it but also removed OP_RETURN size limits in version 30, further bloating the blockchain. The proposed solution, BIP-110, would filter out non-monetary data transactions (41.5% in a 10-day sample) without affecting any legitimate financial transactions, reclaiming 36% of block space. The author contends that prioritizing monetary use over non-monetary data storage is essential to preserve node accessibility, decentralization, and long-term credibility for institutional adoption. The article urges node operators to switch to Bitcoin Knots to enforce BIP-110 and protect Bitcoin's monetary integrity.

Original Author: Justin Bechler

Original Compilation: AididiaoJP, Foresight New

Permissionless execution of Bitcoin's monetary policy and a distributed network of nodes are the sole sources of credibility that have propelled Bitcoin from zero to $125,000.

To reach the $1 million target, a similar level of credibility is required, but on a scale sufficient to meet the needs of sovereign wealth funds and central banks holding assets for decades.

Be very clear about this: the network and its nodes are under systemic attack, and Bitcoin Core has left the door wide open for it. But for the first time since the attack began, a real proposal is on the table that will stop it all.

This article explains this attack, the evidence behind the fix, and why the path to $1 million must go directly through it.

What Gives Bitcoin Value

Bitcoin's entire value proposition is based on a monetary guarantee.

The fact that there will only ever be 21 million Bitcoin is enforced by a distributed network of nodes that independently verify every transaction. This guarantee holds because ordinary people around the world can easily run the node software that enforces it.

This is precisely what distinguishes Bitcoin from all other centralized "crypto" projects. Ethereum has a foundation; Solana has a handful of validators running enterprise hardware; XRP has Ripple Labs. Each of these projects has a centralized bottleneck point that could be pressured, subpoenaed, sanctioned, or simply persuaded to change the rules. Bitcoin does not, because anyone with an ordinary computer and an internet connection can run a fully validating node, permissionlessly, without intermediaries, and without trusting anyone, interacting directly with the monetary protocol.

Gold requires trusting appraisers, bonds require trusting governments, stocks require trusting auditors. Bitcoin only requires trusting math and the nodes that run it.

Each node operator validating the chain is a vote for the monetary policy. The more nodes, the more decentralized the validation, and the more credible this guarantee appears to the capital that can push the asset into seven-figure territory.

Therefore, when something threatens the accessibility of running a node, it threatens Bitcoin's value and existence itself.

The Vulnerability Where It All Began

Bitcoin Core has included spam transaction filtering as a standard feature from day one. Since 2013, node operators have been able to set a limit on the size of extra data embedded in transactions through a configuration option called -datacarriersize. This was a deliberate design decision. The developers building and maintaining the protocol understood that without size limits on non-monetary data, the blockchain would inevitably be abused as a cheap data storage system, at the expense of every node operator on the network.

This system worked for a decade. Then, in early 2023, Casey Rodarmor launched the Ordinals protocol, and the dam broke.

Ordinals exploited a vulnerability in Bitcoin Core's spam filter. The existing data carrier limits were never extended to cover Taproot transactions introduced in the November 2021 upgrade. This meant that by disguising arbitrary data as program code within the Tapscript witness space, using an OP_FALSE OP_IF wrapper that is never actually executed, anyone could bypass the data size limits meant to prevent such abuse. Images, text files, BRC-20 token mints, and all other forms of non-monetary data could now be permanently embedded in the Bitcoin blockchain at a cost far below that of normal data transactions, thanks to the SegWit witness discount subsidy designed to reduce signature verification costs.

@LukeDashjr identified this as a vulnerability from the start. In December 2023, he formally registered the vulnerability in the NIST National Vulnerability Database as CVE-2023-50428, receiving a medium severity score of 5.3. The official description is precise: "In Bitcoin Core through 26.0 and Bitcoin Knots through 25.1.knots20231115, by obfuscating data as code (e.g., using OP_FALSE OP_IF), the data carrier size limit can be bypassed, as exploited in 2022 and 2023 in the case of inscriptions."

Luke was clear about what this meant. "Spam filtering has been a standard part of Bitcoin Core since day one," he explained. The failure to extend these filters to Taproot transactions was a bug, and inscriptions were exploiting this bug to attack the network. "The damage it has done to Bitcoin and Bitcoin users, including future users, is huge and irreversible," he wrote. "Ordinals were never permitted. It has been an attack on Bitcoin from the beginning."

The alternative node implementation Bitcoin Knots, maintained by Dashjr, patched CVE-2023-50428 in its 25.1 release in late 2023. The Ocean mining pool immediately deployed the fix, announcing its blocks would now contain "more real transactions" and characterizing Ordinals inscriptions as a denial-of-service attack on the network.

Bitcoin Core never patched it.

A formally registered NIST vulnerability, scored, exploited in millions of transactions, adding gigabytes of permanent bloat to every full node on the network, and the primary node software used by the vast majority of the Bitcoin network refuses to fix it. The patch exists, is tested, and is in production use on Knots. Core chose not to apply it and has instead moving further in the opposite direction.

Core 30: A Tax on Every Node

While BIP-110 proposed protecting nodes from data bloat, Bitcoin Core version 30 did the opposite. Instead of patching CVE-2023-50428, Core 30 completely removed the long-standing OP_RETURN size limit, opening the door to unlimited arbitrary data in OP_RETURN outputs.

The rationale provided by Core developers was that the existing 80-byte limit was being circumvented anyway, so maintaining it was pointless. This is like a city council stopping speed limit enforcement because people speed, and it directly contradicts the decade-long precedent noted by Dashjr.

Bitcoin Core maintained data carrier size limits since 2013 because developers understood that protecting block space from non-monetary abuse was crucial to keeping nodes accessible. Core 30 abandoned this principle.

The practical effect is a tax on every node runner. Unlimited OP_RETURN data means nodes must download, verify, and store an unlimited amount of data. And for what? The beneficiaries of this change are a handful of developers building non-monetary applications on Bitcoin who found the existing limits inconvenient.

Jameson Lopp argued for the change based on "extreme edge cases" unrelated to Bitcoin's function as money, yet highly relevant to his VS startup Citrea, which is "building on Bitcoin."

Ordinary people hate this.

In 2013, Core introduced data carrier limits to protect nodes from data spam. These limits worked for a decade. In 2023, a vulnerability allowed inscriptions to bypass these limits via Taproot, and Core refused to patch it.

In 2025, Core completely removed the limits. Each step makes nodes heavier and more expensive to run, each step moves further from the principle that "Bitcoin block space is for monetary transactions."

This is the fundamental contradiction in current Bitcoin development. One faction wants to keep the network a lean, accessible monetary protocol verifiable by anyone with a Raspberry Pi.

The other faction wants to expand the protocol's capabilities to accommodate any creative use case developers can imagine, and they are willing to make nodes heavier and more expensive to do it.

The first group is moving towards a $1 million Bitcoin. The second group is moving towards a "better version of Ethereum."

The Data: What BIP-110 Actually Does

@CunyRenaud just released a revised simulation of BIP-110, covering 10 days of mainnet data, from block height 929,592 to 931,032.

The results are unambiguous.

Out of 4.7 million transactions in the sample period:

1,957,896 transactions were filtered out by BIP-110 (41.5% of all transactions).

747.85 MB of block space was reclaimed (36%).

Zero legitimate financial transactions were blocked.

Out of nearly five million transactions, not a single monetary transfer was caught by the filter. Every payment, every exchange withdrawal, every Lightning channel open, every CoinJoin, every multisig spend went through smoothly.

A breakdown of the results reveals an important fact most in this debate have missed. The community has treated Ordinals inscriptions and OP_RETURN spam as two separate problems. They are not.

Of the inscription transactions caught by BIP-110, 94.6% were mixed transactions, carrying both a Tapscript OP_IF inscription wrapper and an OP_RETURN output containing Rune metadata. When BIP-110 filtered out the inscription, the associated OP_RETURN data went with it.

The narrative of "two spam problems" collapses in the face of the data. Bitcoin has one spam problem with two manifestations, and BIP-110 solves both simultaneously.

The Rule That Carries the Weight

BIP-110 contains multiple rules, but Rule 7 is the most critical. It prohibits the use of the OP_IF and OP_NOTIF opcodes within Tapscript execution. This directly targets the mechanism described in CVE-2023-50428, the OP_FALSE OP_IF wrapper that Ordinals inscriptions use to embed arbitrary data in the witness space.

Rule 7 alone caught 1,954,477 transactions in the simulation, 99.8% of all filtered transactions. Effectively, it is the patch Core refused to release, now formalized as a consensus rule with a one-year activation window.

An obvious question is whether this breaks any real functionality. The simulation specifically searched for legitimate Tapscript contracts using OP_IF, including conditional branches, timelocks, threshold signatures, and hash timelock contracts.

The answer, out of 4.7 million transactions, was zero. These patterns do not exist in mainnet Tapscript today. The Lightning Network still runs on SegWit v0, DLCs use adapter signatures, and vault implementations are still experimental.

The theoretical concern that Rule 7 might hinder future smart contracts is worth acknowledging. It might, but BIP-110's activation period is one year, not permanent. The inscription flood is happening *now*, and the damage to the UTXO set accumulates daily.

A one-year intervention that eliminates 41.5% of transaction spam while blocking zero financial activity is a trade-off that favors action.

Bitcoin Is Money

Some will oppose BIP-110 on the grounds that "any transaction that pays a fee is legitimate." Inscription users pay the market rate, miners voluntarily include their transactions, by what authority can they be filtered out?

The answer lies in understanding what Bitcoin actually protects and why.

Bitcoin's censorship resistance is designed to guarantee *monetary transactions*. The proof-of-work, the difficulty adjustment, the block reward schedule, and the entire security model are designed to protect a peer-to-peer electronic cash system.

That design, that single purpose, is what justifies the immense energy expenditure required to protect the network.

Monetary transactions on Bitcoin are uncensorable. This is the very property that makes Bitcoin valuable, and it's a property BIP-110 leaves entirely intact. If you are sending or receiving Bitcoin as money, BIP-110 does not affect you. The simulation proves this empirically. 2.5 million financial transactions passed through, unaffected.

The existence of non-monetary transactions is contingent on the network's forbearance. No one is outlawing them by decree, no one is arresting inscription users. The argument is simply that storing NFT data and token minting instructions in the witness space does not merit the same protocol-level protection as transferring value between people. When non-monetary use begins to threaten the infrastructure that makes monetary use possible, the network is fully within its rights to prioritize its core function.

This is not censorship. Censorship is when a government stops your payment because it dislikes your politics. Filtering out operations that exploit a vulnerability that should have been patched years ago for data storage is network maintenance. This distinction matters, and anyone conflating the two is either confused or arguing in bad faith.

When critics argue that miners would never voluntarily stop including inscription transactions, Dashjr articulated this clearly: "Bitcoin operates under the assumption that most miners are honest, not malicious." The security model assumes miners will act in the long-term interest of the network, not damage the infrastructure that makes fees valuable for the sake of maximizing short-term fee revenue.

The Path to $1 Million

Imagine explaining Bitcoin to a sovereign wealth fund manager in 2028. You are arguing that this asset deserves a permanent allocation alongside gold and treasury bonds.

The argument rests on three pillars: a fixed supply, censorship-resistant transactions, and decentralized validation. If any one of these pillars is weakened, the argument weakens. If the supply schedule can be changed, Bitcoin is just another, better-marketed fiat. If transactions can be censored, Bitcoin is just a slow database.

If validation becomes centralized to a few data centers because running a node becomes too expensive, then Bitcoin's monetary guarantee becomes a gentleman's agreement enforced by entities with identifiable interests and political pressure points.

Inscription-driven UTXO bloat directly attacks the third pillar. It makes nodes more expensive, makes validation more centralized, and damages the decentralization that makes the monetary guarantee credible. And it does all this to provide a service unrelated to money that can be done more efficiently on systems built for the purpose.

Arbitrary data storage is a solved problem; Bitcoin does not need to be Filecoin.

Meanwhile, Core's trajectory—from refusing to patch CVE-2023-50428 to actively removing OP_RETURN limits in version 30—shows that the current development leadership is willing to let nodes become bloated to serve non-monetary use cases. BIP-110 resists this trajectory. It signals that the network's priority is money, the node network exists to validate money, and the protocol should be optimized for money.

BIP-110 eliminates the inscription attack vector for one year, while completely unaffected every single financial transaction on the network. It eliminates 41.5% of spam transactions and reclaims 36% of block space. Out of 4.7 million transactions tested, it produced zero false positives. And it preserves the option to reassess as data on legitimate Tapscript usage becomes clearer.

The path to a $1 million Bitcoin is paved by the credibility of the monetary policy, the credibility of censorship resistance, and the credibility of the decentralized validation network that enforces both.

A $1 million Bitcoin stands or falls with the node network.

What You Can Do

If you run a node, you have a say in this.

Research the BIP-110 specification. Review the simulation data published by Bitcoin Block Space Weekly. If you have the technical ability, run the numbers yourself. Then decide based on what the evidence shows, not what the loudest voices on social media tell you to think.

If you're ready to act, switching from Bitcoin Core to Bitcoin Knots is easier than most think. If you run Umbrel, Start9, MyNode, or RaspiBlitz, Knots is a one-click install in your app market, and your existing blockchain data can be moved over. If you run Core on desktop or bare-metal Linux, the migration is just as straightforward. Either way, you can be running Knots and enforcing BIP-110 in minutes.

Every node that switches to Knots is a vote for Bitcoin's future as money, and every vote matters.

The data is clear, the trade-offs are honest, and the window is one year. The cost of inaction is gigabytes of permanent data bloat added to every node on the network, daily.

Bitcoin is money, and BIP-110 keeps it that way.

Bitcoin will not survive as a non-monetary arbitrary data relay and storage.

If you believe that, then you are running a sovereign, censorship-resistant node, using Bitcoin as money, permissionlessly.

Câu hỏi Liên quan

QWhat is the core value proposition of Bitcoin according to the article, and how is it being threatened?

AThe core value proposition of Bitcoin is its monetary guarantee—a fixed supply of 21 million coins enforced by a distributed network of nodes that independently validate every transaction. This guarantee is threatened by the Bitcoin Core development team's refusal to patch the CVE-2023-50428 vulnerability, which allows non-monetary data (like Ordinals inscriptions) to bloat the blockchain, making nodes more expensive to run and centralizing the validation network.

QWhat specific vulnerability does CVE-2023-50428 describe, and how is it exploited?

ACVE-2023-50428 is a vulnerability in Bitcoin Core's spam filter that allows arbitrary data to be disguised as Tapscript code using an OP_FALSE OP_IF wrapper. This bypasses the existing data carrier size limits, enabling inscriptions and other non-monetary data to be embedded in the blockchain at a subsidized cost, exploiting the SegWit witness discount.

QWhat is the primary function of Rule 7 in the proposed BIP-110, and what evidence supports its implementation?

ARule 7 in BIP-110 prohibits the use of OP_IF and OP_NOTIF opcodes in Tapscript execution, specifically targeting the OP_FALSE OP_IF mechanism used by Ordinals inscriptions to bypass data limits. A 10-day simulation on the Bitcoin mainnet showed that this rule filtered 41.5% of transactions (1.95 million), all of which were non-monetary, while zero legitimate financial transactions were blocked.

QHow does the article differentiate between censorship and network maintenance in the context of filtering non-monetary transactions?

AThe article argues that censorship is when a government blocks a payment for political reasons. Filtering non-monetary data transactions that exploit a vulnerability and bloat the blockchain is network maintenance. It prioritizes Bitcoin's core monetary function and protects the infrastructure that makes monetary transactions possible, without affecting any financial payments.

QWhat practical step does the article recommend for node operators who support BIP-110's goals?

AThe article recommends that node operators switch from Bitcoin Core to Bitcoin Knots, which has already patched the CVE-2023-50428 vulnerability and enforces BIP-110. This can often be done with a one-click installation on popular node software like Umbrel, Start9, MyNode, or RaspiBlitz, and it allows operators to vote for Bitcoin's future as a monetary protocol.

Nội dung Liên quan

Zcash Chứng Kiến Sự Sụp Đổ Lịch Sử Khi Hàng Tỷ Đô La Biến Mất Khỏi Giá Trị Thị Trường

Thị trường tiền điện tử chấn động bởi sự sụp đổ mạnh mẽ của Zcash (ZEC), đồng tiền tập trung vào quyền riêng tư đã mất hơn một nửa giá trị chỉ trong 24 giờ. Sự sụt giảm đột ngột này xóa sổ khoảng 5 tỷ USD từ vốn hóa thị trường của nó. Nguyên nhân chính được cho là do lo ngại xung quanh một lỗ hổng bảo mật vừa được tiết lộ ảnh hưởng đến cơ sở hạ tầng riêng tư của mạng lưới. Lỗ hổng này, ẩn trong nhóm giao dịch riêng tư Orchard của Zcash từ tháng 5/2022, cho phép tạo ra ZEC giả mạo trong thử nghiệm. Mặc dù đã được vá vào ngày 2/6, thiết kế bảo mật của Zcash khiến không thể xác minh liệu có đồng ZEC giả nào đã được tạo ra trước đó hay không, dẫn đến sự hoang mang và bán tháo. Tình huống này làm nổi bật sự đánh đổi giữa tính riêng tư và minh bạch. Để khôi phục niềm tin, Shielded Labs đang xem xét một đề xuất nâng cấp mạng lưới cho phép xác minh tính toàn vẹn của tổng nguồn cung Zcash. Cộng đồng Zcash nhấn mạnh rằng việc phát hiện lỗ hổng là kết quả của quy trình nghiên cứu bảo mật đẳng cấp và chủ động, một dấu hiệu tích cực cho thấy mạng lưới liên tục được củng cố.

bitcoinist4 phút trước

Zcash Chứng Kiến Sự Sụp Đổ Lịch Sử Khi Hàng Tỷ Đô La Biến Mất Khỏi Giá Trị Thị Trường

bitcoinist4 phút trước

Câu chuyện về Bitcoin "Vàng Kỹ Thuật Số" có thất bại hay không?

**TÓM TẮT** Bài viết phân tích Bitcoin từ góc nhìn của Jason, tập trung vào ba vấn đề chính: bản chất của Bitcoin, nguyên nhân đợt giảm giá gần đây và triển vọng dài hạn. **1. Cách nhìn nhận tài sản Bitcoin:** Tác giả vẫn coi Bitcoin là một lớp tài sản mới, ưu việt hơn vàng về tính chất "vàng kỹ thuật số" nhờ: nguồn cung cố định (21 triệu BTC), khả năng chuyển giao vượt trội và tính minh bạch có thể kiểm chứng. Dù vẫn còn sớm (tỷ lệ thâm nhập toàn cầu ~3-4%) và biến động mạnh, quá trình hợp pháp hóa đang đẩy lùi các hoạt động phi chính thức. **2. Nguyên nhân đợt giảm giá 2025-2026:** Đợt giảm khoảng 50% từ đỉnh 12.6万美元 xuống dưới 6.1万美元 là một đợt bán theo chu kỳ có tính đồng thuận cao, phù hợp với mô hình lịch sử sau mỗi lần giảm một nửa phần thưởng. Sự kiện ETF Bitcoin năm 2024 đã mở đường cho dòng tiền tổ chức mua vào, đồng thời tạo cơ hội cho các nhà đầu tư sớm (có giá gốc rất thấp) chốt lời, dẫn đến một đợt "chuyển giao lịch sử" từ những người tin tưởng ban đầu sang các tổ chức đầu tư dài hạn. Một điểm đáng chú ý là biên độ các đợt sụt giảm trong lịch sử đang thu hẹp dần (từ 93% xuống còn ~50%), cho thấy tài sản đang trưởng thành và biến động giảm bớt. **3. Triển vọng dài hạn:** Về dài hạn, nếu tin vào luận điểm "vàng kỹ thuật số", giá trị Bitcoin nên được định giá theo vàng vật chất. Với vốn hóa hiện tại (~1.4 nghìn tỷ USD) chỉ bằng 7% vốn hóa vàng (~20 nghìn tỷ USD), tiềm năng tăng trưởng vẫn còn rất lớn nếu luận điểm này được hiện thực hóa một phần. Tuy nhiên, tác giả cảnh báo rủi ro thực sự không nằm ở bản thân Bitcoin (xác suất về 0 thấp hơn xác suất tăng trưởng), mà ở hai yếu tố: **cơ cấu danh mục đầu tư** (không all-in, vay mượn) và **độ hiểu biết sâu sắc về tài sản**. Chỉ khi hiểu rõ logic cốt lõi, nhà đầu tư mới có thể giữ vững lập trường qua các đợt biến động mạnh. Bài học từ Amazon (sụt 95% năm 2000 rồi tăng 42 lần) cho thấy điều quan trọng là "sống sót" được đến lúc tiềm năng được giải phóng. Câu hỏi cuối cùng được đặt ra: Liệu đợt giảm giá này chứng minh luận điểm "vàng kỹ thuật số" đã thất bại, hay chỉ đơn giản là quá trình chuyển giao chưa kết thúc? Câu trả lời phụ thuộc vào niềm tin nền tảng của mỗi người vào loại tài sản này.

marsbit29 phút trước

Câu chuyện về Bitcoin "Vàng Kỹ Thuật Số" có thất bại hay không?

marsbit29 phút trước

Chủ đề “Vàng kỹ thuật số” của BTC có thất bại không?

Tác giả, qua góc nhìn của Jason, phân tích về Bitcoin dưới ba khía cạnh chính: bản chất của tài sản Bitcoin, nguyên nhân đợt giảm giá gần đây và triển vọng dài hạn. **1. Bản chất của Bitcoin:** Tác giả coi Bitcoin là một loại tài sản mới, một phiên bản "vàng kỹ thuật số" ưu việt hơn nhờ tính chất: nguồn cung cố định (21 triệu), khả năng chuyển giao và kiểm toán vượt trội. Dù còn sớm với tỷ lệ thâm nhập toàn cầu khoảng 3-4% và biến động cao, Bitcoin đang dần được hợp thức hóa. **2. Nguyên nhân đợt giảm giá:** Đợt điều chỉnh từ đỉnh ~126k USD (10/2025) xuống ~61k USD (2/2026) được xem là một đợt bán theo chu kỳ 4 năm (sau sự kiện giảm một nửa phần thưởng) và là quá trình "chuyển giao lịch sử" từ các nhà đầu tư sớm sang các tổ chức dài hạn thông qua ETF. Đáng chú ý, mức độ sụt giảm qua các chu kỳ đang thu hẹp (từ 93% xuống ~50%), phản ánh sự trưởng thành của tài sản. **3. Triển vọng dài hạn:** Với vai trò "vàng kỹ thuật số", vốn hóa Bitcoin hiện chỉ bằng ~7% vốn hóa vàng vật chất. Nếu đạt 30-50% vốn hóa vàng, tiềm năng tăng trưởng vẫn rất lớn. Tuy nhiên, tác giả không đưa ra lời khuyên mua ngay và nhấn mạnh hai rủi ro thực sự: **cấu trúc danh mục đầu tư** (không nên all-in, dùng đòn bẩy hoặc tiền không nên dùng) và **độ hiểu biết về tài sản** - yếu tố then chốt để giữ vững tâm lý qua các đợt biến động mạnh. Câu hỏi then chốt là liệu bạn có thể "sống sót" để chứng kiến tiềm năng dài hạn, giống như cổ phiếu Amazon đã vượt qua đợt sụt giảm 95% năm 2000. Bài viết kết luận bằng một câu hỏi mở: Liệu việc vàng tăng 60% trong khi Bitcoin giảm 50% có nghĩa là câu chuyện "vàng kỹ thuật số" đã thất bại, hay đơn giản phản ánh quá trình chuyển giao chưa kết thúc và sự tiến hóa từ tài sản đầu cơ sang tài sản được định vị? Câu trả lời phụ thuộc vào niềm tin cốt lõi của mỗi người vào loại tài sản này.

链捕手40 phút trước

Chủ đề “Vàng kỹ thuật số” của BTC có thất bại không?

链捕手40 phút trước

Từ Mã đến Nhận Thức: Hướng Dẫn Nghìn Chữ về Sự Tiến Hóa của Bộ Não Robot

Từ nhiều thập kỷ trước, robot chủ yếu được điều khiển bằng mã lập trình truyền thống, với các lớp như cảm nhận, ước tính trạng thái, lập kế hoạch và điều khiển được xây dựng thủ công. Chúng hoạt động tốt trong môi trường được thiết kế trước nhưng thiếu khả năng tổng quát hóa. Sự xuất hiện của học sâu (deep learning) đã cách mạng hóa lớp cảm nhận, trong khi học tăng cường (reinforcement learning) và học bắt chước (imitation learning) bắt đầu cải thiện lớp điều khiển. Tuy nhiên, mỗi chính sách học được vẫn còn hẹp và thiếu linh hoạt. Sự bùng nổ của các mô hình ngôn ngữ lớn (LLM) như ChatGPT đã mang lại bước nhảy vọt: LLM đóng vai trò như một bộ lập kế hoạch thông minh, dịch chỉ dẫn ngôn ngữ tự nhiên thành chuỗi hành động để hệ thống robot (như ROS2) thực thi. Dù vậy, LLM vẫn chỉ nằm ở lớp lập kế hoạch. Bước tiến quan trọng tiếp theo là các Mô hình Thị giác-Ngôn ngữ-Hành động (VLA). Các mô hình như RT-2 của Google hay OpenVLA hợp nhất lý luận và hành động trong một mạng thần kinh duy nhất, nhận đầu vào là hình ảnh và lệnh, rồi trực tiếp xuất ra các chỉ thị chuyển động, giúp robot linh hoạt và có khả năng tổng quát hóa hơn. Kiến trúc tiên tiến nhất hiện nay cho robot hình người là "hệ thống kép" (System 1/System 2), lấy cảm hứng từ tâm lý học. System 2 (chậm) là một VLA lớn, xử lý cảnh quan và lý luận ở tần số thấp. System 1 (nhanh) là một mạng nhỏ, tốc độ cao, nhận ý định từ System 2 và xuất ra các lệnh chuyển động liên tục. Một số hệ thống còn có System 0 như một lớp phản xạ để giữ thăng bằng. Việc tính toán được chia sẻ: các vòng lặp điều khiển an toàn quan trọng chạy cục bộ trên bo mạch (ví dụ: NVIDIA Jetson) để đảm bảo độ trễ thấp và độ tin cậy, trong khi các tác vụ như giao diện hội thoại hay học tập nhóm có thể chạy trên đám mây. Các mô hình mã nguồn mở như OpenVLA, NVIDIA Isaac GR00T, và Physical Intelligence π0 đang thúc đẩy lĩnh vực này, cho phép các công ty khởi nghiệp tinh chỉnh chúng với dữ liệu riêng thay vì đào tạo từ đầu. Dù đã có tiến bộ lớn, robot VLA hiện tại vẫn có hạn chế: khó khăn trong phục hồi sau lỗi, hiệu quả mẫu thấp, khó khăn với nhiệm vụ dài hạn và thiếu "hiểu biết vật lý" thực sự. Để giải quyết những hạn chế này, lĩnh vực đang tập trung vào "Mô hình Thế giới" (World Model). Đây là các mạng thần kinh có thể dự đoán hệ quả của hành động dựa trên trạng thái hiện tại. Bằng cách mô phỏng nhiều tương lai khả thi trước khi hành động, robot có thể lập kế hoạch tốt hơn, phục hồi tốt hơn và cải thiện khả năng tổng quát hóa. Các kiến trúc chính gồm: mô hình khuếch tán pixel (Cosmos/Sora), Kiến trúc Dự đoán Nhúng Chung (JEPA của LeCun) và Mô hình Thế giới Hành động Tiềm ẩn (Genie/Dreamer). Tương lai, robot tiên tiến có thể kết hợp VLA với Mô hình Thế giới để lập kế hoạch và kiểm tra hành động trong mô phỏng trước khi thực thi, đồng thời tạo ra lượng dữ liệu tổng hợp khổng lồ cho đào tạo. Yếu tố then chốt hiện nay là dữ liệu, với việc điều khiển từ xa (teleoperation) là phương pháp thu thập chính. Mô phỏng (simulation) cũng đóng vai trò ngày càng quan trọng. Về kinh tế, chi phí phần cứng robot hình người đang giảm nhanh, mở ra thị trường rộng lớn hơn. Tuy nhiên, lĩnh vực này vẫn đang ở giai đoạn phát triển, tương tự "thời kỳ GPT-2" của AI vật lý, với tiềm năng to lớn nhưng cần thêm thời gian để trưởng thành hoàn toàn và triển khai một cách tự chủ, an toàn.

marsbit1 giờ trước

Từ Mã đến Nhận Thức: Hướng Dẫn Nghìn Chữ về Sự Tiến Hóa của Bộ Não Robot

marsbit1 giờ trước

Bong bóng AI đang vỡ

Thị trường đang biến động mạnh với nhiều ý kiến về "bong bóng AI". Mặc dù các chuyên gia như Ray Dalio cảnh báo mức độ bong bóng tương đối cao, nhưng những người như CEO NVIDIA, Jensen Huang, vẫn nhìn thấy cơ hội to lớn và nhu cầu về năng lực tính toán mới chỉ bắt đầu bùng nổ. Cả hai quan điểm đều có phần đúng. Bong bóng trong lĩnh vực AI là có thực, giống như bong bóng Internet năm 2000. Tuy nhiên, bong bóng công nghệ thường là cách thị trường phản ứng với một lực lượng sản xuất đột phá. Sau khi bong bóng vỡ, cơ sở hạ tầng vật chất và công nghệ cốt lõi được xây dựng sẽ trở thành nền tảng cho sự phát triển bùng nổ tiếp theo, như đã thấy với Internet. Hiện tại, đầu tư vào cơ sở hạ tầng AI (như GPU, hệ thống làm mát, điện) là rất lớn, trong khi doanh thu từ các công ty thuần AI còn hạn chế, cho thấy sự mất cân đối. Nhưng một yếu tố then chốt là chi phí suy luận AI (inference cost) đã giảm hơn 99.7% trong hai năm qua. Khi chi phí biên của "trí thông minh" tiến gần đến 0, nó mở khóa một lượng lớn nhu cầu và ứng dụng mới trong mọi ngành công nghiệp, từ phần mềm, y sinh đến sản xuất. Điều này tuân theo "Nghịch lý Jevons": hiệu quả tăng lên dẫn đến mức tiêu thụ tổng thể cao hơn. Thị trường hiện đang trong giai đoạn thanh lọc, nơi các công ty chỉ dựa vào khái niệm sẽ bị đào thải. Xu hướng sâu xa bao gồm: 1) Chuyển dịch giá trị từ chi đầu tư (CapEx) sang chi vận hành (OpEx), nơi các ứng dụng AI thực sự tạo ra lợi nhuận; 2) Các công ty cơ sở hạ tầng có thể tiêu hóa định giá cao thông qua tăng trưởng lợi nhuận mạnh mẽ; 3) AI đang được tích hợp sâu vào các ngành như tài chính, pháp lý, chăm sóc sức khỏe và sản xuất, nâng cao hiệu quả đáng kể. Tóm lại, trong khi bong bóng đầu tư có thể xì hơi và gây ra đợt sàng lọc, động lực cơ bản của AI với tư cách là một lực lượng sản xuất đột phá là không thể đảo ngược. Giống như Internet trước đây, tương lai sẽ là một kỷ nguyên mà hầu hết mọi ngành công nghiệp đều được chuyển đổi và trao quyền bởi AI.

链捕手1 giờ trước

Bong bóng AI đang vỡ

链捕手1 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片