关于数据可用性的十问十答：以Celestia为例

Odaily星球日报Xuất bản vào 2023-11-04Cập nhật gần nhất vào 2023-11-04

Tóm tắt

为什么Celestia不鼓励存储历史数据？如果没有奖励，谁可能存储历史数据？

什么是 DA 数据可用性？

数据可用性解决的问题是：这些数据已经发布了吗？具体来说，当节点接收到一个新的即将添加到链上的区块时，它会验证数据的可用性。节点会尝试下载新区块的所有交易数据以确认其可用性。如果节点能够下载所有交易数据，那么它就成功地验证了数据可用性，证明了区块数据确实已经发布到网络上。

如你所见，模块化区块链，例如 Celestia (可通过此链接了解更多信息：https://docs.celestia.org/learn/how-celestia-works/data-availability-faq) 利用其他原语让节点更高效地验证数据可用性。数据可用性对于任何区块链的安全至关重要，因为它确保任何人都可以检查交易账本并进行验证。当区块链规模扩大时，数据可用性尤其成问题。随着区块变大，普通用户下载所有数据变得不切实际，因此用户无法再验证链的真实性。

数据可用性的问题是什么？

这个问题发生在新区块的交易数据不能被网络上的节点下载和验证时。一个可能的情况是，区块的生产者故意不公布交易数据，这被称为数据隐匿攻击。如果交易数据没有被发布，那么网络上的节点就不能确认并接受新区块，导致区块链更新到最新状态的过程中断。

由于节点不能验证新区块的数据，这可能导致区块链运行停止，或者更糟糕的是，攻击者可能利用这个漏洞盗取资金。后果的严重程度将取决于区块链的类型（L1 或 L2）以及数据可用性是保持在链上还是链下。在 Layer 2 的扩展方案中，比如 rollups 和 validiums，数据可用性问题尤为常见。这些技术尝试通过在链上扩展处理能力来提高区块链的性能，但这也可能引发新的数据可用性挑战。

在 Celestia 中节点怎么验证数据可用性？

在大多数区块链中，节点通过下载一个区块的所有交易数据来验证数据的可用性。如果节点能够下载所有数据，那么它们就验证了数据的可用性。在 Celestia 中，轻节点（light nodes）可以使用一种新的机制来验证数据可用性，而无需下载一个区块的所有数据。这种验证数据可用性的新方法称为数据可用性抽样。

数据可用性抽样是什么？

数据可用性抽样是一种使轻节点无需下载区块的全部数据即可验证数据可用性的机制。数据可用性抽样（DAS）的工作原理是让轻节点进行多轮随机抽样，以获取区块数据的小部分。随着轻节点完成更多轮的数据抽样，它对数据可用性的信心就会增加。一旦轻节点成功达到预定的信心水平（例如 99% ），它将认为区块数据是可用的。

想要一个更简单的解释吗？查看这个讨论帖子，了解数据可用性抽样就像掷硬币一样。https://twitter.com/nickwh8te/status/1559977957195751424

Celestia 在数据可用性抽样方面的一些安全假设是什么？

Celestia 区块链网络中数据可用性抽样（Data Availability Sampling，简称 DAS）的两个安全假设：

轻节点数量假设： Celestia 假定网络中存在足够数量的轻节点，这些轻节点会对新生成的区块进行数据可用性抽样。这是基于对数据进行随机样本检查的机制，即轻节点不需要下载整个区块的数据，而是下载一部分数据来验证整个区块的数据是否可用。这个假设保证了如果区块数据确实发布到了网络上，那么完整节点能够通过聚合轻节点抽样的数据部分来重构出完整的区块。这种假设下，对于更大的区块，相应地需要更多的轻节点来确保数据可用性。
连接到诚实完整节点：第二个假设是每个轻节点至少能够连接到一个诚实的完整节点。这样做是为了保证轻节点能够接收到错误擦除编码块的欺诈证明（fraud proofs）。欺诈证明是一种安全机制，用于验证区块数据是否被正确处理。如果轻节点在日食攻击期间（这是一个网络攻击类型，攻击者尝试将目标节点隔离，让它只能连接到恶意节点）不能连接到至少一个诚实的完整节点，它将无法验证区块是否被不当构建，因而网络的安全性和可靠性会受到威胁。

为什么区块重构对安全性是必要的？

在区块链中，"重构区块"意味着如果我们没有一次性获得整个区块的数据，我们也能通过手中已有的数据碎片来复原出完整的区块内容。这就好比我们手里有一张撕碎了的纸，如果每一片撕碎的部分都有一些重叠，我们就有可能把整张纸拼回原样。

在 Celestia 这样的系统中，通过数据擦除编码（erasure coding），即使我们没有拿到完整的区块数据，只要有足够的数据片段，也可以把整个区块的数据复原出来。数据擦除编码会创建一些额外的数据冗余，这样即便部分数据丢失，剩下的信息也足够我们重构出完整的区块。

为什么这样做对安全性很重要呢？因为这确保了即使在不完美的情况下 —— 比如说有恶意节点试图隐藏数据或者网络不稳定导致数据无法完整传输 —— 我们仍能验证交易的完整性和正确性。如果有人试图篡改或隐藏交易数据，只要我们能重构出区块，就可以发现并证明这种篡改，保障整个区块链的透明度和可信赖性。

什么是数据存储？关于数据存储的问题是什么？

数据存储涉及到存储和访问过去交易数据的能力。

数据存储和检索需要用于多个目的，例如：

阅读之前交易的信息
同步节点
索引和提供交易数据服务
检索 NFT 信息

数据存储的问题在于是否可以存储过去的交易数据，并在以后成功地检索。如果无法检索历史交易数据，可能会导致一些问题，比如用户无法访问他们过去交易的信息，或者节点无法从创始区块同步数据。幸运的是，关于存储和访问过去数据的假设要求不高。只需要能够访问区块链历史记录的单一副本，用户就可以获得历史交易数据。换句话说，数据存储安全是一个 1 对 N 诚实假设。

数据可用性和数据存储有什么区别？区块链状态如何融入这个问题？

数据可用性是关于验证新区块的交易数据是否公开可用的问题。相比之下，数据存储涉及到存储和访问旧区块的过去交易数据。

到目前为止，我们讨论的都是交易数据，但区块链状态是一个相关的话题。状态与交易数据不同。具体来说，状态就像是网络的当前快照，包括了账户余额、智能合约余额和验证者集合信息等。由状态大小引起的问题在性质上与数据可用性和可检索性问题不同。

为什么 Celestia 不鼓励存储历史数据？如果没有奖励，谁可能存储历史数据？

大多数区块链不鼓励数据存储，因为保证历史数据永久可检索不应该是区块链的责任。此外，数据存储问题只需要一个当事人来存储和提供数据给用户，这不是一个强烈的问题。因此，Celestia 的目标是提供一种安全且可扩展的方法来验证数据的可用性。一旦数据被验证为可用，存储和检索历史数据的任务就留给了需要数据的其他实体。幸运的是，即使 Celestia 本身不直接提供激励措施（例如，通过支付代币或其他奖励）来鼓励数据的存储和检索，还是有其他因素促使某些组织或个人出于他们自己的利益存储历史数据，并将其提供给需要它的用户。

可能会存储历史数据的参与者有多种类型。其中一些包括：

提供对过去交易数据访问的区块浏览器。
为过去的数据提供 API 查询的索引器。
需要历史数据来进行某些处理的应用程序或者 Rollup。
希望保证能够访问其交易历史的用户。

区块链可以做些什么来提供更强的数据可检索性保证？

根据节点存储的交易数据量和它们服务的数据请求来奖励节点（一些数据存储区块链，如 Filecoin，就是这种情况）。
将交易数据发布到激励存储和提供历史数据请求服务的数据存储区块链上。

参考链接：https://docs.celestia.org/learn/how-celestia-works/data-availability-faq

阅读更多：

从单链到模块化：Avail 如何改变区块链应用开发

新手小白如何在 30 秒内安装运行 Celestia 轻节点？

速看！关于模块化区块链的 7 个误解及真相！

Nội dung Liên quan

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

Tác giả: Jae, PANews Dù đã trải qua nhiều chu kỳ thị trường với các xu hướng khác nhau, từ blockchain hiệu suất cao, phân mảnh đến trừu tượng chuỗi và gần đây là AI Agent, Near luôn có mặt. Được đồng sáng lập bởi Illia Polosukhin, một trong những tác giả của kiến trúc AI Transformer nổi tiếng, Near có nền tảng kỹ thuật vững chắc. Điều ít người biết là Near ban đầu là một công ty khởi nghiệp AI, tập trung vào "tổng hợp chương trình" (dạy máy viết code). Tuy nhiên, họ gặp khó khăn trong việc trả lương xuyên biên giới cho các nhà phát triển toàn cầu do hạn chế của hệ thống thanh toán truyền thống và phí gas cao, tốc độ chậm của các blockchain thời kỳ đầu. Điều này buộc họ tạm dừng giấc mơ AI và tự xây dựng một blockchain riêng - Near - vào năm 2018. Sau một thời gian phát triển công nghệ phân mảnh nhưng gặp khó khăn trong việc thu hút hệ sinh thái, Near tìm thấy cơ hội mới khi làn sóng AI bùng nổ. Danh tiếng của Polosukhin với tư cách là đồng tác giả Transformer được công nhận rộng rãi, đưa Near trở lại ánh đèn sân khấu với tư cách là một dự án có "dòng máu AI" chính thống. Near hiện tập trung vào hai hướng phát triển chính: Near Intents và giao dịch riêng tư (Confidential Transactions). **Near Intents** đơn giản hóa trải nghiệm giao dịch chuỗi chéo. Thay vì thực hiện nhiều thao tác thủ công trên các chuỗi khác nhau, người dùng chỉ cần nêu ý định (ví dụ: "đổi BTC lấy ETH"), và mạng lưới "trình giải quyết" (Solver) sẽ tự động tìm đường đi tối ưu. Cơ chế này đã xử lý hơn 200 tỷ USD khối lượng giao dịch tích lũy, tạo ra hơn 34 triệu USD phí giao dịch, với TVL đạt 85 triệu USD trên 25 blockchain. Tuy nhiên, nguy cơ tập trung hóa trong mạng lưới Solver là một rủi ro tiềm ẩn. **Giao dịch riêng tư** là lợi thế cạnh tranh khác. Tính năng "Hoán đổi Bảo mật" cho phép ẩn số lượng, hướng giao dịch trước khi thanh toán, bảo vệ người dùng khỏi MEV và trượt giá. Trong 30 ngày qua, giao dịch riêng tư chiếm tới 41,63% tổng khối lượng giao dịch trên Near (~87 triệu USD trong tổng số 209 triệu USD), phản ánh nhu cầu thị trường mạnh mẽ. Tuy nhiên, tỷ lệ cao này cũng có thể thu hút sự giám sát từ các cơ quan quản lý. Tóm lại, sau hành trình đầy biến động, Near đang định vị lại mình ở giao lộ của blockchain và AI, thông qua trừu tượng hóa chuỗi, cơ chế ý định và giao dịch riêng tư. Việc liệu những nỗ lực này có giúp Near xây dựng được hào rào cạnh tranh vững chắc hay không vẫn cần được theo dõi thêm.

marsbit34 phút trước

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

marsbit34 phút trước

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

Bài viết này giải thích khái niệm CROPS, một thuật ngữ được Vitalik Buterin nhấn mạnh nhiều lần gần đây, liên quan đến định hướng phát triển cốt lõi của Ethereum và tương lai của trải nghiệm người dùng trong thời đại AI. CROPS là viết tắt của năm nguyên tắc: Kháng kiểm duyệt (Censorship Resistance), Kháng chiếm đoạt (Capture Resistance), Mã nguồn mở/Mở (Open Source/Openness), Quyền riêng tư (Privacy) và Bảo mật (Security). Đây không chỉ là giá trị cốt lõi của Ethereum mà còn là kim chỉ nam cho Quỹ Ethereum (EF) trong việc phân bổ nguồn lực vào các nhiệm vụ dài hạn, đảm bảo người dùng giữ được quyền kiểm soát tối thượng đối với tài sản và hành động số của họ. Bài viết chỉ ra rằng khi AI, đặc biệt là AI Agent, ngày càng đóng vai trò là "đại lý số" xử lý các tác vụ phức tạp (như giao dịch, quản lý tài sản), CROPS trở thành vấn đề sống còn. Một hệ thống AI tuân thủ CROPS cần chạy cục bộ (local) khi có thể, bảo vệ quyền riêng tư, minh bạch và trao cho người dùng quyền xác nhận cuối cùng, tránh biến thành một "hộp đen" tập trung. Giao điểm giữa "CROPS Ethereum Access Layer" và "CROPS AI" nằm ở việc giải quyết cùng một vấn đề: làm sao để người dùng truy cập các dịch vụ từ xa (như mô hình LLM hoặc dữ liệu blockchain) mà không phải hy sinh thông tin cá nhân, ý định hay quyền kiểm soát. Các giải pháp như gọi LLM từ xa thanh toán bằng ZK-proof hay đọc RPC Ethereum riêng tư là những ví dụ điển hình. Tóm lại, trong bối cảnh AI đang định hình lại tương tác kỹ thuật số, CROPS nổi lên như một khuôn khổ quan trọng đảm bảo rằng sự tiện lợi và quyền lực của công nghệ không đi kèm với cái giá phải trả là quyền tự chủ, bảo mật và quyền riêng tư của người dùng. Điều này sẽ định hướng cho sự phát triển của các lớp cơ sở hạ tầng, đặc biệt là ví tiền điện tử, trong tương lai.

marsbit45 phút trước

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

marsbit45 phút trước

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

Một lỗ hổng nghiêm trọng trong nhóm giao dịch được bảo vệ Orchard của Zcash có thể đã cho phép kẻ tấn công tạo ra lượng ZEC giả không giới hạn mà không bị phát hiện, theo tiết lộ mới từ Zooko Wilcox, Jason McGee và nhà nghiên cứu bảo mật Taylor Hornby. Lỗ hổng được phát hiện vào ngày 29 tháng 5, được khắc phục khẩn cấp trước ngày 2 tháng 6, và đã châm ngòi cho cuộc tranh luận về cách Zcash có thể chứng minh tính toàn vẹn nguồn cung trong một hệ thống bảo vệ quyền riêng tư. Lỗi nằm trong một quy tắc được viết thủ công trong mạch Orchard, khiến nó có thể chấp nhận thông tin sai nhưng vẫn cho phép giao dịch hợp lệ. Do tính chất bảo mật của Orchard, không có cách nào để chứng minh bằng mật mã liệu lỗ hổng có bị khai thác trước khi sửa chữa hay không, gây ra lo ngại về tính toàn vẹn nguồn cung. Để giải quyết, Shielded Labs đang xem xét đề xuất nâng cấp mạng để triển khai một nhóm bảo mật mới, nhằm cho phép bất kỳ ai cũng có thể xác minh nguồn cung ZEC. Họ cũng đang đẩy nhanh công việc xác minh chính thức mạch Orchard để ngăn chặn sự cố tương tự trong tương lai. Giá ZEC đã giảm gần 45% trong bối cảnh không chắc chắn này.

bitcoinist54 phút trước

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

bitcoinist54 phút trước

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

Ngày 28/5, công ty Anthropic đứng sau mô hình AI Claude đã huy động thành công 7,5 tỷ USD trong vòng tài trợ Series H, nâng định giá lên 96,5 tỷ USD, vượt mặt OpenAI. Trong bối cảnh các gã khổng lồ AI cạnh tranh khốc liệt về nền tảng tính toán, Steve Hoffman - nhà sáng lập Founder Space, được mệnh danh là "cha đỡ đầu" trong giới đầu tư mạo hiểm tại Thung lũng Silicon - đã có cuộc trò chuyện về tương lai của ngành. Hoffman nhận định, Thung lũng Silicon sẽ tiếp tục dẫn đầu trong nghiên cứu cơ bản về các mô hình lớn (foundation models), trong khi Trung Quốc sẽ chiến thắng trong việc triển khai ứng dụng và thương mại hóa, đặc biệt thống lĩnh lĩnh vực robot. Ông khuyến nghị các startup nên theo đuổi chiến lược "toàn cầu hóa ngay từ ngày đầu" (Global from Day 1) thay vì chỉ tập trung vào thị trường nội địa. Về tác động của AI, Hoffman dự đoán điểm bùng phát thực sự của các tác nhân tự trị (Autonomous Agents) - có khả năng phối hợp và xử lý các mục tiêu phức tạp - sẽ đến trong khoảng 2-4 năm tới, dẫn đến thay thế lao động trên quy mô lớn, bao gồm nhiều công việc tri thức. Giải pháp là thiết kế mô hình kinh doanh theo hướng "cộng tác người-máy" (Human-AI Collaboration) và cải cách chính sách về đào tạo lại, an sinh xã hội. Đối với các startup AI, Hoffman khuyên nên tập trung vào các lĩnh vực chuyên sâu, phức tạp, gắn với ngành cụ thể để tạo ra hàng rào phòng thủ trước các gã khổng lồ công nghệ. Tốc độ lặp lại sản phẩm nhanh chính là lợi thế cạnh tranh then chốt. Ông cũng chỉ ra cơ hội lớn trong lĩnh vực an ninh mạng và chống gian lận AI. Cuối cùng, Hoffman thẳng thắn bày tỏ quan điểm về "Web3 + AI". Ông cho rằng Web3 chủ yếu mang lại giá trị cho một nhóm người nhất định trong hệ sinh thái tiền mã hóa, nhưng không tạo ra tác động thực chất đối với thị trường đại chúng. Việc kết hợp Web3 với AI chủ yếu làm tăng thêm sự phức tạp và có thể là một cái bẫy đối với hầu hết các nhà sáng lập, thay vì một cơ hội. AI mới là công nghệ nền tảng phổ quát thực sự có khả năng chạm đến mọi ngành công nghiệp.

marsbit2 giờ trước

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

marsbit2 giờ trước

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

Năm 2026, chi phí đầu tư cho suy luận AI của các nhà cung cấp điện toán đám mây quy mô lớn lần đầu tiên vượt quá chi phí cho huấn luyện, đánh dấu bước chuyển từ "luyện mô hình lớn" sang "sử dụng mô hình lớn". Trong thời đại suy luận, điểm nghẽn chính chuyển sang "tường bộ nhớ" (memory wall), nơi chi phí và độ trễ di chuyển dữ liệu giữa GPU và DRAM (như HBM) vượt xa bản thân tính toán. Cerebras Systems, với kiến trúc động cơ quy mô wafer (WSE), đề xuất một giải pháp triệt để: thay vì cắt một tấm wafer thành nhiều chip nhỏ, họ sử dụng gần như toàn bộ wafer làm một chip khổng lồ duy nhất. Chip WSE-3 mới nhất cung cấp băng thông bộ nhớ trên chip cực cao nhờ 44GB SRAM, lên tới 21 PB/s, cao hơn 2625 lần so với GPU B200 của NVIDIA, giúp giảm đáng kể độ trễ trong suy luận mô hình lớn. Trong kiến trúc của Cerebras, trọng số mô hình được lưu trữ bên ngoài trên MemoryX và được truyền theo từng lớp đến chip khi cần, cho phép thông lượng token nhanh hơn từ 1.5 đến 5 lần so với B200 trong các mô hình khác nhau. Nó cũng có lợi thế lớn về hiệu suất năng lượng cho kết nối trên chip. Tuy nhiên, Cerebras phải đối mặt với những thách thức: lợi thế SRAM có thể chạm trần vật lý do giới hạn thu nhỏ theo tiến trình bán dẫn, yêu cầu hệ thống làm mát chuyên dụng, băng thông I/O ra bên ngoài thấp gây khó khăn cho mở rộng quy mô lớn, và hệ sinh thái phần mềm độc quyền. Các gã khổng lồ công nghệ đang theo đuổi nhiều con đường khác để giải quyết điểm nghẽn suy luận, bao gồm tự phát triển ASIC (như TPU, Maia), tận dụng công nghệ đóng gói tiên tiến phổ biến (như SoW của TSMC), và khám phá kết nối/quang học. Áp lực thương mại cũng rất lớn, khi Cerebras phải chuyển đổi thành nhà cung cấp dịch vụ đám mây và triển khai năng lực trung tâm dữ liệu khổng lồ theo các hợp đồng. Tóm lại, cuộc đua kiến trúc suy luận AI là về sự đánh đổi: Cerebras tối ưu hóa cực độ cho độ trễ thấp trên một wafer, trong khi NVIDIA duy trì tính linh hoạt và thông lượng cao thông qua kiến trúc cụm GPU. Tương lai của cả hai hướng đi vẫn chưa được định đoạt, phụ thuộc vào sự phát triển của tải công việc và công nghệ.

marsbit2 giờ trước

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

marsbit2 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

关于数据可用性的十问十答：以Celestia为例

Tóm tắt

什么是 DA 数据可用性？

数据可用性的问题是什么？

在 Celestia 中节点怎么验证数据可用性？

数据可用性抽样是什么？

Celestia 在数据可用性抽样方面的一些安全假设是什么？

为什么区块重构对安全性是必要的？

什么是数据存储？关于数据存储的问题是什么？

数据可用性和数据存储有什么区别？区块链状态如何融入这个问题？

为什么 Celestia 不鼓励存储历史数据？如果没有奖励，谁可能存储历史数据？

区块链可以做些什么来提供更强的数据可检索性保证？

Nội dung Liên quan

Near Tái Xuất Hiện Trên Sân Khấu AI: Chuyển Đổi Thành Blockchain Công Cộng Vì 'Khó Trả Lương', Agent và Quyền Riêng Tư Trở Thành Câu Chuyện Tăng Trưởng Mới

Từ Ethereum đến "CROPS" của AI: Bộ "Biến số Chậm" mà Vitalik Liên Tục Nhấn Mạnh Rốt Cuộc Là Gì?

Lỗi Zcash Có Thể Đúc Vô Hạn ZEC Mà Không Bị Phát Hiện

Steve Hoffman, 'Cha đẻ đầu tư mạo hiểm' Thung lũng Silicon: Web3 + AI có thể là một cái bẫy

Vượt qua "Bức tường Bộ nhớ": Cuộc Cách mạng ở Cấp độ Wafer và Lộ trình Tính toán trong Thời đại Suy luận AI

Giao dịch

Danh mục Phổ biến

Thẻ Nổi bật