How Will the Seven Major Trends in the Crypto Industry in 2026 Change the Game?

比推Xuất bản vào 2025-12-11Cập nhật gần nhất vào 2025-12-11

Tóm tắt

By 2026, the crypto industry is poised for transformative shifts across seven key trends. Appchains will mature, enabling tailored blockchain infrastructures optimized for specific applications and user experiences. Prediction markets will continue to innovate, focusing on liquidity and market structure improvements. Agentic curators—AI-driven systems—will enhance DeFi by intelligently curating risk and strategies. Short-form video platforms will become primary discovery and commerce channels, integrating crypto for seamless microtransactions. Blockchain will drive new AI scaling laws through decentralized training and verifiable inference. Real-World Assets (RWA) will see broad adoption, tokenizing diverse assets like commodities and equities. Finally, agent-driven products will redefine user interaction, shifting from manual app usage to AI-managed, conversational interfaces that automate and optimize crypto activities.

Author: @archetypevc

Compiled by: Dingdang, Odaily Planet Daily

Original title: A Brief History of the Crypto Future: Seven Major Trends in 2026 Reshape the Industry Narrative


Editor's Note: As we step into 2026, the focus of the industry narrative is quietly shifting. Capital, infrastructure, user needs, and content distribution methods are undergoing structural adjustments. Archetype has gathered insights from multiple industry researchers to identify several trends that are currently forming and may evolve into key investment windows in the coming year.

This article is compiled by Odaily Planet Daily, aiming to present readers with Archetype's perspective on the underlying driving forces of the next phase of crypto applications and the structural inflection points most worthy of attention in 2026.

When "Chains Built for Applications" Finally Make Sense: The Best Time for Appchains Has Arrived

by Aadharsh Pannirselvam

Summary in one sentence: Blockchains that are deliberately designed, finely crafted, and built and optimized based on underlying primitives for specific application scenarios will truly explode in the next year or two.

The developers, users, institutions, and capital recently flowing into the chain are very different from those in previous cycles. They have distinct cultures and preferences (i.e., their definition of "user experience"), which are often more important than abstract concepts like "decentralization" and "censorship resistance." Sometimes, these needs align with existing infrastructure; other times, they require completely different chain structures.

User experience is particularly crucial for crypto applications like Blackbird and Farcaster that target non-professional users and are abstracted. Designs that would have been considered heretical three years ago, such as node deployment, a single sequencer, and customized databases, are now the most reasonable solutions. The same applies to stablecoin chains or trading scenarios that heavily rely on latency and price precision (e.g., Hyperliquid, GTE).

But not all new applications are like this.

Today, an important counterforce is growing: the preference for "privacy" from institutions and the general public. The experience demands of different applications vary greatly, so their underlying chain architectures should not be uniform.

The good news is that assembling a chain from scratch that meets application needs is much simpler than it was two years ago. It's now more like "building a custom PC."

You can pick every hard drive, fan, and power cable yourself—but most of the time, this isn't necessary. You can simply choose from a series of highly matched, customizable preset configurations, like selecting a Digital Storm or Framework. If you need a certain level of personalization, you can add your own components on top of their already-tuned base. This ensures both stability and high flexibility.

Similarly, when applications can freely assemble and adjust primitives like consensus mechanisms, execution layers, data storage, and liquidity structures, they can build chain forms with different cultural characteristics, allowing the application's own "experience definition" to be natively supported, thus forming a differentiated competitive advantage. This difference is like the distinct yet shared underlying commonalities between a ToughBook, ThinkPad, desktop tower, and MacBook.

More importantly, each component becomes a tunable "knob," without worrying about affecting the whole system or being constrained by the upgrade pace of the parent protocol.

With Circle's acquisition of Informal Systems' Malachite, the importance of independently mastering "customized block space" has become an industry trend. In the coming year, I look forward to seeing more applications quickly build their own chains and block spaces using "default templates" and underlying modules provided by Commonware, Delta, etc., much like using HashiCorp or Stripe Atlas.

Ultimately, this will allow applications to truly control their own cash flow and build moats through chain structures that better fit the user experience.

Prediction Markets Will Continue to Innovate (But Only Some Players Will Break Through)

By Tommy Hang

In this cycle, prediction markets have undoubtedly been one of the brightest performing application categories. The total trading volume of fully on-chain prediction markets has repeatedly hit new highs, with weekly trading volumes consistently exceeding $2 billion, clearly indicating that this category has taken a key step toward becoming a mass consumer product.

Amid the hype, a large number of new projects attempting to challenge Polymarket and Kalshi have emerged. But identifying "true innovation" amidst the noise is key to judging which projects are worth focusing on in 2026.

From a market structure perspective, I am most interested in solutions that can reduce spreads and enhance open interest. Although market creation is still permissioned and screened, the liquidity of prediction markets remains thin for both market makers and traders. The best paths include optimizing routing systems, introducing different liquidity models, and improving collateral efficiency based on products like lending.

Categorical trading volume is a key factor determining the success of platforms. For example, over 90% of Kalshi's trading volume in November came from sports markets, indicating that some platforms are naturally more suited to compete for specific liquidity. In contrast, Polymarket's trading volume in crypto and political markets is 5–10 times higher than Kalshi's.

Of course, on-chain prediction markets still have a long way to go before achieving true "mass adoption." For instance, the 2025 Super Bowl alone generated $23 billion in off-track betting volume in a single day, more than 10 times the total daily trading volume of all current on-chain markets.

Closing this gap requires teams that can truly solve the underlying challenges of prediction markets. I will continue to watch these players next year.

Agentic Curators: Expanding the Next Layer of DeFi with "Intelligent Agents"

By Eskender Abebe

Today's DeFi "asset screening and risk configuration layer" (curation layer) tends toward two extremes: either fully algorithmic (fixed interest rate curves, preset rebalancing rules) or fully reliant on humans (risk committees, active managers).

Agentic curators represent a third path: AI agents (LLM + tools + loop scheduling) managing the risks and strategies of vaults, lending markets, and structured products, not by executing fixed rules, but by "reasoning"—logical deduction about risk, returns, and position strategies.

Take Morpho's market as an example: Designing an attractive yield product requires defining collateral asset rules, LTV limits, and various risk parameters. This is still a human bottleneck, and intelligent agents can scale this process. Soon, you will see intelligent agent curators competing head-to-head with algorithmic models and human managers.

So, when will DeFi's "Move 37" arrive?

Many fund managers have extreme attitudes toward AI: either believing LLMs will automate all trading desks or thinking they will immediately collapse in real markets. But both overlook the real structural change: AI agents combine emotionless execution, systematic strategy, consistent policy constraints, and reasoning capabilities, while humans are noisy and pure algorithms are too fragile. In the future, LLMs will act like "architects," designing risk frameworks, strategy constraints, and portfolio structures, while truly high-frequency and sensitive calculations are still executed by deterministic code.

When the cost of deep reasoning drops to "a few cents," the strongest vaults will no longer be managed by the smartest people, but driven by the strongest computing power.

Short-Form Video Will Become the New "Traffic Entry Point"

By Katie Chiou

Short-form video is becoming the default interface for "global users to discover and purchase content." TikTok Shop's GMV exceeded $20 billion in the first half of 2025, nearly doubling year-on-year, making global users increasingly accustomed to "shopping while watching"—entertainment as a storefront.

Instagram is shifting Reels from a defensive product to a core revenue engine. This format brings more exposure and occupies an increasingly large share of Meta's projected 2025 advertising revenue. Whatnot has proven that real-time, personalized sales methods can achieve conversion speeds unattainable by traditional e-commerce.

The logic is simple: Real-time viewing allows users to make decisions faster. Every swipe is a potential purchase point. Therefore, platforms are quickly blurring the line between "recommended feeds" and "payment processes." The information feed itself is the new point of sale, and every content creator is a distribution channel.

AI will accelerate this trend: reducing video production costs, increasing content quantity, and allowing creators and brands to test ideas in real time. The more content, the more touchpoints, and the more incentive platforms have to optimize conversion efficiency every second.

And crypto fits this trend perfectly: Faster content requires faster, cheaper, programmable payment channels. As shopping becomes frictionless and directly embedded in the content itself, we need a system that can settle micro-payments, programmatically distribute and allocate revenue, and track the contributions of all parties in complex influence chains. Cryptocurrency is born for such processes. It's hard to imagine how the era of hyper-scale streaming-native commerce would develop without it.

Blockchain Will Drive New AI Scaling Laws

By Danny Sursock

Over the past few years, the AI narrative has been dominated by giants and unicorns, with decentralized innovators long overlooked. However, away from the spotlight, several crypto-native teams have made astonishing progress in "decentralized training and inference," and have moved from whiteboard demos to real testing and production environments.

Today, teams like Ritual, Pluralis, Exo, Odyn, Ambient, and Bagel are ready to "take the main stage" and welcome the golden age. This new generation of competitors is expected to have an explosive orthogonal impact on the fundamental development trajectory of artificial intelligence.

Distributed training environments are breaking through existing scaling limits, with asynchronous communication and parallel solutions being proven feasible in training tasks of real scale.

New consensus mechanisms and privacy technologies are making "verifiable" and "confidential" inference a reality.

A new generation of chain architectures combines "truly intelligent contract systems" with more general computing models, enabling AI agents to use crypto assets as a unified medium of exchange, forming a complete autonomous computing closed loop.

The foundational work is done.

The next challenge is to bring these underlying facilities to large-scale production and prove that blockchain can drive fundamental innovation in AI, not just conceptual slogans or fundraising stories.

RWA: Real-World Assets Will Truly Land in the Real World

By Dmitriy Berenzon

RWA (Real-World Assets) has been discussed for years, and now it is finally迎来规模化 adoption—mass adoption of stablecoins, complete and smooth on/off ramps, and clearer regulatory frameworks have made it happen. According to RWA.xyz data, over $18 billion of various assets have been issued on-chain, compared to just $3.7 billion a year ago. This trend will continue to accelerate in 2026.

It's important to note that "Tokenization" and "Vaults" are two different RWA design patterns: the former digitizes real-world assets, while the latter channels on-chain capital into offline yield scenarios.

In the future, I look forward to seeing asset tokenization cover a wider range: from gold and rare earth metals, to short-term credit for business operations, to public and private equity, and more global fiat currencies. We can even be "bolder"—eggs, GPUs, energy derivatives, wage advances, Brazilian government bonds, Japanese yen... all can be put on chain.

In essence, RWA is not about "putting more things on chain," but about upgrading the way global capital is allocated. The high barriers to entry, low transparency, and fragmentation of traditional markets can be redefined on public chains and combined with DeFi primitives to achieve composability.

Of course, many assets will still face challenges such as transfer restrictions, lack of transparency, poor liquidity, risk management, and distribution efficiency, so infrastructure that solves these problems will be equally critical.

The Agent-Driven Product Renaissance Is Coming

By Ash Egan

The core of the next generation of the internet is no longer the apps we scroll through, but the "intelligent agents" we converse with.

We all know that bots and agents are rapidly increasing their share of all network activity. Rough estimates suggest this proportion is now around 50%, including both on-chain and off-chain activity. In the cryptocurrency space, bots are increasingly participating in trading, management, assistance, contract scanning, and performing various operations on our behalf, from token swaps and fund management to smart contract audits and game development.

This is the beginning of a "programmable, agentized internet." And 2026 will be the first year crypto product design is truly "agent-centric" (in a positive, non-dystopian way).

The future form is still emerging, but for me, at least, I hope to spend less time clicking between pages and more time managing on-chain agents in chat-like interfaces: like Telegram, but the conversation partners are "application-specific/task-specific agents." They will be able to formulate and execute complex strategies, automatically gather information most relevant to me across the network, and present it as trading results, risks and opportunities that need attention, and curated information. I give them tasks, and they track opportunities, filter out all irrelevant information, and execute at the optimal time.

The infrastructure needed for this vision is already in place on-chain. Combining the default open data graph, programmable micro-payments, on-chain social graphs, and cross-chain liquidity rails, we have everything needed to support a dynamic agent ecosystem. The "plug-and-play" nature of the crypto world means the繁琐 processes and obstacles agents need to face will be greatly reduced. Compared to Web2 infrastructure, blockchain's readiness for this agent revolution cannot be overstated.

This might be the most crucial point here: This is not just automation, but true liberation from Web2's data silos, various frictions, and unnecessary waiting. We are seeing this transformation firsthand in search: about 20% of Google searches now directly provide AI overviews, and data shows that once users see this overview, the probability of them clicking on traditional search result links drops significantly. Manually flipping through pages of information is becoming obsolete. A programmable, agent-driven network will extend this experience to all the applications we use daily, which I believe is a tremendous good.

In this new era, we will: reduce mindless scrolling, reduce emotional panic trading, and time zone differences will be completely erased (no more saying "wait for the Asian market to wake up"). Interaction with the on-chain world will become simpler and more expressive for both developers and ordinary users.

As more assets, systems, and users come on-chain, this cycle will continuously self-reinforce and accelerate. The more opportunities on-chain, the more intelligent agents deployed, the more value unlocked. Rinse and repeat. But what we build now, and how we build it, will determine whether this "agent-driven network" ultimately becomes a thin layer of noise and automation or truly ignites a user-empowering, vibrant, and innovative product renaissance.


Twitter:https://twitter.com/BitpushNewsCN

Bitpush TG Discussion Group:https://t.me/BitPushCommunity

Bitpush TG Subscription: https://t.me/bitpush

Original link:https://www.bitpush.news/articles/7595017

Câu hỏi Liên quan

QWhat is the core argument for the rise of Appchain in the crypto industry by 2026?

AThe core argument is that blockchains specifically designed, finely tuned, and optimized for particular application scenarios based on underlying primitives will truly explode in the next year or two. This is driven by the influx of developers, users, institutions, and capital with distinct cultural preferences and definitions of 'user experience,' which often outweigh abstract ideals like 'decentralization' or 'censorship resistance.' These diverse needs require different chain architectures, and building a custom chain has become much simpler, akin to 'assembling a custom PC' from a set of highly matched, customizable preset configurations.

QAccording to the article, what is a key challenge for prediction markets to achieve mass adoption, and how can it be addressed?

AA key challenge is the significant gap in trading volume compared to traditional markets. For example, the single-day off-track betting volume for the 2025 Super Bowl was $23 billion, over 10 times the daily trading volume of all on-chain markets combined. To close this gap, the article states that teams need to tackle the underlying problems of prediction markets, such as optimizing routing systems, introducing different liquidity models, and improving collateral efficiency through products like lending to reduce spreads and enhance open interest.

QHow do 'Agentic Curators' represent a new path for DeFi's asset selection and risk configuration layer?

A'Agentic Curators' represent a third path between the two extremes of being fully algorithmic (with fixed rate curves and preset rebalancing rules) or fully manual (relying on risk committees and active managers). This path involves AI agents (combining LLMs, tools, and loop scheduling) that manage the risk and strategy of vaults, lending markets, and structured products through 'reasoning'—logical deduction about risk, yield, and position strategy—rather than just executing fixed rules.

QWhy does the article claim that cryptocurrency is inherently suited for the trend of short-form video becoming a new 'traffic entrance'?

ACryptocurrency is suited for this trend because the faster, cheaper, and programmable payment channels it provides are essential for the frictionless, embedded shopping experience within short-form video content. As shopping process becomes seamless and integrated directly into the content itself, a system is needed to settle micro-payments, programmatically distribute revenue, and track the contributions of various parties in complex influence chains. Cryptocurrency is built for such processes, and it's hard to imagine the era of hyper-scale streaming-native commerce developing without it.

QWhat fundamental shift in internet interaction does the article predict for 2026 regarding 'Agent-driven' products?

AThe article predicts a fundamental shift where the core of the next-generation internet will no longer be the applications we browse but the 'intelligent agents' we converse with. 2026 will be the first year where crypto product design is truly 'Agent-centric.' The interaction will move away from clicking between pages to managing on-chain agents in chat-like interfaces (similar to Telegram but for application or task-specific agents). These agents will formulate and execute complex strategies, automatically gather relevant information, and execute actions at the optimal time, reducing mindless scrolling, panic trading, and time zone differences, making interaction with the on-chain world simpler and more expressive.

Nội dung Liên quan

Người sáng lập IOSG: Web3 đang 'mất máu', những người trong nghề nên sống sót như thế nào?

Người sáng lập IOSG chia sẻ những suy tư sâu sắc về tình trạng "mất máu" hiện nay của Web3. Bài viết bắt đầu bằng hình ảnh ẩn dụ về những người thợ xây dựng nền tảng lại chịu cảnh khó khăn, phản ánh tâm tư của nhiều người trong ngành. Tác giả tham dự sự kiện MuShanghai, nơi một nửa người tham gia có nền tảng crypto đang khám phá các lĩnh vực mới như AI, biotech, robotics - một hình thức "tự cứu" đáng chú ý. Ông bày tỏ sự bi quan về cơ chế phản hồi tích cực của hệ sinh thái đã bị phá vỡ. Các sự kiện xác suất thấp đang xảy ra đồng loạt: 50-60% nhà phát triển Web3 Trung Quốc chuyển sang AI, hàng nghìn dự án huy động vốn nhưng ít ứng dụng đột phá, hệ sinh thái châu Á gặp khủng hoảng sinh tồn trong khi các quỹ Mỹ phát triển mạnh. Về Ethereum, tác giả lo ngại rằng các cơ hội vàng để tạo ra siêu ứng dụng đã bị bỏ lỡ khi tập trung quá nhiều vào các câu chuyện kỹ thuật như ZK, L2. Ông cũng đề cập đến việc Vitalik Buterin có thể đang trong "vỏ bọc thông tin", không nhận được phản hồi trung thực về những khó khăn của ngành. Một vấn đề nghiêm trọng là sự thiếu hụt phản hồi tích cực cho những người trong ngành và sự thiếu công nhận từ xã hội và thế hệ tiếp theo. Vấn đề người kế nhiệm đang đến gần khi thế hệ core developer đầu tiên của Ethereum bước vào giai đoạn khác của cuộc đời, trong khi Web3 khó cạnh tranh thu hút nhân tài với AI. Bài viết chỉ ra sự phân nhánh giữa các OG Mỹ và Trung Quốc: trong khi các OG Mỹ tiếp tục xây dựng và tái đầu tư vào hệ sinh thái, nhiều OG Trung Quốc lại rút lui hoặc chuyển hướng sang AI, khiến hệ sinh thái châu Á mất khả năng tạo máu. Đối với cá nhân, tác giả khuyên nên tìm ra lý do tiếp tục gắn bó, giữ cho công việc và cuộc sống đầy đủ, học hỏi những điều mới như AI, tìm kiếm liên minh nhỏ và học cách hòa hợp với bản thân. Ông kêu gọi cần nhiều "ngọn hải đăng" hơn - không chỉ Vitalik, mà mọi người còn ở lại đều có thể trở thành nguồn sáng bằng cách hỗ trợ thế hệ trẻ. Ông kêu gọi các OG chia sẻ lại cho thế hệ tiếp theo, các founder không nên chiến đấu đơn độc, và các builder tiếp tục xây dựng một cách xứng đáng. Thông điệp cuối cùng nhấn mạnh: tương lai của Web3 không phải là trách nhiệm của một người hay một tổ chức, mà là của tất cả những ai còn ở lại. Thế hệ hiện tại cần lên tiếng và hỗ trợ để thế hệ tiếp theo có cơ hội tiếp tục xây dựng.

marsbit1 giờ trước

Người sáng lập IOSG: Web3 đang 'mất máu', những người trong nghề nên sống sót như thế nào?

marsbit1 giờ trước

Thâm hụt, Lạm phát và Fed Mới: Logic Sâu Sắc Đằng Sau Lợi Suất Trái phiếu Mỹ Vượt 5% và Sự Đặt Lại Thị trường

Trong tuần từ 15-19/5/2026, lợi suất trái phiếu kho bạc dài hạn của Mỹ tăng vọt, với lợi suất trái phiếu 30 năm đạt 5,2% - mức cao nhất kể từ năm 2007, còn lợi suất 10 năm là 4,687%. Thị trường chứng khoán cũng giảm điểm. Bài viết phân tích bốn nguyên nhân chính dẫn đến tình trạng này: 1. Lạm phát dai dẳng: Chỉ số giá sản xuất tháng 4 tăng 6% cho thấy áp lực giá cả vẫn mạnh. 2. Chủ tịch Fed mới: Ông Kevin Warsh bắt đầu nhiệm kỳ trong bối cảnh lạm phát phức tạp, khiến kỳ vọng thị trường chuyển từ giảm lãi suất sang khả năng tăng lãi suất. 3. Nợ công Mỹ leo thang: Thâm hụt ngân sách lớn và nhu cầu vay mượn tăng cao của Bộ Tài chính tạo áp lực cung trái phiếu, đẩy lợi suất lên. 4. Tác động từ chính sách thuế và xếp hạng tín nhiệm: Đạo luật OBBB làm tăng thâm hụt, trong khi Moody's hạ xếp hạng tín nhiệm Mỹ, phản ánh lo ngại về tính bền vững tài khóa. Lợi suất tăng tác động tiêu cực đến thị trường chứng khoán thông qua bốn kênh: hiệu ứng chiết khấu (giảm giá trị hiện tại của cổ phiếu), hiệu ứng cạnh tranh (trái phiếu có lợi suất hấp dẫn hơn), chi phí vay tăng lên, và đồng USD mạnh gây áp lực lên lợi nhuận của các công ty đa quốc gia. Đối với nhà đầu tư: - Cổ phiếu: Cổ phiếu tăng trưởng định giá cao chịu áp lực, trong khi cổ phiếu giá trị và ngành tài chính có thể hoạt động tốt hơn. - Trái phiếu: Trái phiếu trung hạn (5-10 năm) và trái phiếu doanh nghiệp chất lượng cao được ưa chuộng để cân bằng rủi ro và lợi suất. - Nhà đầu tư thu nhập: Môi trường lợi suất cố định hiện tại rất hấp dẫn. Các diễn biến đáng theo dõi bao gồm cuộc họp FOMC đầu tiên của Chủ tịch Warsh vào tháng 6, dữ liệu lạm phát Mỹ, kết quả đấu giá trái phiếu kho bạc, và việc liệu lợi suất trái phiếu 30 năm có tiến gần đến 6% hay không - một ngưỡng có thể kích hoạt đợt điều chỉnh lớn hơn trên thị trường chứng khoán.

marsbit1 giờ trước

Thâm hụt, Lạm phát và Fed Mới: Logic Sâu Sắc Đằng Sau Lợi Suất Trái phiếu Mỹ Vượt 5% và Sự Đặt Lại Thị trường

marsbit1 giờ trước

Bán Bitcoin Của Strategy Có Thực Sự Là Tín Hiệu Giá Xuống? Phân Tích 5 Logic Tài Chính Đằng Sau Việc Doanh Nghiệp Giảm Nắm Giữ Bitcoin

Công ty Strategy thông báo có thể bán một phần Bitcoin để đạt mục tiêu kinh doanh, gây chú ý trên thị trường. Tuy nhiên, việc doanh nghiệp nắm giữ Bitcoin bán ra không hẳn là tín hiệu tiêu cực, mà có thể xuất phát từ các lý do tài chính hợp lý nhằm tối đa hóa giá trị cho cổ đông. Bài viết phân tích 5 logic tài chính chính: 1. **Nâng cao lượng Bitcoin nắm giữ trên mỗi cổ phiếu**: Khi giá cổ phiếu thấp hơn giá trị tài sản Bitcoin, việc bán Bitcoin để mua lại cổ phiếu có thể làm tăng tỷ lệ Bitcoin/cổ phiếu. 2. **Tối ưu cơ cấu vốn, giảm chi phí vay**: Bán Bitcoin để tăng dự trữ tiền mặt giúp cải thiện xếp hạng tín nhiệm, từ đó tiếp cận nguồn vốn vay với chi phí thấp hơn. 3. **Hoạch định thuế hợp pháp**: Tận dụng quy định về giao dịch wash sale (hiện chưa áp dụng với Bitcoin ở Mỹ) để tạo ra lỗ trên sổ sách, giảm nghĩa vụ thuế. 4. **Bác bỏ tin đồn thị trường tiêu cực**: Hành động bán ra thực tế có thể chứng minh tính thanh khoản và khả năng phục hồi của thị trường, củng cố niềm tin vào mô hình nắm giữ Bitcoin. 5. **Mua lại cổ phiếu ưu đãi với giá chiết khấu**: Khi giá cổ phiếu ưu đãi giảm mạnh, doanh nghiệp có thể dùng tiền bán Bitcoin để mua lại chúng với giá thấp, thanh toán khoản nợ với chi phí hiệu quả. Tóm lại, Bitcoin với thuộc tính tiền tệ mang lại sự linh hoạt trong quản lý vốn. Việc bán ra trong các kịch bản chiến lược có thể là một công cụ tài chính thông minh để bảo vệ lợi ích của doanh nghiệp và cổ đông.

marsbit1 giờ trước

Bán Bitcoin Của Strategy Có Thực Sự Là Tín Hiệu Giá Xuống? Phân Tích 5 Logic Tài Chính Đằng Sau Việc Doanh Nghiệp Giảm Nắm Giữ Bitcoin

marsbit1 giờ trước

Trí Phổ Dựa Vào Đâu Để Tăng Gần 30% Trong Một Ngày?

Hôm nay, cổ phiếu của "cổ phiếu mô hình lớn toàn cầu đầu tiên" Zhipu AI (02513.HK) đã bùng nổ. Động lực chính đến từ một thông số kỹ thuật cụ thể: Tốc độ đầu ra API của phiên bản cao tốc GLM-5.1 (GLM-5.1-highspeed) đạt 400 token/giây, thiết lập kỷ lục mới về tốc độ API trong ngành công nghiệp mô hình lớn toàn cầu. Tốc độ 400 token/giây này quan trọng như thế nào? Khi AI chuyển từ ChatBot sang thời đại Agent, mỗi tác vụ thường yêu cầu hàng chục hoặc thậm chí hàng trăm lần gọi mô hình. Độ trễ thấp ở đây trở thành yếu tố then chốt, trực tiếp ảnh hưởng đến trải nghiệm người dùng và hiệu quả công việc. Tốc độ này nhanh gấp khoảng 3-5 lần so với các mô hình hàng đầu hiện tại như GPT-4o hay Claude Sonnet. Để đạt được bước đột phá này, Zhipu AI đã thực hiện những đổi mới đồng thời trên ba cấp độ: 1. **TileRT – Công cụ suy luận:** Biên dịch toàn bộ mô hình thành một động cơ chạy liên tục, loại bỏ chi phí khởi động và chờ đợi lặp đi lặp lại giữa các toán tử, cho phép GPU duy trì hoạt động ở tốc độ cao. 2. **Chiến lược song song:** Tối ưu hóa việc triển khai cơ chế chú ý MLA (Multi-head Latent Attention) của GLM-5.1 trên nhiều GPU. Họ áp dụng kiến trúc chạy không đồng nhất, trong đó GPU 0 chuyên xử lý chỉ mục thưa thớt và định tuyến, trong khi các GPU khác xử lý tính toán dày đặc, giảm thiểu đáng kể chi phí giao tiếp. 3. **Kiến trúc mạng ZCube:** Một thiết kế mạng mới thay thế cấu trúc ROFT (Fat-Tree) truyền thống. ZCube loại bỏ lớp Spine (xương sống), làm phẳng toàn bộ mạng và kết nối tất cả các bộ chuyển mạch Leaf (lá) theo một cấu trúc đặc biệt. Thiết kế này đảm bảo rằng giữa hai GPU bất kỳ chỉ có một đường dẫn tối ưu duy nhất, về cơ bản loại bỏ khả năng tắc nghẽn mạng do cân bằng tải không hiệu quả. Những cải tiến này mang lại lợi ích rõ ràng: cụm sản xuất nâng cấp lên ZCube đạt được mức tăng 15% thông lượng, giảm 40.6% độ trễ đuôi và giảm khoảng một phần ba chi phí thiết bị mạng. Về lâu dài, công nghệ này không chỉ nâng cao hiệu quả sử dụng GPU mà còn có thể định hình lại cấu trúc hạ tầng AI, mở ra cơ hội cho các nhà cung cấp chip AI, thiết bị chuyển mạch và mô-đun quang trong nước.

marsbit2 giờ trước

Trí Phổ Dựa Vào Đâu Để Tăng Gần 30% Trong Một Ngày?

marsbit2 giờ trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片