Hermes Agent Guide: Surpassing OpenClaw, Boosting Productivity by 100x

marsbitXuất bản vào 2026-04-13Cập nhật gần nhất vào 2026-04-13

Tóm tắt

A guide to Hermes Agent, an open-source AI agent framework by Nous Research, positioned as a powerful alternative to OpenClaw. It is described as a self-evolving agent with a built-in learning loop that autonomously creates skills from experience, continuously improves them, and solidifies knowledge into reusable assets. Its core features include a memory system (storing environment info and user preferences in MEMORY.md and USER.md) and a skill system that generates structured documentation for complex tasks. The agent boasts over 40 built-in tools for web search, browser automation, vision, image generation, and text-to-speech. It supports scheduling automated tasks and can run on various infrastructures, from a $5 VPS to GPU clusters. Popular tools within its ecosystem include the Hindsight memory plugin, the Anthropic Cybersecurity Skills pack, and the mission-control dashboard for agent orchestration. Key differentiators from OpenClaw are its architecture philosophy—centered on the agent's own execution loop rather than a central controller—and its autonomous skill generation versus OpenClaw's manually written skills. Installation is a one-line command, and setup is guided. It integrates with messaging platforms like Telegram, Discord, and Slack. It's suited for scenarios requiring a persistent, context-aware assistant that improves over time, automates workflows, and operates across various deployment environments.

On February 25th, a team called Nous Research quietly released a v0.1.0 on GitHub. Initially, the Hermes model only had a one-line installation command and a one-sentence product positioning: "An agent that grows with you".

At the time, very few people noticed it. Even though Nous Research has a certain reputation in the model community, and their Hermes series models have accumulated 33 million downloads on HuggingFace, the entire developer community's attention was focused on the deified OpenClaw "Crawfish". Gaining stars 33% faster than React to become the historical number one, "Crawfish" became the fastest-growing project in GitHub history, peaking at 710 stars per hour. But at the same time, security researchers were disclosing vulnerabilities at an average rate of 2.2 CVEs per day within the same time window, accumulating 138 security vulnerabilities over 63 days. The entire community began to rethink a question: Can this thing actually be used in a production environment?

Against this backdrop, Hermes Agent, as a competing product, finally found an opportunity and welcomed its own first period of rapid growth.

Hermes wrote a one-click migration tool from OpenClaw into its code. Those developers leaving OpenClaw needed a place to land, and Hermes Agent became a well-recommended choice passed around by word of mouth.

So, starting from early March, Hermes Agent broke into GitHub Trending, reaching a high of 11th place, with stars surpassing 2200. AwesomeAgents called it "the most ambitious open-source Agent release of 2026 so far". Currently, Hermes has 69.9k Stars and 9k Forks on GitHub.

Today, BlockBeats will talk to everyone about what makes this Agent different.

What is Hermes Agent?

Hermes Agent is a self-evolving AI agent built by Nous Research, and it is currently the only Agent with a built-in learning loop.

It can automatically create skills from usage experience, continuously improve these skills during use, actively solidify knowledge into reusable assets, retrieve its own past conversation history, and continuously deepen its understanding of you, the user, across multiple sessions.

So, simply put, the biggest advantage of Hermes Agent is: The more you use it, the smarter and more handy it becomes.

Its positioning is not a programming assistant bound to an IDE, nor is it a chat wrapper for a single API, but a truly autonomous agent that resides on your server, remembers what it has learned, and grows stronger the longer it runs.

Nous Research has positioned itself from the beginning as an open-source first, decentralization-oriented AI lab, aiming to build AI that users can control autonomously, rather than concentrating intelligence in the hands of a few closed companies. Their early work focused on the Hermes model series, while also investing heavily in infrastructure and systems level, exploring technologies like DisTrO for model training across globally distributed consumer-grade GPUs, and simulation environments like WorldSim and Doomscroll for multi-agent interaction and long-term behavior.

The team behind Hermes Agent is the same group that previously built a series of models like Nomos and Psyche.

What are the useful tools?

The core mechanisms of Hermes Agent are its memory system and skill system. The Agent maintains two concise core files: MEMORY.md stores environmental information, conventions, and experiences summarized from past tasks; USER.md stores your preferences and communication style. These two files are automatically injected into the system prompt at the start of each session, acting as the Agent's "long-term working memory". Additionally, all historical sessions are stored in a SQLite full-text search database, allowing the Agent to retrieve conversation content from weeks ago.

Regarding the skill system, each time a complex task is completed (typically involving 5 or more tool calls), the Agent autonomously creates a structured Markdown "skill document" recording the steps, known information, and verification methods for future reuse. Skill files follow a progressive disclosure pattern: the Agent by default only sees the skill name and description (about 3000 tokens), and loads the full content of a specific skill only when needed, thus controlling token consumption.

At the tool level, Hermes Agent comes with over 40 built-in tools, covering web search, browser automation, visual understanding, image generation, text-to-speech, and also supports setting up scheduled tasks via natural language, allowing the Agent to automatically perform periodic work like report generation, data backup, and system monitoring unattended.

Among these, the most popular tools, meaning those with the highest frequency of use by the community users, the most feedback, and based on Hermes's functional architecture and the typical needs of the developer community, the ones ranked at the top are these:

Hindsight is currently the hottest single tool in the ecosystem and is the officially recommended long-term memory plugin for Hermes. It automatically recalls relevant context before each LLM call, supports local PostgreSQL or cloud deployment, and is already integrated into Hermes as a native Memory Provider.

Anthropic-Cybersecurity-Skills is the skill pack with the highest Stars in the ecosystem, containing 753+ structured cybersecurity skills, fully mapping the MITRE ATT&CK framework, suitable for security research and penetration testing scenarios.

mission-control is currently the most popular Agent orchestration dashboard in the ecosystem, supporting Agent fleet management, task distribution, cost tracking, and multi-Agent collaborative workflows, recommended by the community as the standard for production-level deployment.

Hermes Agent Self-Evolution is an evolutionary self-improvement technique using DSPy + GEPA to optimize skills, prompts, and code.

Hermes Workspace is the native workspace for Hermes, integrating a chat interface, terminal, and skill manager, and is the most popular graphical entry point.

Furthermore, it can spawn independent sub-agents, each with its own dialogue context, independent terminal, and Python RPC scripts, enabling zero-context-cost parallel pipelines.

In terms of infrastructure flexibility, it supports six terminal backends: local run, Docker, SSH remote, Daytona serverless, Singularity containers, and Modal cloud functions. Daytona and Modal hibernate when idle, costing almost nothing. You can run it on a $5 VPS or a GPU cluster, issue commands through Telegram, and have it work on cloud servers you never SSH into directly.

Hermes Agent currently constitutes the most direct competition with OpenClaw, as both are open-source Agent frameworks aimed at developers.

The architectural philosophies of the two are截然不同 (distinctly different): OpenClaw's design core is a "control plane", a unified long-running process responsible for managing sessions, routing, tool execution, and state—everything flows through this central controller. Hermes, however, centers around the Agent's own execution loop, building the gateway, task scheduler, tool runtime, etc., all around this "do, learn, improve" iterative cycle.

The difference in the skill systems is particularly significant: OpenClaw's skills are mostly manually written, loaded from different levels like workspace, personal, shared, or plugins; Hermes's approach is to let the Agent generate skills from experience itself, forming a true autonomous learning loop.

How to Install and Use

Getting started is extremely simple. A single command, "curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash", completes the installation. It works on Linux, macOS, and WSL2. Hermes Agent automatically completes all configuration without manual operation.

Hermes Official Website

After Hermes Agent is installed, run "hermes setup" to start the setup wizard. Select your model provider (supports Nous Portal, OpenRouter, OpenAI, or any custom endpoint), connect your messaging platform (Telegram, Discord, Slack, or WhatsApp), and then start your first conversation. From the first interaction, Hermes Agent immediately enters learning mode, starting to build memory, create skills, and becoming more capable after each session.

Core commands for daily use include:

hermes (start conversation),

hermes model (select LLM provider and model),

hermes tools (configure which tools to enable),

hermes gateway (start message gateway, connect to Telegram, Discord, etc.),

hermes setup (run the full setup wizard, configure everything at once),

hermes claw migrate (migrate from OpenClaw),

hermes update (update to the latest version),

hermes doctor (diagnose problems);

Hermes Agent is suitable for scenarios including: General AI assistants that need to remember context across sessions and continuously improve capabilities; Custom Agent workflows that need to combine tools, plugins, MCP servers, browsers, or Shell; Deploying Agents on local hardware, cloud VMs, or low-cost serverless infrastructure; and Persistent assistant scenarios that require cross-platform searchable conversation history and acquired skills.

More specifically, you can use it to talk to it on Telegram while it executes tasks on a cloud VM, set up automations and push reports to any platform, have it take over periodic tasks; you can also integrate it into Slack or Discord to provide AI collaboration support for the entire team; or utilize its trajectory export function to generate training data for RL training of next-generation tool-calling models.

Câu hỏi Liên quan

QWhat is the core mechanism that makes Hermes Agent unique according to the article?

AIts memory system and skill system. It maintains two core files (MEMORY.md and USER.md) for long-term working memory and autonomously creates structured Markdown skill documents from complex tasks for future reuse.

QWhat was a key factor that contributed to Hermes Agent's initial growth period?

AThe security vulnerabilities discovered in the competing project OpenClaw, which caused the developer community to reconsider its use in production environments. Hermes provided a migration tool for developers leaving OpenClaw.

QName one of the most popular tools in the Hermes Agent ecosystem mentioned in the article.

AHindsight, which is the official long-term memory plugin that automatically recalls relevant context before each LLM call.

QHow does the installation process for Hermes Agent work?

AWith a single command: `curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash`. It automatically completes all configuration.

QWhat is the fundamental architectural difference between Hermes Agent and OpenClaw as described in the article?

AOpenClaw is designed around a central 'control plane' that manages everything, while Hermes is built around the agent's own execution loop of 'do, learn, improve', with all components supporting that cycle.

Nội dung Liên quan

‘Cổ Phiếu Lão Làng’ Biến Thành ‘Quý Tộc Mới’: Từ Dell Đến Nokia, AI Định Giá Lại Cơ Sở Hạ Tầng Cũ Như Thế Nào?

**Tóm tắt: "Cổ phiếu 'lão làng' thành 'quý tộc mới': AI định giá lại cơ sở hạ tầng cũ từ Dell đến Nokia như thế nào?"** Chỉ một năm trước, những công ty công nghệ lâu đời như Dell, Nokia, Cisco, Corning, Western Data dường như đứng ngoài cuộc chơi AI. Thị trường chú trọng vào những cái tên "nóng" như NVIDIA hay các mảng chip, lưu trữ, quang học. Tuy nhiên, gần đây, các "lão làng" này lại thể hiện sức hút mạnh mẽ. Nguyên nhân? AI đang chuyển từ giai đoạn phát triển mô hình sang giai đoạn triển khai thực tế, đòi hỏi xây dựng cơ sở hạ tầng vật lý quy mô lớn. Đây là thời điểm các công ty có năng lực tích hợp hệ thống, kinh nghiệm giao hàng và mạng lưới khách hàng doanh nghiệp vững chắc được định giá lại. Họ sở hữu những "tài sản cũ" nhưng lại đáp ứng "nhu cầu mới" của kỷ nguyên AI. Có ba nhóm chính được định giá lại: 1. **Máy chủ & Tích hợp hệ thống:** Dell và HPE không sản xuất GPU, nhưng họ là những "nhà thầu chính" quan trọng, cung cấp năng lực thiết kế server, chuỗi cung ứng và triển khai trọn gói các cụm AI cho khách hàng. 2. **Mạng & Kết nối:** Cơ sở hạ tầng AI cần mạng lưới siêu tốc. Corning (cáp quang), Nokia (mạng không dây AI-RAN, 6G) và Cisco (thiết bị chuyển mạch trung tâm dữ liệu) trở nên quan trọng khi quy mô tính toán mở rộng và AI di chuyển ra biên mạng. 3. **Lưu trữ & Quản lý dữ liệu:** Ngoài bộ nhớ tốc độ cao (HBM), sự bùng nổ dữ liệu AI (dữ liệu huấn luyện, nhật ký, video, lưu trữ lạnh) làm tăng nhu cầu về ổ cứng dung lượng lớn, giúp các công ty như Western Digital và Seagate được chú ý trở lại. Tuy nhiên, không phải mọi công ty cũ đều được hưởng lợi đồng đều. Một sự "định giá lại thực sự" cần đáp ứng ba tiêu chí: (1) Có đơn hàng và doanh thu AI cụ thể được công bố; (2) Ban lãnh đạo điều chỉnh kỳ vọng tăng trưởng (hướng dẫn) tăng lên; (3) Chất lượng lợi nhuận được cải thiện, không chỉ tăng trưởng doanh thu đơn thuần. Tóm lại, đợt định giá lại này không phải là cơn sốt ngắn hạn hay câu chuyện mơ hồ. Nó phản ánh thực tế rằng khi AI bước vào giai đoạn xây dựng hạ tầng thực tế, các công ty có năng lực triển khai và cung cấp các thành phần cơ sở hạ tầng thiết yếu sẽ tìm thấy vị thế mới. Họ không trở nên trẻ trung hơn, mà những gì họ có lại trở nên cần thiết trong kỷ nguyên mới.

marsbit6 phút trước

‘Cổ Phiếu Lão Làng’ Biến Thành ‘Quý Tộc Mới’: Từ Dell Đến Nokia, AI Định Giá Lại Cơ Sở Hạ Tầng Cũ Như Thế Nào?

marsbit6 phút trước

Xác suất ẩn trong giá cả: Tỷ lệ cược World Cup được tính như thế nào?

**Xác suất trong Giá cả: Tỷ lệ World Cup được Tính như thế nào?** Trước World Cup 2026, hai hệ thống uy tín đưa ra "xác suất vô địch" khác nhau: thị trường dự đoán (Polymarket, Kalshi) xếp Pháp là ứng cử viên số 1 (~17%), trong khi siêu máy tính Opta xếp Tây Ban Nha là số 1 (16.1%). Bài viết giải thích cách hai con số này được tạo ra: 1. **Xác suất từ Thị trường:** Giá hợp đồng (từ 0-100 cent) phản ánh trực tiếp xác suất thị trường. Giá tổng hợp dựa trên khối lượng giao dịch khổng lồ (hơn 523 triệu USD). Tuy nhiên, tính thanh khoản vẫn còn hạn chế, và nghiên cứu cho thấy sự thiên lệch "longshot" tồn tại ngay cả trên thị trường tiên đoán crypto: các cửa cược dài hạn thường bị đánh giá thấp hơn khả năng thực tế. 2. **Xác suất từ Mô hình:** Opta sử dụng dữ liệu đội bóng và mô phỏng toàn bộ giải đấu 10,000 lần để tính tần suất vô địch. Điều đáng chú ý là đầu vào của mô hình này bao gồm cả tỷ lệ cược từ thị trường cá cược truyền thống. Không có nghiên cứu học thuật chặt chẽ nào so sánh độ chính xác lâu dài giữa hai phương pháp trên. Một điểm khác biệt lớn là tính minh bạch: mọi giao dịch trên Polymarket đều được ghi lại trên blockchain, cho phép kiểm toán công khai. Một yếu tố phi thị trường ảnh hưởng đến giá là sự không chắc chắn về quy định, như luật mới ở Minnesota (Mỹ) coi việc vận hành thị trường dự đoán là trọng tội. Tóm lại, "xác suất" bạn thấy có thể là giá thị trường (chịu ảnh hưởng của tính thanh khoản và thiên lệch) hoặc tần suất mô phỏng (phụ thuộc vào mô hình). Câu hỏi quan trọng khi đối mặt với bất kỳ con số nào là: **Nó được sản xuất như thế nào?**

marsbit36 phút trước

Xác suất ẩn trong giá cả: Tỷ lệ cược World Cup được tính như thế nào?

marsbit36 phút trước

Bất ngờ! Anthropic kêu gọi toàn ngành ngừng nghiên cứu AI

Bài viết thảo luận về lời kêu gọi tạm dừng nghiên cứu AI từ Anthropic, dựa trên quan sát về khả năng "tự tiến hóa" (recursive self-improvement - RSI) của AI, cụ thể là mô hình Claude. Dữ liệu nội bộ cho thấy Claude đang đẩy nhanh tiến trình phát triển AI: hơn 80% codebase của Anthropic hiện do Claude viết, so với chỉ số ít trước khi Claude Code ra mắt. Năng suất của kỹ sư tăng gấp 8 lần. Quan trọng hơn, chất lượng code của Claude được đánh giá ngang bằng con người và dự kiến vượt trội trong năm nay. Tỷ lệ thành công của Claude trong các nhiệm vụ lập trình phức tạp nhất đã tăng từ 26% lên 76% chỉ trong nửa năm. Anthropic giới thiệu chỉ số "thời gian nhiệm vụ AI có thể hoàn thành độc lập", cho thấy tốc độ tăng trưởng theo cấp số nhân, từ 4 phút (3/2024) lên 16 giờ (hiện tại), với chu kỳ tăng gấp đôi rút ngắn từ 7 tháng xuống 4 tháng. Claude không chỉ viết code mà còn tự động review code, ngăn chặn được khoảng 1/3 lỗi nghiêm trọng. Trong nghiên cứu, Claude đã tối ưu hóa code chạy nhanh hơn 52 lần và tự thiết kế/thực hiện thí nghiệm AI safety, đạt kết quả vượt xa nỗ lực của con người. Bài viết đặt câu hỏi về tương lai khi vai trò con người trong phát triển AI đang thu hẹp lại, chỉ còn lại ưu thế về "khiếu nghiên cứu". Anthropic nêu ba kịch bản có thể xảy ra: (1) Tiến bộ chững lại, (2) AI tiếp tục tăng tốc nhưng con người vẫn kiểm soát, (3) AI đạt đến RSI hoàn toàn, tự thiết kế thế hệ kế tiếp, mang lại lợi ích to lớn hoặc rủi ro mất kiểm soát nếu vấn đề "alignment" thất bại. Do những rủi ro tiềm ẩn này, Anthropic đề xuất một cơ chế có thể xác minh để các phòng lab AI cùng giảm tốc hoặc tạm dừng, nếu đảm bảo không có bên nào "lén lút" phát triển. Lời kêu gọi này trở nên đáng chú ý hơn khi OpenAI cũng gần đây chia sẻ quan sát tương tự về dấu hiệu tự tiến hóa sớm của AI.

marsbit36 phút trước

Bất ngờ! Anthropic kêu gọi toàn ngành ngừng nghiên cứu AI

marsbit36 phút trước

Giao dịch

Giao ngay
Hợp đồng Tương lai
活动图片