我们为什么执着于那些“费力不讨好”的数据清洗?

marsbit發佈於 2026-01-24更新於 2026-01-24

文章摘要

作者是RootData数据活动负责人,分享了第2期悬赏活动的成果和思考。活动共有140多名用户参与,提交1220条反馈,最终沉淀564条有效数据,过审率46.2%。活动补充了300多位项目核心成员信息,修正了120处代币解锁数据,并优化了150个存量信息点。 文章探讨了为什么在Web3领域推动数据透明度如此困难却又至关重要。RootData自掏腰包发动社区做数据清洗,是因为从ICO时代到FTX事件,用户往往缺乏“投资知情权”。数据割裂问题严重,同一项目在不同平台的数据版本可能完全不同,而项目团队在TGE前后的频繁调整更是关键信号。 为确保透明度,RootData每月披露虚假融资情报,发布深度调研报告,并加强LinkedIn等平台的信息抓取和核实。他们坚持严谨审核,只采纳经多方验证的数据。未来,RootData计划将分散的数据点串联成逻辑严密的透明度报告,甚至转化为投资策略,推动Web3走向主流。

作者: @BlockCookies

大家好,我是 RootData 数据活动负责人。

第 2 期 RootData 悬赏活动已圆满结束,在发布这期复盘时,比起冷冰的数字,我更想和大家聊聊:为什么在 Web3 推进“数据透明度”是一件极其困难、却又必须有人去做的事?

首先,同步一下本期活动的数据:共有 140 多个独立用户参与,提供 1220 条反馈,最终沉淀了 564 条有效数据,平均过审率为 46.2%。

第 2 期悬赏活动数据总览

本次活动帮助 RootData 补充了近 300 多个“Alpha 背后的人”,比如 MOMO.FUN、Subhub、boop 等高管和负责人团队。这些人物通常没有在x介绍或者Linkedin中描述职位,但有时候会出席活动或者活跃在社群里面。

同时,我们修正了约 120 处代币解锁信息。其中有些是 TGE 时间不够准确,有些是解锁规则没有在第一时间公示,这些问题都通过社区成员的力量得到优化。

此外,我们对 150 个存量信息点进行了深度优化。比如我们发现 Fanable 创始人被错录为同名非 Web3 人士,其董事总经理 Sergio 已是离职状态;AINFT 项目早已更换了推特账号...

我们为什么要推动 Web3 领域透明度?这些数据看似平淡无奇,况且 RootData 本身就是链下数据的聚合专家,为什么还要自掏腰包、发动社区去做这种“苦力活”?

老实说,当老板 @yubopan1 把这个任务交给我时,我也犹豫过。但他的一句话让我感触很深:从 ICO 时代到 FTX 事件,用户最大的悲哀是得不到公平的‘投资知情权’。随着加密合规化,数据平台必须首当其冲,做那面照妖镜。

作为数据负责人,我能深刻感受他的判断是正确的:单凭一家之言,不足以支撑准确。没有经过多方验证的数据,不足以让 RootData 成为让投资者信任的平台。

单说代币解锁这一项数据,就非常的“割裂”:同一个项目,在市面上 5 个主流解锁平台上,数据可能是 5 个版本。

众所周知,Binance Listing 需要提交至少 3 位团队成员。RootData 收录了 18000 多名行业人物,有多少人在 TGE 前夕紧急更新简历,又有多少人在拿完融资后“静默离开”?

本期活动我们发现:大量项目方在 TGE 前后会出现核心成员频繁变动。 对于投资者来说,这往往是项目走向的“风向标”。如果没人去核实、去披露,这些信息就会淹没在每天爆炸量的信息流里面。

为了确保“透明度”不是一句口号,我们现阶段落地的方案包括:

  • 每个月都坚持披露的虚假融资情报
  • 定期进行深度调研,如近期发布的《交易所上币决策报告》。
  • 提升 LinkedIn 人物动态的抓取与核实频率。

另外,我们坚持严谨审核态度。在本期活动中,有一位用户反馈了 River 开发团队的详细信息,但其信源仅是币安广场的一个第三方账号发言。尽管内容详尽,但因缺乏官方背书或多方交叉验证,我们依然选择不予通过。

本期活动聚焦于“币安 Alpha”,我们也尝试与币安团队进行了沟通。我们并不想针对某家交易所,相反,我们希望与行业巨头站在一起。

我们曾向币安团队确认一些关键维度,对方反馈非常积极:“如果 Alpha 这边有任何信息需要确认,可以随时沟通。”

单点的数据修正只是开始。未来,RootData 将从“离散的数据点”串联成“逻辑严密的透明度报告”,甚至转化为最实际的投资策略。

透明度是一场持久战,也是 Web3 走向主流的必经之路。我们需要更多的“数据猎人”加入,一起揭开迷雾。欢迎大家留言讨论。

相關問答

QRootData要推动Web3领域数据透明度的根本原因是什么?

A根本原因是确保用户的'投资知情权'。从ICO时代到FTX事件,用户最大的悲哀是得不到公平的投资信息。随着加密合规化,数据平台必须首当其冲的'照妖镜',通过多方验证的数据建立投资者可信赖的平台。

Q第2期RootData悬赏活动取得了哪些具体数据成果?

A共有140多个独立用户参与,提供1220条反馈,最终沉淀了564条有效数据,平均过审率为46.2%。活动补充了300多个'Alpha背后的人',修正了约120处代币解锁信息,并对150个存量信息点进行了深度优化。

Q为什么代币解锁数据在Web3领域存在'割裂'现象?

A同一个项目在市面上5个主流解锁平台上可能出现5个不同版本的数据。这是因为有些TGE时间不够准确,有些解锁规则没有在第一时间公示,导致数据源不一致且缺乏统一标准。

QRootData通过哪些具体措施来确保数据透明度?

A1. 每月坚持披露虚假融资情报;2. 定期进行深度调研(如《交易所上币决策报告》);3. 提升LinkedIn人物动态的抓取与核实频率;4. 坚持严谨审核态度,要求官方背书或多方交叉验证。

Q未来RootData在数据透明度方面有什么进一步计划?

A将从'离散的数据点'串联成'逻辑严密的透明度报告',甚至转化为最实际的投资策略。同时希望与行业巨头(如币安)合作确认关键信息,并邀请更多'数据猎人'共同推动Web3透明度建设。

你可能也喜歡

坚守一级市场的VC,手里还有多少钱?

原标题:坚守一级市场的VC,手里还有多少钱? 多位加密货币行业投资人就一级市场现状展开讨论,核心分歧在于资金究竟集中在早期还是后期阶段,但共识是:市场并不缺钱,缺的是值得投资的高质量项目。 Crucible Capital合伙人Meltem Demirors指出,加密货币行业真正能带来“VC级回报”的赛道有限,目前优秀创始人和项目供给不足,导致从种子轮到A轮的门槛显著提高。 Blockworks联合创始人Mippo补充称,早期资金其实过剩,但后期增长资金明显不足。 然而,Varys Capital的Tom Dunleavy与Pantera Capital的Mason Nystrom就资金分布产生激烈争论。Dunleavy引用数据称,2026年80%以上资金流向了后期轮次,A轮及之后的可用资金约60-70亿美元,集中在5-6家大型机构;早期资金仅10-20亿美元,分散于数十家小基金。Nystrom则反驳称,真正能投B轮的基金极少,大多数项目进入传统VC体系后已不算纯加密货币项目,且早期融资的“可获得性”远高于后期。 双方虽未达成一致,但揭示出同一现实:表面资金充足,实则结构收紧——早期资金分散但竞争激烈,中后期资金集中却门槛极高。市场正从依赖叙事和流量转向更看重实际业务进展和长期增长能力。对VC意味着必须更谨慎出手,对创业者则需具备跨越长周期和高门槛的实力。

Odaily星球日报46 分鐘前

坚守一级市场的VC,手里还有多少钱?

Odaily星球日报46 分鐘前

交易

現貨
合約
活动图片