面向Web3生态系统的开源软件供应链智能化分析平台
申请团队:OpenCAS × Web3Insight × OpenBuild
答辩人:Fjy@OpenCAS
【问题背景】Web3项目异构分散
Web3与Web2开源项目的核心区别:
"代码-贡献-治理"闭环实现技术治理民主化
开发者全球协同
数以万计的开发者跨越地理与组织界限协同构建
多生态关联
在以太坊、Solana、Cosmos等多个区块链生态中发展
技术栈多样
Solidity、Move、Go、Rust、C++、TypeScript……
技术组件多元
验证器节点、共识客户端、数据可用性层、RPC 节点、软件开发工具包 (SDKs)……
Web3开源项目的核心发展趋势:
从基础设施到上层应用,单链模块化扩展、多链互联生态加速形成
【痛点定位】项目维度:Web3软件供应链存在系统性风险
关键依赖的脆弱性被严重低估
隐式依赖
比如链下Go中继器功能可能完全依赖某个Solidity合约触发的事件数据结构
隐蔽风险
合约事件结构微小变更可能导致中继器逻辑崩溃或引发安全漏洞
系统性威胁
无法看清依赖路径,无法评估风险传导机制,缺乏系统性的事前审计机制
【痛点定位】开发者维度:Web3开发者贡献存在归因失真
价值评估扭曲
修复底层重入漏洞的5行代码,其价值可能远超修改文档拼写错误的100行提交
激励资源错配
真正维护关键基础设施的"隐形守护者"得不到应有回报,不利于生态的长期发展
【现状调研】针对Web3的跨生态语义级分析仍为空白
Web2的供应链分析工具
跨语言盲区: Snyk、Dependabot只能检测显式依赖,大部分研究聚焦于同语言内
Web3链上分析工具
跨组件盲区: CrossInspector、DeFiTail分析范围严格局限于链上合约
Web3供应链尝试
跨生态盲区: deepfunding/dependency-graph使用了简单的显式依赖分析,且没有跨生态图谱
【核心目标】Web3开源软件供应链智能化基础设施平台
从"项目"维度
解决系统性安全风险的罗盘缺失问题
从"依赖黑盒"走向"依赖透明"
从"开发者"维度
解决贡献价值的度量衡失准问题
从"激励失准"走向"价值可见"
【解决方案】工程实践×学术预研的分层技术路线
【已实现】第一层:数据收集与工程底座构建
结合现有的大数据分析与存储技术,针对Web3开源开发者、开源活动、开源仓库构建基础数据源
【预研阶段】第二层:跨生态语义依赖图谱构建
结合软件工程、人工智能、网络安全的前沿学术技术,表征代码实体、建立语义链接
【预研阶段】第三层:驱动安全与价值的双引擎
面向项目和开发者两个维度,构建供应链安全分析引擎、开源贡献价值分析引擎
【终极目标】第四层:自动化激励闭环
形成基于客观数据的、自动化的、可信的链上开源贡献激励分配机制
【已实现】第一层:数据收集与工程底座构建
项目维度
已建立持续更新的Web3开源仓库数据库,涵盖主流生态系统中的数千个项目
  • 集成OpenDigger、OSS Insight等数据源
  • 结合GHArchive和BigQuery等典型开源研究工具
  • 获取项目活跃度、贡献者统计、Issue/PR等海量基础指标
开发者维度
通过三层检测机制,已验证并链接了2,198个核心Web3开发者的链上地址与链下身份
  • 专家规则检测
  • 大语言模型分析
  • 人工审核验证
【预研阶段】第二层:跨生态语义依赖图谱构建
关键科学问题
如何将分散在多个代码仓库、用多种语言编写的Web3项目组件,解析为统一的、包含隐式语义依赖的知识图谱?
核心搭建思路
01
多模态代码实体表征
利用静态解析器提取AST,将不同语言的代码统一转化为可链接的"代码实体"节点
02
语义依赖提取
通过分析"变更波"和"概念耦合",挖掘代码间的隐式功能依赖
03
实体链接
结合NLP技术,将非结构化文本与图谱中的结构化代码实体进行链接
创新链接模式
静态链接
深度代码解析,精确匹配链下代码中硬编码的链上实体标识符
代码文档语义链接
利用NLP技术分析GitHub Issue、PR描述、论坛讨论等语义信息;分析部署脚本,揭示组件协同工作关系
变更波链接
分析代码演进历史,识别频繁同时修改的文件对
动态跟踪链接
关联链上交易与链下服务运行时日志,捕获动态依赖
【预研阶段】第三层:驱动安全与价值的双引擎
引擎一:项目维度驱动供应链安全分析
漏洞传播与"爆炸半径"评估
当底层组件爆出漏洞时,在跨生态语义依赖图谱上启动传播算法,精准评估其"爆炸半径"
关键节点识别
通过网络中心性算法识别依赖网络的核心"关键节点",输出数据驱动的审计优先级列表
引擎二:开发者维度驱动开源贡献价值分析
Web3贡献语义分类
建立Web3特有的贡献分类体系,根据生态影响赋予差异化权重
ContributionRank算法
分析贡献触及节点在跨生态语义依赖图谱中的中心性,识别并量化"四两拨千斤"的关键贡献
【终极目标】第四层:自动化激励闭环
可信数据
项目数据+身份链接
风险评估
精准的安全分析
贡献评分
精准的价值量化
链上激励
自动化分配
从"风险识别"到"贡献识别"再到"价值实现"的完整正向循环
【团队成员】产学研充分融合
学术力量(OpenCAS)
来自中国科学院大学开源软件与区块链协会,包括国内权威实验室的2名在读博士和3名在读硕士,研究方向横跨区块链、软件安全、人工智能、网络安全等强相关子领域,都具备Web3开发经验,高年级成员已发表多篇顶会顶刊文章。
  • 创新工厂——计算所区块链与分布式应用联合实验室 (国内第一个获得以太坊基金会奖励资助的研究组)
  • 24级在读:Fjy、OneFly
  • 23级在读:Justin、Boki
  • 信工所信息安全国家重点实验室(国内唯一一家信息安全领域的学科类国家重点实验室)
  • 23级在读:skysys.eth
工业力量(Web3Insight)
由两位资深Web3开源开发者领衔,拥有丰富的全栈开发经验
  • 资深开发者pseudoyu:Web3Insight 创始人,主要负责前端及核心业务开发,曾深入参与开放信息数据层RSS3、全球最大的 RSS 网络RSSHub的核心研发工作。
  • 资深开发者Vincent:Web3Insight联合创始人,后端开发,完善数据索引流程、后端服务开发与图数据库支持,曾经主导了开源硬件钱包OSKey 的核心研发工作。
生态力量(OpenBuild)
来自OpenBuild社区的资深成员,具有丰富的开源社区协作、组织和推广经验
  • 战略顾问Ian:Openbuild 创始人
解决真需求,专注真研究,落地真项目
【实施计划】预算分配与里程碑设置
整个项目周期为预计一年左右,总申请预算42,000 USDT
1
启动阶段(第1个月)
15%预算-6300USDT: 完成高性能服务器、数据库基础设施采购,完成数据集的基本处理和分析
2
里程碑一(4个月)
25%预算-10500USDT: 完成Neo4j图数据库集成,交付基础静态分析工具,初步建立跨生态语义依赖图谱构建
3
里程碑二(4个月)
30%预算-12600USDT: 覆盖更多生态分析,完善跨生态语义依赖图谱,初步形成供应链安全分析算法、开发者贡献分析算法
4
里程碑三(4个月)
30%预算-12600USDT: 完成学术论文撰写与发表,将算法集成至系统实现
【项目愿景】赋能Web3开源生态
华语开源社区正面影响
显著降低新手参与门槛
提供完整的中文版工具、技术文档和研究报告
带动多层网络协作
形成产学研共创联动典范
增加华语Web3开发者影响力
联动中国开源年会COSCon、开源社,定期发布《Web3华语开发者报告》,量化、可视化地展示华语开发者在Web3生态中的贡献与地位
增加华语Web3研究员影响力
联动中国计算机学会区块链技术大会,将核心方法论撰写高质量英文论文,投向计算机领域国际顶级期刊会议,增加华语研究员学术影响
形成多方共赢正向飞轮
开源开发者
吸引更多高质量开发者加入
→ 产出更高质量的公共物品
→ 平台数据更丰富、分析更准确
项目方/基金会
资金流向生态根基
→ 关键基础设施更稳固
→ 生态更加繁荣,更多项目方加入
投资者/DAO
资本配置更高效,目标更明晰
→ 优质项目获得更多支持
→ 生态整体质量提升
Web3生态整体
生态系统更健康、更具韧性
→ 吸引更多主流用户和资本进入 → 助力Web3实现大规模应用
区块链研究
开源数据集可复用可协作
→ 安全与治理工具迭代加速
→ 整个生态的研究水平被动提高
华语社区/高校
更多华语力量参与全球协作
→ 培养更多国际视野的人才
→ 形成人才培养的正向循环
Web3Insight.AI
面向Web3生态系统的开源软件供应链智能化分析平台
AI×Web3 工程实践×学术预研
开源、开放 平等、共促
让真正的开发者贡献 被看见、被认可、被激励
让开源的Web3生态 更安全、更健康、更繁荣