深信科创完成A轮融资,引爆合成数据范式革命

2025-08-31 08:31:43·  来源:深信科创  
 

近日,安徽深信科创信息技术有限公司(以下简称 “深信科创”)正式宣布完成 A 轮融资,本轮由合肥高投领投,合肥创新投、安徽省创投、科大硅谷基金、青岛西海岸人才生态产业集团跟投,帕累托森林担任独家融资财务顾问。资金将重点投入合成数据生成技术、持续学习框架及世界模型的深化研发,加速自动驾驶、工业场景与具身机器人领域的规模化落地。

作为图灵奖得主姚期智院士孵化的创新企业,深信科创凭借技术实力与行业贡献,2025 年跻身“中国人工智能 500 强”,同时作为国际CARLA组织中国唯一理事单位(其他两家为英伟达、丰田研究院),正以突破性理念重构 AI 训练的数据逻辑。

01.重构数据根基:合成数据将主导未来 AI 训练的核心范式

深信科创团队率先向行业抛出一个深刻命题:什么样的数据真正有利于 AI训练?是人工标注的人类数据,还是合成数据? 长久以来,人工标注的人类数据被视作 AI 训练的 “黄金燃料”,被认为是驱动 AI 进步的天然最优选择。但这一认知的颠覆,始于团队对 AlphaGo 与 AlphaZero 的技术对比:AlphaGo 依赖人类棋谱数据训练,而 AlphaZero 完全脱离人类数据,仅通过自我对弈生成的合成数据便实现更快的模型收敛与更强的对战能力。

这一发现让深信科创团队意识到:在 AI 训练中,人类数据未必能超越仿真数据,甚至在很多场景下,合成数据会展现出令人惊叹的价值。

随着 AI 技术的爆发式发展,人工标注模式的局限性日益凸显:一方面,AI 训练的数据需求呈指数级增长(如 L4 自动驾驶单次训练需百万级场景),而人工标注效率极低,完全跟不上数据训练的消耗速度;另一方面,人工标注成本高昂,且随着数据量激增,标注质量因疲劳、认知偏差等问题持续下降,极端场景漏标、错标率很高。

与之相对,合成数据的优势在技术突破后愈发显著:

  • 成本与效率的绝对领先:合成数据通过技术手段批量生成,无需人工逐帧标注,成本极低,完美匹配 AI 高频训练需求;

  • 超越人类经验的价值密度:合成数据能自主生成 “人类未经历但符合物理规律” 的极端Corner Case场景,这类场景在人类数据中罕见却对算法安全至关重要

除了以上两点,深信科创团队已经意识到,用于AI训练的数据组合将从 “99% 人工标注数据 + 1% 合成数据”,彻底转向 “1% 人类数据牵引 + 99% 合成数据主导” 的新模式。这一转变的核心在于,合成数据能包含 “人类已有数据中未涵盖却极具价值、且符合人类行为规律” 的内容,这类超越既有经验却遵循逻辑的信息,将成为驱动 AI 突破边界的关键。

图片

深信科创在全球范围内,已悄然成为对该数据组合范式转型发起挑战的国内首家泛机器人领域企业。

02.核心技术:国内首家“持续学习框架 + 世界模型”合成数据双引擎

深信科创的底气源于其在合成数据领域的技术深耕,通过 “持续学习框架 + 世界模型” 的双重保障,解决了合成数据 “真实性” 与 “价值密度” 两大核心问题:

广汽集团、深信科创等核心成员单位签约现场

持续学习框架:让合成数据“既真又难” 的动态引擎

续学习框架是合成数据高质量生成的核心逻辑,通过 “真实数据种子→多智能体动态对抗→自主泛化迭代” 的全链路闭环,实现场景的 “真实性 - 挑战性 - 多样性” 三位一体:

  • 真实数据奠基:依托 Oasis Rover 设备(FPGA 架构,支持 32 路摄像头 + 16 路激光雷达微秒级同步采集),捕捉 “环境 - 传感器 - 交通流” 的时序演化关系。

    图片
  • 多智能体动态对抗:将仿真环境中的背景车、行人等建模为 “对抗智能体”,以 “最大化被测系统决策压力” 为目标动态博弈。

    图片
  • 自主泛化迭代:基于多智能体持续学习,系统能从少量种子场景中自主探索海量泛化场景,且场景难度随算法性能自动升级。

    图片

世界模型:让合成数据“虚实一致” 的数字孪生系统

世界模型以 “物理规律建模 + 动态场景流生成 + 多智能体交互预测” 为核心,融合神经辐射场(NeRF)、3D 高斯溅射与扩散 Transformer(DiT)技术,构建 “几何 - 物理 - 语义” 三元一致的数字孪生:

  • 环境动态建模:通过 NeRF 技术重建港口堆场、矿山地形等场景的几何结构与物理属性(如摩擦系数、光照反射率),结合 DiT 架构实现未来状态预测。

  • 多智能体交互预测:基于多智能体强化学习(MARL),模拟智能体间的动态协作与冲突。

  • 虚实融合校准:通过 Oasis Rover 的微秒级同步数据(如激光雷达点云随雾浓度的衰减规律)校准仿真参数。

在某头部汽车公司的合作中,基于持续学习框架与世界模型的合成数据,使自动驾驶算法测试效率提升 210 万倍。

03.场景拓展:合成数据技术的跨域验证

      凭借合成数据技术的突破,深信科创的解决方案已在多领域落地验证,印证了技术跨场景复用的可行性:

  • 自动驾驶领域:合成数据覆盖了 “极端天气、复杂路口” 等传统路测难以触及的场景。

    图片
  • 工业场景:通过合成数据模拟设备老化与故障演化,精度达毫米级,替代了传统依赖人工记录的设备维护模式;港口场景中,合成数据生成的 “暴雨 + 大风 + 夜间” 复合工况,使调度算法效率大幅度提升。

    图片
  • 机器人领域:复用多传感器同步采集与多智能体建模技术,模拟机器人操作空间的物理交互(如抓取玻璃时的力度与形变关系),通过合成数据训练的策略已成功拓展到机器人领域。

04.

团队与愿景:顶尖阵容护航数据范式革新

 深信科创团队汇聚全球顶尖智慧。创始人兼 CEO 杨子江教授为美国宾夕法尼亚大学博士,现任中科大教授,发表近 40 篇 CCF A 类论文,担任 IEEE 自动驾驶标准组副主席;团队 80 人中 10% 为海外顶级名校博士,顾问团队由美国科学院 / 工程院院士 Moshe Vardi 等学界泰斗领衔,形成 “产学研” 深度融合的研发体系。

此次融资将加速公司向 “合成数据主导” 的未来发起冲锋,推动行业摆脱对人工标注数据的路径依赖。未来,随着技术的进一步成熟,AI 系统将在更广阔的领域突破人类既有经验的边界,创造出前所未有的价值。

  • 深信科创创始人杨子江教授表示:“本轮融资将加速两大技术方向突破:一是深化持续学习框架与世界模型的融合,让仿真场景更贴近物理世界规律;二是拓展工业数字孪生平台,实现从‘自动驾驶’到‘泛工业智能’的能力跃迁。我们坚信,具身智能的未来不仅是‘模仿人类行为’,更要‘理解物理规律’,这次融资正是向这一目标迈出的关键一步。”

  • 帕累托森林董事长李朝政博士表示:“深信科创的融资过程,印证了硬科技项目的价值逻辑 —— 以持续学习技术为‘矛’,突破行业痛点;以软硬件闭环为‘盾’,构建竞争壁垒。团队对技术商业化的清醒认知,使其在自动驾驶、工业智能等领域均展现出强落地能力。帕累托森林将持续发挥资源优势,助力其成为具身智能时代的核心玩家。”

分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026917号-25