深信科创合成数据上线深圳数据交易所,助力汽车行业AI模型应用

2024-02-19 14:12:50·  来源:深信科创  
 

文章摘要


随着自动驾驶技术的进步,对于高质量训练数据和测试数据的需求迅速增长。为应对自动驾驶领域所面临的巨大数据需求和挑战,深圳数据交易所与深信科创信息技术有限公司合作,共同推出面向自动驾驶感知训练测试的合成数据解决方案,并在国内某知名ADS厂商自动泊车解决方案中首次实施应用。


背景介绍


随着汽车自动驾驶技术的快速发展,对于自动驾驶系统的训练和测试数据的需求急剧增长,大规模、多样化、高质量的真实道路数据获取逐渐成为自动驾驶汽车落地过程中的主要挑战,主要表现如下:


1.  真实道路场景数据获取成本高:传统基于真实道路场景的训练和测试数据,采集成本高、重建时间周期长、场景覆盖率低、安全风险大,还有可能受到法律法规、采集资质、数据隐私保护方面的限制;


2. 路采数据标注的挑战:基于路采场景的数据需要进行大量的数据标注工作,但路采数据因为设备配置的多样性、复杂性、标注质量不一等问题,导致数据标注的成本和复杂度极大提高;


3. 长尾场景采集难度大:采集道路安全紧要型场景、极端场景、复杂交通场景、恶劣天气状况等场景,需要长周期、大量的采集设备投入,且筛选难度较高;


4. 三维素材还原的局限性:常规的三维场景重建,无法还原真实世界中的细微细节和光线、阴影、反射等视觉效果,真实度不足。无法模拟真实世界中复杂的物理规律,例如,重力、摩擦力、空气阻力等。


深圳数据交易所与深信科创合作


为应对上述自动驾驶领域面临的巨大数据需求以及,深圳数据交易所(以下简称“深数所”)与深信科创信息技术有限公司(以下简称“深信科创”)合作,共同推出面向自动驾驶感知训练测试的合成数据仿真素材库,即“仿真障碍物模型”,并在自动泊车场景下首次实施应用,覆盖泊车场景内主要设备设施、障碍物和物理环境。


双方通过持续的素材库建设,提供高保真车辆、道路设施等三维模型以及真值,结合深信科创的OASIS SIM仿真软件、AI交通流、高精度传感器模型,实现可规模化使用的全场景素材和合成数据场景库。


图片

图1  仿真障碍物模型


全场景合成数据仿真素材库囊括常见的交通参与者、障碍物、道路设施等交通环境要素,并结合物理级的传感器仿真模型,进一步规模化生成多模态高保真精准标注的仿真素材;合成数据生成效率方面,生成效率最高可达10万帧/天,可有效节约90%以上数据采集和标注成本。在全场景合成数据仿真素材库基础上,开发人员可以持续对自动驾驶系统在海量驾驶场景下进行训练、测试和验证,提升算法迭代效能、闭环测试效率和深度。尤其是针对安全关键型场景的大批量测试,能快速帮助开发人员发现系统缺陷,加速技术和产品迭代发布。


图片

图2 自动泊车场景素材


图片

图3  多种合成数据样例


合作成果已落地


在数据安全合规、产品规划、设计、开发等领域,深数所给予深信科创全方位指导。目前仿真障碍物模型数据产品,已在深数所场内上市。同时,深信科创OASIS DATA自动驾驶数据平台数据工具也已同步在场内上市。


图片

图4 OASIS DATA自动驾驶数据平台已上线深数所


作为以建设全国性数据交易平台为目标的深数所,致力于打造“合规保障、流通支撑、供需衔接、生态发展”四大能力,以场景应用为导向,实现供需精准匹配,为深信科创提供全生态精细化服务。凭借数据交易平台资源整合的优势和捕捉分析情报的能力,深数所已在近日促成深信科创与国内某知名ADS厂商在自动驾驶泊车模型优化需求领域达成合作,针对自动泊车算法模型的训练需求,购买深信科创自动泊车场景下的仿真素材与合成数据,来优化和训练其停车系统的算法与模型,提高了其性能与可靠性。

分享到:
 
反对 0 举报 0 收藏 0 评论 0
沪ICP备11026620号