>
快捷搜索:

位列世界第一,仿真训练对于自动驾驶的意义

- 编辑:betway必威亚洲官网 -

位列世界第一,仿真训练对于自动驾驶的意义

为了能够安全可靠地行驶,自动驾驶汽车需要对它周围发生的一切有全面的了解。它们需要识别其他的乘用车、卡车、摩托车、自行车、行人、交通信号灯、道路指示牌以及其他可能出现在道路附近的物体。它们也必须在各种各样的天气和光照条件下做到这一点,这就是为什么大多数研发自动驾驶汽车的公司都在花费大量的时间和资源收集各种数据,以获得各种可能情况下的行驶经验。

9月19日,国内计算机视觉与人工智能创业企业图森互联宣布,图森互联研发的计算机视觉与深度学习算法在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得世界第一。仅KITTI数据集中,图森互联就横扫目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的全部世界第一。据悉,参加KITTI和Cityscapes评测的不乏百度、三星研究院、英伟达、UCSD、斯坦福、中科院等名企名校及科研机构。

9月19日,国内计算机视觉与人工智能创业企业图森互联宣布,图森互联研发的计算机视觉与深度学习算法在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得世界第一。仅KITTI数据集中,图森互联就横扫目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的全部世界第一。据悉,参加KITTI和Cityscapes评测的不乏百度、三星研究院、英伟达、UCSD、斯坦福、中科院等名企名校及科研机构。

图片 1

图片 2

权威的公开评测数据集是衡量算法服务商和算法团队水平的重要平台。据了解,KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、路面分割等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中多达15辆车和30个行人,还有各种程度的遮挡。

大多数情况下,这种技术依赖于人工手动对大数据进行注释,以训练机器学习算法:成百上千的工作人员盯着由行驶在道路上的实车拍摄的照片或视频,为其中出现的机动车辆和道路标识画上框,之后对其进行标注,反复而为之。不过密歇根大学的研究人员提出了一种新方法:借助仿真模拟的手段进行机器视觉算法的训练。而且他们已经证明这种方法比通过人类标注真实数据效率高得多。

权威的公开评测数据集是衡量算法服务商和算法团队水平的重要平台。据了解,KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、路面分割等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中多达15辆车和30个行人,还有各种程度的遮挡。

KITTI数据集中,目标检测包括了车辆检测、行人检测、自行车等三个单项,目标追踪包括车辆追踪、行人追踪等两个单项,道路分割包括urban unmarked、urban marked、urban multiple marked三个场景及前三个场景的平均值urban road等四个单项。图森互联横扫KITTI排行榜的这九个单项,全部位列世界第一;而此前曾有国内企业获得一两个单项的世界第一。

出于对成功的渴望,其实机器人专家对进行大量的仿真测试持谨慎态度。由于仿真测试简化了真实场景,所以你很难保证在仿真程序中能够安全运行的系统能够胜任真实环境。当涉及到物理的时候,这就可能会变得更糟糕,因为得益于当今游戏产业的高度发展,逼真的图形更容易以假乱真。最近,密歇根大学的研究人员开始着手研究是否可利用《侠盗猎车手5》的游戏画面训炼深度学习系统来识别道路物体。

KITTI数据集中,目标检测包括了车辆检测、行人检测、自行车等三个单项,目标追踪包括车辆追踪、行人追踪等两个单项,道路分割包括urban unmarked、urban marked、urban multiple marked三个场景及前三个场景的平均值urban road等四个单项。图森互联横扫KITTI排行榜的这九个单项,全部位列世界第一;而此前曾有国内企业获得一两个单项的世界第一。

Cityscapes数据集则是由奔驰主推,提供无人驾驶环境下的图像分割数据集。用于评估视觉算法在城区场景语义理解方面的性能。Cityscapes包含50个城市不同场景、不同背景、不同季节的街景,提供5000张精细标注的图像、20000张粗略标注的图像、30类标注物体。用PASCAL VOC标准的 intersection-over-union 得分来对算法性能进行评价。

图片 3从《侠盗猎车手5》中渲染的一系列用于训练目标识别的图像

Cityscapes数据集则是由奔驰主推,提供无人驾驶环境下的图像分割数据集。用于评估视觉算法在城区场景语义理解方面的性能。Cityscapes包含50个城市不同场景、不同背景、不同季节的街景,提供5000张精细标注的图像、20000张粗略标注的图像、30类标注物体。用PASCAL VOC标准的 intersection-over-union 得分来对算法性能进行评价。

除在自动驾驶评测数据集KITTI和Cityscapes上成绩全线飘红外,图森互联在人脸关键点定位的两个评测数据集 300W 和 AFLW 上,亦以压倒性优势排名世界第一。该技术主要用于驾驶员监控系统中,用于定位驾驶员面部关键点,以及时发现疲劳驾驶或违规驾驶。

本文由用车保养发布,转载请注明来源:位列世界第一,仿真训练对于自动驾驶的意义