HASH GAME - Online Skill Game GET 300
在自动驾驶领域,作为最合适的人体识别解决方案,立体视觉解决方案一直获得大量关注。它可以获取非常可靠的高精度密集深度信息。借助强大的特征提取功能,基于深度学习的端到端双目立体匹配技术能够确保那些具有弱纹理和重复纹理的对象仍然可以输出有效的高精度深度信息,从而满足智能驾驶系统在各种场景下的感测需求。此外,通过持续的数据训练,神经网络可以获得更高的准确性。这些因素使基于 CNN 的立体应用成为 ADAS/AD 的大势所趋。
该项目的目标是设计出原型系统,即:用于肝脏肿瘤分割、基于边缘计算设备的人类-AI 交互式诊断系统 (HIDE)。参赛者并未采用常规的云-客户端架构,而是将 HIDE 的主要工作流程集成到单个现场可编程门阵列 (FPGA) 电路板,即 AMD-赛灵思 Kria KV260 视觉 AI 入门套件,该套件旨在实现交互式数据与注释导入、数据存储、AI 推断和输出图像可视化等功能。为了解原型系统的其他优势,参赛者进一步估算了模型的性能与功耗。
该项目作者具有移动测绘经历,因而决定创建一个能够改进汽车与无人机等移动测绘系统的图像质量的图像修复流水线。移动测绘系统通常用于获取道路、城市与基础设施的 3D 数据。大多数移动系统通常都采用摄像头与激光扫描仪来获取 3D 数据。由于测绘系统只从一个场景获取一副图像,因此图像质量至关重要,所以该项目要创建一个能够改进图像质量的处理流水线。并且由于移动测绘的要求非常特殊,因此也需要创建一个适应移动测绘难题的更常用解决方案。
本项目开发的 VCK5000 图像修复流水线在性能 (FPS) 和功耗方面超越最先进的 GPU。除了性能分析,详细分析展示出不同训练与量化步骤如何影响卷积网络的准确性。相关分析并不局限于特定模型或网络,针对定制应用可以轻松调整所需的步骤。由 Versal VCK5000 处理的最终网络进入 paperswithcode 网站 15 强“SIDD 图像降噪”网络榜单(2022 年 3 月 30 日)。
在网络优化之后对 Versal 系统进行了详细功率分析。Versal 系统功耗与基于GPU 的推断相当。本项工作的核心是运行时间功耗与推断性能。训练与预处理的分析主要取决于训练数据集的规模(参赛者观点),其不在本项目范围内。有关代码结构的灵感来自AMD-赛灵思 Vitis-AI 教程。所需步骤全部都分配到不同的 Python 或 Shell 脚本。run_all.sh 脚本处理实现整个处理流水线 的 Deepfakes C-L-I
在本次项目中,作者基于 KV260 SoM 设计出了灵活的视频处理框架,其可以用于智慧城市智能交通运输系统 (ITS) 所使用的智能摄像头应用。该框架不但能够利用语义分割与道路标线检测网络自动检测应用场景(如:车辆或行人),而且还可以自动针对相关应用场景自动选择最佳 DNN 模型。得益于具有动态可重新配置功能与运行时间管理 API,该系统在运行时间无需停止视频流水线即可动态切换 DNN 推断模型。因此此款智能摄像头系统最终拥有真正的自适应性,而且能够以更聪慧的方式达到最高性能。