
一、技术架构与核心创新
1. 端到端大模型 Orion 框架
小米与华中科技大学联合研发的 Orion 系统,采用了视觉 - 语言指令生成动作的端到端架构,核心创新点包括:
- QT-Former 技术:通过轻量级 Transformer 模块将图像特征转换为语言模型可理解的 token,解决了高分辨率图像处理的计算瓶颈。例如,传统 VLM 处理 800 万像素图像需 H100 芯片才能实现 10Hz 帧率,而 Orion 通过压缩和特征转换,在更低算力下实现实时处理。
- LLM 与 VLM 融合:采用 META 的 Vicuna 1.5 开源模型(基于 LLaMA2),支持免费商用,通过反向传播机制将生成动作轨迹规划模块与 VLM 推理空间结合,形成单一系统而非传统的快慢双系统。
2. 硬件与传感器配置
- SU7 系列车型:
- Pro 版:纯视觉方案,搭载 11 颗高清摄像头,依赖英伟达 Orin X 芯片(单芯片算力 84 TOPS),支持高速 NOA、自动泊车等功能。
- Max 版:配备禾赛 AT128 激光雷达、5 颗毫米波雷达、12 颗超声波雷达,双 Orin X 芯片算力达 508 TOPS,支持城市 NOA。
- SU7 Ultra:2025 年 2 月发布的 Xiaomi HAD 端到端全场景智驾系统,支持从停车位到目标停车场的全程自动驾驶,涵盖自动过闸机、ETC 识别等复杂场景。
二、功能落地与测试进展
1. 已实现功能
- 高速领航:支持自动变道、匝道出入、事故车辆绕行等,实测中在高速场景下表现稳定。
- 代客泊车:最长支持 2 公里停车场路线,可泊入 5cm 精度的极窄车位,23km/h 巡航速度下完成泊车。
- 自动充电:与机械臂协同完成自动充电,解决电动车补能痛点。
2. 测试与迭代
- 用户测试:2025 年 4 月启动城市 NOA 用户测试,计划 5 月开放 10 城,8 月全国覆盖。
- 数据闭环:通过小米生态链设备(如手机、IoT 设备)收集多模态数据,结合仿真场景生成技术,日均处理超 10 亿帧图像数据。
三、合作伙伴与生态协同
1. 核心供应商
- 光庭信息:提供自动驾驶测试服务及全域全栈解决方案,通过 ASPICE CL3 认证确保车规级标准。
- 禾赛科技:供应 AT128 激光雷达,分辨率达 153 万点 / 秒,探测距离 200 米,支持夜间低反射率目标识别。
- 英伟达:Orin X 芯片提供基础算力,未来可能升级至 Thor 平台。
2. 技术协同
- 中科创达:提供智能驾驶中间件 “魔方”,提升算法迭代效率,支持多传感器融合与实时决策。
- 华中科技大学:联合研发 Orion 框架,在端到端模型训练与优化方面提供学术支持。
四、行业定位与竞争格局
1. 技术路线对比
- 华为 ADS 3.0:采用 “车路云协同 + 高精地图” 方案,在复杂路况通过效率上占优,但依赖基础设施。
- 特斯拉 FSD:纯视觉端到端方案,数据积累丰富,但在中国需适应本土化规则(如公交车道限行)。
- 小米:兼顾激光雷达与视觉融合,通过生态数据反哺算法,在泊车等垂直场景表现突出。
2. 政策与市场挑战
- 法规限制:工信部要求统一使用 “组合驾驶辅助” 术语,禁止夸大宣传,小米已调整宣传策略,强调驾驶员监管责任。
- 竞争压力:比亚迪 2025 年标配高阶智驾,华为与奥迪、问界合作形成生态联盟,小米需在 2025 年进入第一阵营以巩固地位。
五、未来规划与目标
- 短期(2025 年):完成城市 NOA 全国覆盖,推出通勤路线智能驾驶功能,支持特定路线的全场景自动驾驶。
- 中期(2026 年):实现 L3 级自动驾驶量产,推动法规与保险配套政策落地。
- 长期:构建 “车位 - 车位” 端到端智驾能力,目标 2030 年实现完全自动驾驶。
总结
小米汽车的自动驾驶技术以端到端大模型为核心,通过硬件冗余与生态数据闭环实现差异化竞争。尽管在算法成熟度和数据积累上与头部企业仍有差距,但其快速迭代能力与生态协同优势使其成为智能驾驶赛道的重要参与者。未来,小米需在法规合规、用户信任度与商业化落地方面持续突破,以在激烈的市场竞争中占据一席之地。
