■ 万宇晨
在全球人工智能技术竞争日益激烈的2025年,李逸斌已成为AI模型推理优化和部署领域的重要力量。这位伯克利毕业的工程师,现任NVIDIA高级软件工程师,不仅在学术研究上屡有建树,更在全球AI基础设施建设的关键项目中发挥着核心作用。
李逸斌在NVIDIA的核心工作是开发前沿机器学习编译器库,革新深度学习网络和大型语言模型的推理性能。他将DeepSeek R1模型集成到TensorRT-LLM的FP4环境中,在Blackwell GPU上实现了比原版高出两倍的性能,这一突破对AI基础设施发展意义重大。他重新设计的TensorRT-LLM性能测试工具包将测试时间大幅减少,在行业内得到了广泛使用并且树立了新标准。
在NVIDIA的另一项重要贡献是在TensorRT中结合了SmoothQuant算法并导出各种量化模型进行性能研究,为高效、节能的AI推理铺平了道路。他在TensorRT-LLM中设计的架构大幅提升了LLM服务场景性能,对推动大型语言模型在生产环境中的应用发挥了关键作用。
早在Waymo实习期间,李逸斌开发的端到端3D激光雷达与2D相机关联方案将手动关联工作减少90%,在数百个场景测试中实现了极高准确度,为自动驾驶技术发展做出了贡献。
作为伯克利人工智能研究实验室(BAIR)的研究员,李逸斌在计算机深度学习和机器人领域发表了重要论文。他与团队在《Applied Sciences》上发表的研究探讨了可穿戴技术与深度学习模型在预测职业物理活动中的应用。而在IRIACV 2023发表的《3D joist perception, detection, and climbing for hexapod robots》则为六足机器人在复杂环境中的感知和运动规划提供了创新方法。
同时,他还积极参与科技活动。李逸斌近期受邀担任NVIDIA GTC大会的评审专家,参加评审了同行的工作,这一全球顶级技术大会汇聚了AI和高性能计算领域的精英。GTC大会上分享了他作出贡献的LLM优化技术和量化方法受到广泛关注,彰显了他在NVIDIA和整个AI社区中的重要影响力。
在当前AI技术浪潮背景下,李逸斌在NVIDIA的工作创造了巨大的经济价值。他对DeepSeek R1等前沿大模型的优化,不仅提升了性能,更降低了部署成本。随着开源大模型逐渐成为行业趋势,NVIDIA的AI加速技术对于应用落地变得愈发重要,而李逸斌正是这一关键领域的核心贡献者。
作为连接学术研究与产业应用的桥梁,李逸斌在NVIDIA的工作不仅推动了AI技术进步,更为AI在国家关键基础设施中的应用开辟了新可能,为AI持续发展以及落地贡献了一份力量。