孔璟黎
在数字技术深度渗透各行各业的今天,人工智能的爆发式发展、海量数据的实时处理、复杂系统的高效运转,都对底层软件的效能提出了前所未有的严苛要求。当算力资源成为制约创新的瓶颈,如何通过算法优化、架构重建让有限算力释放最大价值,已成为全球科技竞争的核心命题。
在这场关乎技术突破与产业升级的攻坚中,华南理工大学学者汤德佑,以“双轨突破”的硬核实力,成为数据库与软件工程领域当之无愧的创新标杆。作为 CCF 高级会员、数据库专业委员会执行委员、广东省计算机学会数据库专委会秘书长,他以超前行业意识预判技术趋势,为企业纾困增效,用一系列理论与工程创新成果,为数字经济筑牢技术根基,彰显中国顶尖科技人才的全球竞争力。
数据基因革命:超前创新理念的开创者
在数字经济与科技创新深度交织的时代,身为广东省科技厅重大专项负责人的他,以超前的理念和颠覆性技术突破,成为产学研融合的先锋人物。他带领团队打造的智能平台,不仅重塑了科技资源配置逻辑,更以“区块链式”数据治理思想,为全球科研管理体系升级提供了新的方案。
汤德佑在科研工作中淋漓尽致地展现了极具前瞻性的创新意识。二十年前,他敏锐地意识到数据的防伪和保护,必须通过“基因链”架构来破解,遂提出“数据基因”全新思想,构建解决数据一致性与可追溯性的模型,这与后来出现的区块链技术核心逻辑非常相似。该思想为他后续创立“科技词条”模型,构建科研实体(专家、论文、机构)的 “基因图谱”,以及在科研诚信管理、成果溯源等领域应用奠定了理论基础。
十多年来,汤德佑带领团队攻克 “从非结构化文本中精准提取语义单元” 的技术难关,开发出系列核心工具:科研论文的科技词条抽取方法(专利号:CN201811215918.2)与科技专家的科技词条抽取方法(专利号:CN201810021753.0),首次实现从科技文献中自动提炼关键科技语义。他研发的科技新词发现系统(软著登字第 1635116 号),比全国科学技术名词审定委员会的“术语在线”平台2.0版本新增类似功能早5年。2024年10月,第四届全国计算机科学技术名词审定委员会正式将科技术语标准化纳入战略规划,“科技词条”模型为此进程提供了技术原型。此外,他构建的智能化科研管理体系:单任务 / 批量任务专家自动遴选方法(专利号:ZL201910253367.7/ZL202010013120.0)彻底改变了传统科研项目评审模式,通过实时分析专家的“数据基因”与项目需求的匹配度,完成跨领域专家推荐,效率倍增。论文推荐系统(软著登字第 9041291 号)实现科研成果的“技术基因”标签化管理和科技服务平台的精准匹配功能,推动科技资源配置效率显著提升。汤德佑的该系列技术成果已形成完整的知识产权壁垒,覆盖科技资源全生命周期的智能平台。他的工作不仅为广东省智慧科技服务平台提供了关键技术支撑,更在理念和技术层面,为行业探索数据驱动的智能化管理贡献了宝贵的智慧。
代码赋能多域创新:软件优化领域的跨学科突破
在高性能计算与多学科交叉的创新版图中,汤德佑以代码优化为核心驱动力,打破“软件优化仅服务于单一领域”的局限,在生物信息、地理信息、工程优化、神经网络计算、数据库基础算法等多个领域构建起“算法创新—软件落地—产业应用”的完整闭环,彰显中国学者在基础软件领域从“跟跑”到“拓荒”的原创能力。
在生命科学领域,分析海量基因组数据是一项极具挑战的任务。传统工具时常面临内存占用大、运行速度慢、效率低的问题。汤德佑开发的KCOSS、ScalableAligner等软件,使用创新的数据结构,结合逻辑、多线程、指令、IO等优化,显著提升了DNA计算效率。如KCOSS使用“合并存储”策略,利用DNA片段之间的重叠特性构建“重叠序列集”(C-read),极大提升了存储效率,最多可节省94%的内存空间;设计“无锁分工”模型解决多线程间的资源竞争,让工具“挑得多还跑得快”。KCOSS在处理人类基因组(约30亿碱基)时仅需15GB内存,相当于传统工具Jellyfish2的1/5;62线程并行处理人类基因组数据仅需86秒,分别为KMC3和CHTKC的1/3和1/5。该研究成果2023年发表于生物信息学顶级期刊《Bioinformatics》,并被选为“应用笔记”年度亮点论文,标志着其技术获得国际学术界高度认可。据其开源项目数据,KCOSS已被全球数十个科研机构采用,包括华大基因、美国得州大学等,广泛应用于癌症、遗传病等研究领域。另外,他设计的蛋白质二级结构预测并行软件可将蛋白质结构预测效率提升2.5倍,生物序列比对的并行软件适配大规模基因组比对场景,弥补了传统工具在多线程适配中的效率短板。
不止于生物信息,他将高性能计算的优化逻辑延伸至更广泛的场景,开发了多款高效的行业软件。他开发的降水分布并行计算软件将区域降水模拟效率提升40%,为气象灾害预警、水文资源评估缓解算力矛盾;流域地形并行分析软件可快速处理百万级网格的流域地形分析,适配大型水利工程规划需求。此外,他研发的大型钢结构优化软件,在保证精度提高的前提下,将钢结构力学性能优化周期从数天缩短至小时级。这类效能极大提升的工程优化软件为企业节省了大量成本。
理论研究与硬件适配的深度结合,是其软件优化能力的另一核心支撑。他在 Knights Landing(KNL)异构计算平台的系列研究中,提出“硬件无关—硬件感知”双层优化策略,使 Hash-join 吞吐量提升1.8倍;他提出的计算分片策略突破神经网络训练的并行瓶颈,通过梯度计算任务的精细拆分与缓存优化,将BP神经网络训练速度提升3倍,为AI与高性能计算的融合提供底层算法参考。
从“数据基因”理念前瞻性提出,到多领域高性能计算软件的持续迭代,汤德佑始终以“创新为源、应用为本”为科研和工程领域持续赋能。他以原创性技术为突破,推动“实用型科研工具”从“满足需求”向“引领需求”跨越,展现了中国科学家在交叉学科融合应用软件工程优化的硬核实力。汤德佑对技术本质的执着追求,不仅让他的程序成为效率的代名词,更重新定义了“优秀软件”的标准。未来,这位数据库与软件工程领域的双料领军者,必将继续以代码为笔、以创新为墨,在全球数字建设的蓝图上书写更多精彩篇章。