钟忺

发布时间：2025-11-01

钟忺，武汉理工大学计算机与人工智能学院副院长，教授、博士生导师，青年教学名师，国家级一流本科课程《数据结构》负责人。曾在华中科技大学(师从卢炎生教授)、北京大学(师从黄铁军教授)及新加坡南洋理工大学(师从Alex C. Kot教授)开展博士、博士后及访问研究，长期从事开放场景多模态智能感知与决策方法研究。在国内外重要期刊会议发表论文100余篇，其中在CCF-A类及中科院一区等顶级期刊会议发表40余篇;授权发明专利20余项。担任IEEE TCSVT、TVC、计算机工程等期刊编委，以及IJCAI、ICASSP、ICME、ICMR等国际会议领域主席。兼任CSIG科普与教育工委会秘书、交通视频专委会秘书、类脑视觉专委会委员，CCF多媒体技术专委会执行委员、智慧交通分会执行委员，CSF视觉计算与仿真专委会委员，湖北省计算机学会监事、武汉计算机软件工程学会理事。主持或参与国家重点研发计划、国家自然科学基金面上项目、湖北省重点研发计划等科研项目。相关成果获湖北省教学成果特等奖/一等奖4项、湖北省科学技术一等奖1项、三等奖3项、CCF计算机应用创新技术一等奖，并获得IEEE ICME真实雨场景挑战赛冠军2项、IEEE CASS Best Paper Award Nomination、ACM MM Workshop Best Student Paper Award Runner-up等学术奖励。
一、基本信息
出生年月 1985年7月
职称教授
最高学位博士
主要研究方向 1. 人工智能 2. 多媒体信息处理 3. 类脑视觉 4. 智能交通 5. 智慧水利 6. 智能金融 7. 科学智能
导师类别学博、专博、学硕、专硕
工作单位武汉理工大学
邮箱 zhongx@whut.edu.cn
二、教育及工作经历
1. 2003至2007，武汉大学，计算机学院，本科
2. 2007至2009，华中科技大学，计算机科学与技术学院，硕士，导师:卢炎生教授
3. 2009至2013，华中科技大学，计算机科学与技术学院，博士，导师:卢炎生教授
4. 2014至2015，武汉理工大学，计算机科学与技术学院，讲师
5. 2014至2017，武汉理工大学，光纤传感技术国家工程实验室，博士后，合作导师:姜德生院士
6. 2015至2022，武汉理工大学，计算机与人工智能学院(原计算机科学与技术学院)，副教授
7. 2021至2022，北京大学，多媒体信息处理全国重点实验室，访问学者，合作导师:黄铁军教授
8. 2022至今，武汉理工大学，计算机与人工智能学院，教授
9. 2022至2023，武汉理工大学，信息化办公室，副主任
10. 2023至今，武汉理工大学，水路交通控制全国重点实验室，研究员
11. 2024，南洋理工大学，博云搜索实验室(ROSE@EEE)，访问学者，合作导师:Alex Chichung Kot院士
12. 2024至今，武汉理工大学，计算机与人工智能学院，副院长
三、奖励情况
1. 第三批国家级一流本科课程，数据结构，课程负责人，2025
2. 需求牵引、分类多元、数字赋能的研究生培养模式改革研究与实践，湖北省高等学校研究生教学成果特等奖，2025
3. 全链条数据驱动的程序设计课程智慧教学体系，湖北省高等学校本科教学成果一等奖，2025
4. 产教研深度融合的计算机类新工科人才培养模式创新与实践，湖北省高等学校教学成果一等奖，2023
5. 多维协同的计算机类专业人才实践与创新能力培养体系的构建与实践，湖北省高等学校教学成果一等奖，2018
6. 云计算环境下敏感数据防泄漏方法与系统，湖北省科技进步一等奖，2012
7. 城市公路隧道智能监控关键技术及应用，湖北省科技进步三等奖，2024
8. 织造设备监管一体化关键技术及应用，湖北省科技进步三等奖，2013
9. Web信息检索方法及优化技术，湖北省技术发明三等奖，2012
四、近期主持的科研项目
1. 国家自然科学基金面上项目，面向空天地复杂场景的船舶重识别关键技术研究，2023至2026
2. 湖北省科技计划重点研发专项，开放环境水域生态智能监测关键技术研究，2024至2027
五、近期代表性学术成果
1. 代表性论文:
[1] Spiking Cross-Modal Hashing for Energy-Efficient Retrieval, IEEE TMM, 2026
[2] SU-YOLO: Spiking Neural Network for Efficient Underwater Object Detection, Neurocomputing, 2025
[3] Brain-Inspired Multimodal Spiking Neural Network for Image-Text Retrieval, CVPR, 2026
[4] STAA-SNN: Spatial-Temporal Attention Aggregator for Spiking Neural Networks, CVPR, 2025
[5] SOTA: Spike-Navigated Optimal Transport Saliency Region Detection, IJCAI, 2025
[6] Towards Low-Latency Event-Based Visual Recognition with Hybrid Step-Wise Distillation Spiking Neural Networks, ACM MM, 2024
[7] Uncertainty-Aware with Adaptive Geometric Correction for Multi-Modal Land Cover Classification, IEEE TGRS, 2025
[8] PAD: Phase-Amplitude Decoupling Fusion for Multimodal Land Cover Classification, IEEE TGRS, 2025
[9] Local-Global Sparse Transformer for Road Extraction, IEEE TGRS, 2025
[10] MFAE-YOLO: Multi-feature Attention-Enhanced Detector for Remote Sensing, IEEE TGRS, 2025
[11] Sparse Mixture of Mambas for Domain Generalized Atomic Electron Tomography Augmentation, IEEE TNNLS, 2025
[12] Ensemble Cross U-Net Transformers for Augmentation of Atomic Electron Tomography, IEEE TIM, 2024
[13] DAWN: Direction-aware Attention Wavelet Network for Image Deraining, ACM MM, 2023
[14] Rainy WCity: A Real Rainfall Dataset with Diverse Conditions for Semantic Driving Scene Understanding, IJCAI, 2022
[15] Dual-Recommendation Disentanglement Network for View Fuzz in Action Recognition, IEEE TIP, 2023
[16] Motion-Consistent Representation Learning for UAV-Based Action Recognition, IEEE TITS, 2025
[17] Converting Artificial Neural Networks to Ultralow-Latency Spiking Neural Networks for Action Recognition, IEEE TCDS, 2024
[18] From Temporal Thumbnail to Semantics: Debiasing Multi-View Action Recognition, PR, 2026
[19] AM40: Enhancing Action Recognition through Matting-Driven Interaction Analysis, PR, 2026
[20] Dynamic and Static Mutual Fitting for Action Recognition, PR, 2025
[21] Beyond the Horizon: Decoupling Multi-View UAV Action Recognition via Partial Order Transfer, AAAI, 2026
[22] Anomize: Better Open Vocabulary Video Anomaly Detection, CVPR, 2025
[23] Pixel-refocused Navigated Tri-margin for Semi-supervised Action Detection, ACM MM, 2024
[24] Visual Exposes You: Pedestrian Trajectory Prediction Meets Visual Intention, IEEE TITS, 2023
[25] Beyond the Individual: Introducing Group Intention Forecasting with SHOT Dataset, ACM MM, 2025
[26] SegTraj: Segmented-Trajectory-Aware Spatio-TemporalGCN for Social Group Detection, ACM MM, 2025
[27] Win-Win by Competition: Auxiliary-Free Cloth-Changing Re-Identification, IEEE TIP, 2023
[28] Complementary Data Augmentation for Cloth-Changing Person Re-Identification, IEEE TIP, 2022
[29] Grayscale Enhancement Colorization Network for Visible-Infrared Person Re-Identification, IEEE TCSVT, 2022
[30] See What You Seek: Semantic Contextual Integration for Cloth-Changing Person Re-Identification, PR, 2026
[31] ICLR: Instance Credibility-Based Label Refinement for Label-Noisy Re-Identification, PR, 2024
[32] Beyond the Parts: Learning Coarse-to-Fine Adaptive Alignment Representation for Person Search, ACM TOMM, 2023
[33] Good is Bad: Causality Inspired Cloth-Debiasing for Cloth-Changing Re-Identification, CVPR, 2023
[34] Unsupervised Vehicle Search in the Wild: A New Benchmark, ACM MM, 2021
[35] RegenTrack: Distance-Adaptive Regeneration Pool Matching for Drone-Based Crowd Tracking, IEEE TCSVT, 2026
[36] DenseTrack: Drone-Based Crowd Tracking via Density-Aware Motion-Appearance Synergy, ACM MM, 2024
[37] Multi-Granularity Distribution Alignment for Cross-Domain Crowd Counting, IEEE TIP, 2025
[38] Find Gold in Sand: Fine-Grained Similarity Mining for Domain-Adaptive Crowd Counting, IEEE TMM, 2024
[39] DAOT: Domain-Agnostically Aligned Optimal Transport for Domain-Adaptive Crowd Counting, ACM MM, 2023
[40] Fine-Grained Fragment Diffusion for Cross Domain Crowd Counting, ACM MM, 2022
[41] Zero-Shot Object Counting with Good Exemplars, ECCV, 2024
[42] Agent Trading Arena: Numerical Understanding in LLM-Based Agents, EMNLP, 2025
[43] Refined Generation-Based Framework for Consistent and Reliable Visual Question Answering, PR, 2026
[44] ETV-Attack: Efficient Text-Driven Visual-Variable Adversarial Attacks on VQA with Pre-trained Language Models, PR, 2026
[45] Concise Object-word Visuals as Effective Cues for Visual Question Answering, ACM TOMM, 2026
[46] TCP: Text-Guided Cascade Network for Pedestrian Crossing Intention Prediction, IEEE TITS, 2025
[47] Fine-Grained Lexical-Centric Semantic Network for Coherent Video Paragraph Captioning, IEEE TMM, 2026
[48] Ask and Focus More: Question-Prompt Uncertainty Allocation for Dual-Controllable Video Captioning, PR, 2026
[49] Action-aware Linguistic Skeleton Optimization Network for Non-Autoregressive Video Captioning, ACM TOMM, 2024
[50] StoryLLaVA: Enhancing Visual Storytelling with Multi-Modal Large Language Models, COLING, 2025
[51] Refined Semantic Enhancement towards Frequency Diffusion for Video Captioning, AAAI, 2023
[52] Graph Complemented Latent Representation for Few-Shot Classification, IEEE TMM, 2023
2. 代表性发明专利:
(1)一种雾环境均匀性判别方法及系统，2026，ZL202511998898.0
(2)一种复杂环境下的图像去雾方法，2026，ZL202610020505.7
(3)基于文本引导的级联网络行人过街意图预测方法及系统，2026，ZL202511406677.X
(4)基于脉冲融合的跨模态图文检索方法及装置，2025，ZL202511148012.3
(5)一种短时紧凑联级的轻量化结构裂隙分割方法，2025，ZL202310661258.5
(6)一种频率解耦的多天气场景裂缝识别方法及系统，2025，ZL202510586720.9
(7)基于多维用户体验数据分析的汽车产品交互设计系统，2025，ZL202411739415.0
(8)一种跨空间协同学习轻量级海岸堤坝裂缝分割方法，2025，ZL202510007771.1
(9)细粒度结合特征相似度检索的跨域人群计数方法及系统，2024，ZL202210555319.5
(10)基于信任风险分配令牌的识别方法、系统及电子设备，2024，ZL202210555319.5
(11)一种基于动作感知的视频描述方法及系统，2024，ZL202410262500.6
(12)基于大语言模型的幂等机制生成教育文本摘要方法，2024，ZL202410332199.1
(13)一种面向医疗视频中区域遮挡的医护行为识别方法，2024，ZL202410165468.X
(14)基于着色的红外视频行为识别方法、系统和电子设备，2024，ZL202311101311.2
(15)基于标签增量精炼和对称评分的目标重识别方法及系统，2024，ZL202311134901.5
(16)一种基于3D脉冲神经网络的行为识别方法、系统及装置，2023，ZL202311286299.7
(17)基于视角和行为解耦的多视角行为识别方法及系统，2023，ZL202311149653.1
(18)基于时空约束模型优化的车辆重识别方法，2023，ZL201911012487.4
(19)一种基于背景弱化及一致性计算的半监督动作检测方法，2023，ZL202310898874.2
(20)一种面向水域场景的双分布匹配多域适应分割方法与系统，2023，ZL202310723846.7
(21)一种基于Haar-like特征及CNN匹配的视频运动目标识别方法，2023，ZL201910820113.9
(22)一种基于联合概率域适应的跨项目软件老化缺陷预测方法，2022，ZL202011476590.7
(23)一种基于API管理与虚拟化的面向服务平台及控制方法，2019，ZL201610130235.1
(24)一种基于马尔科夫过程的药检云计算安全状态评价方法，2019，ZL201510791524.1
(25)一种基于离散动态贝叶斯网络的气象威胁评估方法，2018，ZL201510790481.5
3. 代表性标准:
(1)城市隧道监控系统技术规范，湖北省重点地方标准，2023