胡瑞敏
美高梅4688集团am 人工智能系 国家多媒体软件工程技术研究中心 教授 (博导,硕导)
姓名: 胡瑞敏
主页: 武昌区
性别: 男
职称: 教授 (博导,硕导)
学历学位: 博士
电话: 68754877
办公地点: 美高梅4688集团am本科生院6楼
E-mail: hrm1964 ▇ 163.com 请手工替换符号
领域: 大数据挖掘管理与分析,多媒体技术与大数据分析,多媒体信号处理,计算机应用,模式识别,人工智能,数据挖掘与分析,网络安全,音视频处理,云计算与大数据处理
招生信息: 年度招收硕士5名,招收方向:计算机科学与技术(学硕),通信与信息工程(学硕)。 招收博士4名,招收方向:计算机科学与技术,通信与信息系统。
|
研究方向
胡瑞敏,珞珈杰出学者,二级教授,第七届中国青年科技奖和第五届中国青年科技创新奖获得者。历任美高梅4688集团am学术委员会副主任委员、国家网络安全学院首任执行院长,美高梅4688集团am院长,国务院政府特殊津贴获得者,IEEE高级会员,中国通信学会会士,中国计算机学会杰出会员,国家网络空间安全2030重大专项专家组成员、国家先进音视频标准专家组音频组执行主席。担任国家重点研发计划(在研)和重大科技专项(已结题)首席专家,曾任海康威视公司第一任研究院院长、TCL公司技术顾问、美亚柏科研究所首席科学家,和华为、科大讯飞等公司长期合作。先后主持四项多媒体大数据信息处理和网络空间自然行为与社会理解领域国家自然科学基金重点项目,指导研究生获互联网+金奖、智慧城市大赛特等奖、移动终端大赛一等奖、CCF优秀博士论文奖、ACM中国优秀博士论文和中国图形图像学会优秀博士论文提名奖。
近年来开展包括多媒体信息处理、人工智能、大数据分析和自然行为与社会理解等技术在内的交叉学科研究,重点专注网络空间社会安全感知计算(可信身份计算、隐秘组织发现、复杂关系分析、行为模式挖掘)等大数据自然社会理解的理论与方法研究,空间海量视频编码与信息智能处理,16年在美国NIST举办的国际视频大数据分析领域最著名的Trecvid实例竞赛中取得30项全球第一的优异成绩。
团队欢迎每一个有梦想的学子,只要你擅长数学,擅长计算机,动手能力强,对科研感兴趣,有坚定的信念。欢迎每一位优秀营员,推免生,意向升学硕士,意向升学博士优秀的同学加入团队咨询群: 1146746703,乔学长qq:1024428310。
教育背景
1984.07 南京邮电学院 , 工学学士
1990.07 南京邮电学院 , 工学硕士
1994.07 华中理工大学, 工学博士
1994年-1996年在测绘遥感信息工程国家重点实验室从事博士后研究
工作经验
1994-1996年 武汉测绘科技大学(现美高梅4688集团am) 博士后
1996-2000年 武汉测绘大学信息工程学院 副院长
1996-2000年 美高梅4688集团am多媒体网络通信工程研究所 所长
2000-2012年 美高梅4688集团am 副院长
2001-2019年 多媒体网络通信工程湖北省重点实验室 主任
2005-2019年 国家多媒体软件工程技术研究中心 主任
2010-2016年 海康威视公司 首席科学家,研究院院长
2013-2018年 美高梅4688集团am 院长
1996-至今 美高梅4688集团am 教授
教授课程
多媒体技术及应用;数字信号处理
发表论文
Selected papers
2021
Danni. Xu, R.M. Hu, Z.X. Xiong, Z. Wang , et al. Trajectory is not Enough: Hidden Follower Detection,ACM Multimedia 2021. (CCF A会 accept)
Li X, Hu R, Wang Z, et al. Location Prediction via Bi-direction Speculation and Dual-level Association[J]. arXiv preprint arXiv:2106.15070, 2021.(CCF A会 accept)
Chenhao Hu, Ruimin Hu, Xiaochen Wang, Yulin Wu, Spatial Audio Object Coding Based on Time-Frequency Shifting and Scheduling, July 2021, Conference: 2021 IEEE International
Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428297 (CCF B oral)
Chenhao Hu, Ruimin Hu, Xiaochen Wang, Yulin Wu, Efficient Multi-Step Audio Object Coding with Limited Residual Information, July 2021, Conference: 2021 IEEE International Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428471 (CCF B oral)
Wenxin Huang, Dongyang Li, Ruimin Hu, Chao Liang, Person Retrieval in Physical World, July 2021, Conference: 2021 IEEE International Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428411 (CCF B)
Yulin Wu, Ruimin Hu, Chenhao Hu, Shanfa Ke, Low Bitrates Audio Object Coding Using Convolutional Auto-Encoder and Densenet Mixture Model, July 2021, Conference: 2021 IEEE
International Conference on Multimedia and Expo (ICME), DOI:10.1109/ICME51207.2021.9428227 (CCF B oral)
Gang Li, Xiaochen Wang, Ruimin Hu, Huyin Zhang, Intelligibility Enhancement via Normal-to-Lombard Speech Conversion with Long Short-Term Memory Network and Bayesian
Gaussian Mixture Model, March 2021IEEE Transactions on Multimedia PP(99):1-1, DOI:10.1109/TMM.2021.3068565 (CCF B SCI 2区)
Wenqian Zhu, Zhongyuan Wang, Ruimin Hu, Dengshi Li, From Semantic to Spatial Awareness: Vehicle Re-Identification with Multiple Attention Mechanisms, January 2021IEEE Multimedia PP(99):1-1,DOI:10.1109/MMUL.2021.3052897 (SCI 2)
2020
Li G , Hu R , Zhang R , et al. A mapping model of spectral tilt in normal-to-Lombard speech conversion for intelligibility enhancement[J]. Multimedia Tools and Applications, 2020:1-21. (SCI,EI,中国计算机学会C类期刊)
Li D , Hu R , Huang W , et al. HMM-Based Person Re-identification in Large-Scale Open Scenario[M]// MultiMedia Modeling. 2020.
Hu C , Hu R , Wang X , et al. Multi-step Coding Structure of Spatial Audio Object Coding[M]// MultiMedia Modeling. 2020.
Chen, Wei & Hu, Ruimin & Wang, Xiaochen & Li, Dengshi. (2020). HRTF Representation with Convolutional Auto-encoder. MultiMedia Modeling, 605-616.
Li D, Hu R, Wang X, et al. Loudspeaker triplet selection based on low distortion within head for multichannel conversion of smart 3D home theater[J]. Concurrency and Computation: Practice and Experience, 2020, 32(13): e4796.
胡瑞敏,张亚浩,李登实,王晓晨,王超.基于逐阶共识计算的虚假物理身份属性检测方法[J].美高梅4688集团am学报(理学版),2020,66(02):103-110.
2013-2019
Wu T , Hu R , Wang X , et al. Audio object coding based on optimal parameter frequency resolution[J]. Multimedia Tools and Applications, 2019, 78(15):20723-20738. (SCI,EI,中国计算机学会C类期刊)
Zhu W, Hu R, Wang Z, et al. Deep Structural Feature Learning: Re-Identification of simailar vehicles In Structure-Aware Map Space.[C]. acm multimedia, 2019. (EI,中国计算机学会A类会议)
Wang X, Hu R, Wang Z, et al. Long Term Background Reference Based Satellite Video Coding[C]. international conference on acoustics speech and signal processing, 2019: 1822-1826. (EI,中国计算机学会B类会议 )
Chen Y, Hu R, Xiao J, et al. Multisource Surveillance Video Coding by Exploiting 3D and 2D Knolwedge[C]. international conference on acoustics speech and signal processing, 2019: 1787-1791.(EI,中国计算机学会B类会议 )
Chen Y, Hu R, Xiao J, et al. Multisource surveillance video coding with synthetic reference frame[J]. Journal of Visual Communication and Image Representation, 2019. (EI,中国计算机学会B类期刊 )
Chen Y, Hu R Xiao J, et al. Multisource surveillance video data coding with hierarchical knowledge library[J]. Multimedia Tools and Applications, 2019, 78(11): 14705-14731. (SCI,EI,中国计算机学会C类期刊)
Ke S, Hu R, Li G, et al. Multi-speakers Speech Separation Based on Modified Attractor Points Estimation and GMM Clustering[C]. international conference on multimedia and expo, 2019: 1414-1419. (EI,中国计算机学会B类会议)
Xu Z , Hu R, Chen J , et al. Semisupervised Discriminant Multimanifold Analysis for Action Recognition[J]. IEEE Transactions on Neural Networks and Learning Systems, 2019:1-12. (EI,中国计算机学会B类期刊)
Zhang R, Hu R, Li G, et al. Spectral Tilt Estimation for Speech Intelligibility Enhancement Using RNN Based on All-Pole Model[C]. conference on multimedia modeling, 2019: 144-156.
Lu S, Hu R, Liu J, et al. Structure Preserving Convolutional Attention for Image Captioning[J]. Applied Sciences, 2019, 9(14).
Zhang M, Hu R, Jiang L, et al. Three‐dimensional sound reproduction in vehicle based on data mining technique[J]. Concurrency and Computation: Practice and Experience, 2019, 31(4).
Li Q, Hu R,, Chen Y, et al. Vehicle Pose Estimation Using Mask Matching[C]. international conference on acoustics speech and signal processing, 2019: 1972-1976. (EI,中国计算机学会B类会议 )
Li G, Hu R,, Wang X, et al. A near-end listening enhancement system by RNN-based noise cancellation and speech modification[J]. Multimedia Tools and Applications, 2019, 78(11): 15483-15505. (SCI,EI,中国计算机学会C类期刊)
Ding X, Hu R,, Han Z, et al. A novel frontal facial synthesis algorithm based on individual residual face[C]//International Conference on Multimedia Modeling. Springer, Cham, 2018: 14-22. (EI)
Liao L, Hu R,, Xiao J, et al. Edge-aware context encoder for image inpainting[C]//2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018: 3156-3160. (EI)
Li C, Hu R,, Liang C, et al. Faster seam carving for video retargeting[C]//2018 25th IEEE International Conference on Image Processing (ICIP). IEEE, 2018: 823-827. (EI,中国计算机学会C类会议)
Wang X, Hu R,, Xiao J. Frame Rate Conversion Based High Efficient Compression Method for Video Satellite[C]//Pacific Rim Conference on Multimedia. Springer, Cham, 2018: 35-44. (EI,中国计算机学会C类会议)
Chen W, Hu R,, Wang X, et al. Individualization of head related impulse responses using division analysis[J]. China Communications, 2018, 15(5): 92-103.(SCI)
Huang Z, Hu R,, Thierry B, et al. Multi-feature fusion based background subtraction for video sequences with strong background changes[C]//2017 IEEE International Conference on Image Processing (ICIP). IEEE, 2017: 3370-3374.
Wang Z, Hu R,, Chen C, et al. Person reidentification via discrepancy matrix and matrix metric[J]. IEEE transactions on cybernetics, 2017, 48(10): 3006-3020. (中国计算机学会B类期刊 高引用)
Wang Z, Hu R, Yu Y, et al. Statistical Inference of Gaussian-Laplace Distribution for Person Verification[C]. acm multimedia, 2017: 1609-1617. (EI,中国计算机学会A类会议)
Jing X Y , Zhu X , Wu F , et al. Super-Resolution Person Re-Identification With Semi-Coupled Low-Rank Discriminant Dictionary Learning[J]. IEEE Transactions on Image Processing, 2017, 26(3):1363-1378. (SCI, 中国计算机学会A类期刊)
Wu T, Hu R, Wang X, et al. High quality audio object coding framework based on non-negative matrix factorization[J]. China Communications, 2017, 14(9): 32-41.
Jiang J, Hu R, Wang Z, et al. Facial Image Hallucination Through Coupled-Layer Neighbor Embedding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(9): 1674-1684.
Wang Z, Hu R, Yu Y, et al. Taichi distance for person re-identification[C]. international conference on acoustics, speech, and signal processing, 2017: 2052-2056. (EI,中国计算机学会C类会议)
Li Q, Hu R, Chen Y, et al. A Fine-Grained Filtered Viewpoint Informed Keypoint Prediction from 2D Images[C]. pacific rim conference on multimedia, 2017: 172-181.
Wang S, Hu R, Chen S, et al. 3D Sound Field Reproduction at Non Central Point for NHK 22.2 System[C]. conference on multimedia modeling, 2017: 3-14.
Huang W, Hu R, Liang C, et al. Structural superpixel descriptor for visual tracking[C]. international joint conference on neural network, 2017: 3146-3152.
Chen L, Hu R, Han Z, et al. A joint learning based Face Super Resolution approach via contextual topological structure[C]. international conference on acoustics, speech, and signal processing, 2017: 1088-1092. (EI,中国计算机学会C类会议)
Wang S, Hu R, Chen S, et al. Sound physical property matching between non central listening point and central listening point for NHK 22.2 system reproduction[C]. international conference on acoustics, speech, and signal processing, 2017: 436-440. (EI,中国计算机学会C类会议)
Hu R, Bao C, Zhao Q, et al. Recent development of speech and audio signal processing in network communication[J]. China Communications, 2017, 14(9).
Huang K, Hu R, Jiang J, et al. HRM graph constrained dictionary learning for face image super-resolution[J]. Multimedia Tools and Applications, 2017, 76(2): 3139-3162. (SCI,EI,中国计算机学会C类期刊)
Chen L, Hu R, Han Z, et al. Face super resolution based on parent patch prior for VLQ scenarios[J]. Multimedia Tools and Applications, 2017, 76(7): 10231-10254. (SCI,EI,中国计算机学会C类期刊)
Chen H, Chen J, Hu R, et al. Action recognition with temporal scale-invariant deep learning framework[J]. China Communications, 2017, 14(2): 163-172.
Chen L, Hu R, Liang C, et al. A novel face super resolution approach for noisy images using contour feature and standard deviation prior[J]. Multimedia Tools and Applications, 2017, 76(2): 2467-2493. (SCI,EI,中国计算机学会C类期刊)
Wang Z, Hu R, Yu Y, et al. Scale-adaptive low-resolution person re-identification via learning a discriminating surface[C]. international joint conference on artificial intelligence, 2016: 2669-2675. (EI,中国计算机学会A类会议)
Wu F, Jing X, You X, et al. Multi-view low-rank dictionary learning for image classification[J]. Pattern Recognition, 2016: 143-154. (EI,中国计算机学会B类期刊)
Ruan W , Chen J , Wang J , et al. Boosted local classifiers for visual tracking[C]// IEEE International Conference on Multimedia & Expo. IEEE Computer Society, 2016. (EI,中国计算机学会B类会议)
Gao L , Hu R , Wang X , et al. JND-based spatial parameter quantization of multichannel audio signals[J]. Eurasip Journal on Audio Speech & Music Processing, 2016, 2016(1).(A刊)
Xiao J, Hu R, Liao L, et al. Knowledge-Based Coding of Objects for Multisource Surveillance Video Data[J]. IEEE Transactions on Multimedia, 2016, 18(9): 1691-1706.
Xiong M, Chen J, Wang Z, et al. Person Re-Identification via Multiple Coarse-to-Fine Deep Metrics.[C]. european conference on artificial intelligence, 2016: 355-362. (EI,中国计算机学会B类会议)
Li D, Hu R, Wang X, et al. Multichannel reduction based on sound field within two ears[C]. international conference on multimedia and expo, 2016: 1-6. (EI,中国计算机学会B类会议)
Liao L, Hu R, Xiao J, et al. An Analysis-Oriented ROI Based Coding Approach on Surveillance Video Data[C]. pacific rim conference on multimedia, 2016: 428-438.
Lin J, Ruimin H, Xiaochen W, et al. Audio Bandwidth Extension Using Audio Super-Resolution[C]. pacific rim conference on multimedia, 2016: 540-549.
Wu T, Hu R, Gao L, et al. Analysis and Comparison of Inter-Channel Level Difference and Interaural Level Difference[C]. conference on multimedia modeling, 2016: 586-595.
Wang Z, Hu R, Liang C, et al. Zero-Shot Person Re-identification via Cross-View Consistency[J]. IEEE Transactions on Multimedia, 2016, 18(2): 260-272.(EI)
Wu T, Hu R, Gao L, et al. Analysis and Comparison of Inter-Channel Level Difference and Interaural Level Difference[C]. conference on multimedia modeling, 2016: 586-595.
Xu Z, Hu R, Chen J, et al. Global Contrast Based Salient Region Boundary Sampling for Action Recognition[C]. conference on multimedia modeling, 2016: 187-198.
Jiang J, Hu R, Wang Z, et al. CDMMA: Coupled discriminant multi-manifold analysis for matching low-resolution face images[J]. Signal Processing, 2016: 162-172.(SCI,中国计算机学会C类期刊)
Huang W, Hu R, Liang C, et al. Camera Network Based Person Re-identification by Leveraging Spatial-Temporal Constraint and Multiple Cameras Relations[C]. conference on multimedia modeling, 2016: 174-186.
Huang K, Hu R, Jiang J, et al. Face Image Super-Resolution Through Improved Neighbor Embedding[C]. conference on multimedia modeling, 2016: 409-420.
Zhang L, Hu R, Li D, et al. Adaptive Multichannel Reduction Using Convex Polyhedral Loudspeaker Array[C]. conference on multimedia modeling, 2016: 421-431.
Yang Y, Wang Y, Hu R, et al. Level Ratio Based Inter and Intra Channel Prediction with Application to Stereo Audio Frame Loss Concealment[C]. conference on multimedia modeling, 2016: 654-661.
Jiang J, Hu R, Wang Z, et al. Facial Image Hallucination Through Coupled-Layer Neighbor Embedding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(9): 1674-1684.
Wang Z, Hu R, Yu Y, et al. Multi-Level Fusion for Person Re-identification with Incomplete Marks[C]. acm multimedia, 2015: 1267-1270. (EI,中国计算机学会A类会议)
Wang Z, Hu R, Liang C, et al. Person Re-identification Using Data-Driven Metric Adaptation[C]. conference on multimedia modeling, 2015: 195-207.
Wang S, Hu R, Chen S, et al. 3D Panning Based Sound Field Enhancement Method for Ambisonics[C]. pacific rim conference on multimedia, 2015: 135-145.
Wang S, Hu R, Chen S, et al. A down-mixing method for 22.2 multichannel system reproduction[C]. international conference on acoustics, speech, and signal processing, 2015: 634-638. (EI,中国计算机学会C类会议)
Zhang M, Hu R, Chen S, et al. Spatial perception reproduction of sound events based on sound property coincidences[C]. international conference on multimedia and expo, 2015: 1-6. (EI,中国计算机学会B类会议)
Yin L, Hu R, Chen S, et al. A Block-Based Background Model for Surveillance Video Coding[C]. data compression conference, 2015: 476-476. (EI,中国计算机学会B类会议)
Hu J, Hu R, Chen Y, et al. Joint Weighted Sparse Representation Based Median Filter for Depth Video Coding[C]. data compression conference, 2015: 450-450. (EI,中国计算机学会B类会议)
Gao L, Hu R, Yang Y, et al. Azimuthal Perceptual Resolution Model Based Adaptive 3D Spatial Parameter Coding[C]. conference on multimedia modeling, 2015: 534-545.
Jiang L, Hu R, Wang X, et al. Low Bitrates Audio Bandwidth Extension Using a Deep Auto-Encoder[C]. pacific rim conference on multimedia, 2015: 528-537.
Yang C, Hu R, Su L, et al. Multi-channel Object-Based Spatial Parameter Compression Approach for 3D Audio[C]. pacific rim conference on multimedia, 2015: 354-364.
Li D, Hu R, Wang X, et al. Multichannel Simplification Based on Deviation of Loudspeaker Positions[C]. advances in multimedia, 2015: 544-553.
Xie S, Yang Y, Hu R, et al. Signal-Aware Parametric Quality Model for Audio and Speech over IP Networks[C]. conference on multimedia modeling, 2015: 487-497.
Xiao J, Liao L, Hu J, et al. Exploiting global redundancy in big surveillance video data for efficient coding[J]. Cluster Computing, 2015, 18(2): 531-540.
Xiao J, Chen Y, Liao L, et al. Global Coding of Multi-source Surveillance Video Data[C]. data compression conference, 2015: 33-42. (EI,中国计算机学会B类会议)
Zhong R, Hu R, Wang Z, et al. 3D hybrid just noticeable distortion modeling for depth image-based rendering[J]. Multimedia Tools and Applications, 2015, 74(23): 10457-10478. (SCI,EI,中国计算机学会C类期刊)
Wang S, Hu R, Chen S, et al. A down-mixing method for 22.2 multichannel system reproduction[C]. international conference on acoustics, speech, and signal processing, 2015: 634-638. (EI,中国计算机学会C类会议)
Liao L, Hu R, Xiao J, et al. Exploiting effects of parts in fine-grained categorization of vehicles[C]. international conference on image processing, 2015: 745-749.
Xu Z, Hu R, Chen J, et al. How much bandwidth does surveillance system require[C]. international conference on image processing, 2015: 1762-1766. (EI,中国计算机学会C类会议)
Zhang M, Hu R, Chen S, et al. Spatial perception reproduction of sound events based on sound property coincidences[C]. international conference on multimedia and expo, 2015: 1-6. (EI,中国计算机学会B类会议)
Jing X, Zhu X, Wu F, et al. Super-resolution Person re-identification with semi-coupled low-rank discriminant dictionary learning[C]. computer vision and pattern recognition, 2015: 695-704. (EI, 中国计算机学会A类会议)
Qu S, Hu R, Chen S, et al. Face hallucination via Cauchy regularized sparse representation[C]. international conference on acoustics, speech, and signal processing, 2015: 1216-1220. (EI,中国计算机学会C类会议)
Gao L, Hu R, Yang Y, et al. Azimuthal Perceptual Resolution Model Based Adaptive 3D Spatial Parameter Coding[C]. conference on multimedia modeling, 2015: 534-545
Jiang J, Hu R, Han Z, et al. Coupled Discriminant Multi-Manifold Analysis with Application to Low-Resolution Face Recognition[C]. conference on multimedia modeling, 2015: 37-48. (EI,中国计算机学会C类会议)
[20] Jiang J, Hu R, Wang Z, et al. Face Super-Resolution via Multilayer Locality-Constrained Iterative Neighbor Embedding and Intermediate Dictionary Learning[J]. IEEE Transactions on Image Processing, 2014, 23(10): 4220-4231.(SCI, 中国计算机学会A类期刊)
Zhong R, Hu R, Wang Z, et al. 3D hybrid just noticeable distortion modeling for depth image-based rendering[J]. Multimedia Tools and Applications, 2015, 74(23): 10457-10478. (SCI,EI,中国计算机学会C类期刊)
Jiang J, Hu R, Han Z, et al. Low-Resolution and Low-Quality Face Super-Resolution in Monitoring Scene via Support-Driven Sparse Coding[C]. signal processing systems, 2014, 75(3): 245-256. (SCI)
Hu J, Hu R, Wang Z, et al. Adaptive Learning Based View Synthesis Prediction for Multi-View Video Coding[C]. signal processing systems, 2014, 74(1): 115-126.(SCI)
Jiang J , Hu R , Wang Z , et al. Noise Robust Face Hallucination via Locality-Constrained Representation[J]. IEEE Transactions on Multimedia, 2014, 16(5):1268-1281. (SCI,中国计算机学会C类会议)
Huang Z, Hu R, Wang Z, et al. Background Subtraction With Video Coding[J]. IEEE Signal Processing Letters, 2013, 20(11): 1058-1061. (SCI)
Gao L, Hu R, Yang Y, et al. A spatial priority based scalable audio coding[C]. international conference on acoustics speech and signal processing, 2014: 3670-3674. (EI,中国计算机学会B类会议 )
Leng Q, Hu R, Liang C, et al. Bidirectional ranking for person re-identification[C]. international conference on multimedia and expo, 2013: 1-6. (EI,中国计算机学会B类会议)
Wang Y, Hu R, Liang C, et al. Camera compensation using feature projection matrix for person re-identification[C]. international conference on multimedia and expo, 2013: 1-6. (EI,中国计算机学会B类会议)
Lan C, Hu R, Huang K, et al. Face hallucination with shape parameters projection constraint[C]. acm multimedia, 2010: 883-886. (EI,中国计算机学会A类会议)
Chen H, Hu R, Mao D, et al. Video coding using dynamic texture synthesis[C]. international conference on multimedia and expo, 2010: 203-208. (EI,中国计算机学会B类会议)
Chen H, Hu R, Hu J, et al. Temporal color Just Noticeable Distortion model and its application for video coding[C]. international conference on multimedia and expo, 2010: 713-718. (EI,中国计算机学会B类会议)
Hu R, Hang B, Ma Y, et al. A bottom-up audio attention model for surveillance[C]. international conference on multimedia and expo, 2010: 564-567.(EI,中国计算机学会B类会议)
Books and Edited Books
多媒体信源编码技术与安防监控应急系统,胡瑞敏,湖北科学技术出版,2007
avs技术创新报告(2002-2010),数字音视频编解码技术标准工作组,人民邮电出版社,2011
科研课题
近五年主持科研项目清单:
尺度时空视频数据表达及巡航无人机视频高效编码技术,国家自然科学基金一般面上项目, 2017年-2020年
三元空间身份计算理论及人物画像与定位技术,国家自然科学基金—联合基金重点项目, 2018年-2021年
面向社会安全的视频长程群体行人重识别与多元分析技术,国家自然科学基金—联合基金重点项目,2019年-2022年
新一代宽带无线移动通信网-重大专项,新型移动多媒体音视频编解码关键技术研究,2010ZX03004-003-03,1779万
其它项目:
国家自然科学基金重点项目,三维音频编解码基础理论与关键技术,61231015,315万
国家自然科学基金重点项目,移动音频编解码关键技术研究,60832002,200万
国家自然科学基金重点项目,网络身份溯源与追踪技术研究,280万
国家自然科学基金重点项目,长程视频行人重识别与大数据分析及技术研究,280万
国家自然科学基金--面上项目,面向极低质量监控图像的鲁棒性人脸超分辨率研究,61172173,65万
国家重点基础研究发展计划(973),基于视觉特性的视频编码理论与方法研究,2009CB320906,57万
新一代宽带无线移动通信网-重大专项,新型移动业务控制网络的架构及关键技术,2010ZX03004-001-03,45万
视频编码与移动流媒体传输--重大专项,宽带移动业务关键技术开放式研究,2009ZX03004-004-04,40万
国家自然科学基金,基于轮廓关注度和多域可伸缩的感兴趣区视频编码研究,60772106,29万
国家自然科学基金,基于信道建模自适应的实时无线视频传输研究,60472040,23万
中国信息安全产品测评认证中心,MP3音频码流中的信息隐藏与检测工具集,P2006011EA,15万
湖北省科学技术厅,城市数字视频监控系统,G54,50万
湖北省公安厅,刑事侦察图像比对系统,2008ZDXMHBST011,15万
省基金项目(重点项目),压缩车辆图像的超分辨率重建技术研究,2009CDA134,10万
湖北省公安厅科技处,多域可伸缩的感兴趣区视频编解码技术研究,2007STZZCX002,6万
湖北省科学技术厅,光纤到户流媒体接入技术,2006AA101A03,100万
广东省教育部产学研结合项目,新一代IP监控系统平台可行性研究,2006D90104005,40万
武汉市科学技术技局,城市公安应急联网平台建设,20063003109-2 ,80万
武汉市科学技术技局,电力应急指挥系统,15万
武汉市科学技术技局,视频监控图像业务分析系统与网络实时流媒体平台研发,15万
武汉市人事局,移动音频编解码技术及其在城市应急联网平台中的应用研究,武政办[2007]46号,10万
广东天讯电信科技有限公司,城市安全多级联网视频监控系统平台,137万
武汉绿康数码科技发展有限公司,互联网旅游影像服务平台,115万
广东省科技厅,基于多层异构网的多级联网监控报警系统平台研制(智能型数字联网终端设备),100万
广东天讯瑞达通信技术有限公司,CCS视频监控平台的升级开发,80万
广东天讯瑞达通信技术有限公司,视频压力测试平台的开发,80万
广东天讯电信科技有限公司,深圳市公交车电子视频监控管理系统,50万
广东天讯电信科技有限公司东莞博路分公司,东莞市公安局城市治安视频监控系统工程,20万
北京网新中广科技发展有限责任公司,无线流媒体转码服务器及手机媒体播放器产品,10万
微软亚洲研究院,基于Contourlet变换和图像结构信息的JND模型研究,10万
安防科技(中国)有限公司,AVS音视频编解码器,100万
深圳市华为技术软件有限公司,移动音频算法研究及AVS音频标准相关提案,68万
安防科技(中国)有限公司,数字音视频水印算法,30万
深圳市华为技术软件有限公司,G.VBR标准超宽频扩展算法研究,25万
研究团队
已指导博士研究生60余名,硕士研究生300余名。
指导学生获CCF优秀博士论文奖、湖北省优秀博士论文奖、ACM武汉优秀博士论文奖、湖北省优秀硕士论文奖、教育部智慧城市大赛特等奖、教育部移动终端大赛一等奖、国家互联网+大赛金奖。
知识产权
申请国家发明专利212 项,178项获得授权。
94 年获华中科技大学优秀博士论文奖,入选武汉优秀青年科学家培养计划,
95 年获武汉市科学技术进步奖,
96 年获武汉首届优秀科技青年创业奖,
97 年被评为国家测绘总局跨世纪学术带头人,
98 年获武汉第二届优秀科技青年创业奖,
99 年获第四届湖北省青年科技奖,
00 年获武汉市第十一届劳动模范、第五届湖北省十大杰出青年、第三届武汉杰出青年科技创新奖,
01 年获第七届中国青年科技奖,
02 年获第五届中国青年科技创新奖、湖北省科学技术进步奖,
06 年获信息产业部“信息产业科技创新先进工作者”称号,
07 年获武汉市科技进步一等奖,
09 年获湖北省科技进步二等奖、教育部科技进步二等奖和武汉市创新团队,
10 年获中国电子学会科技进步一等奖、二等奖各一项,公安部科技进步三等奖一项,
11 年获广东省科技进步二等奖一项。
14年获公安部科技进步奖、PCM国际多媒体处理大会最佳论文奖各一项;
15年获MMM国际多媒体建模大会最佳学生论文奖,
16年获湖北省科技进步一等奖。指导学生多次获CCF、湖北省、ACM武汉优秀博士论文奖、研究生智慧城市大赛特等奖、教育部移动终端大赛一等奖、全国互联网+金奖。国家自然科学基金委员会《我国多媒体及联网监控关键技术取得重要成果》简报指出:胡瑞敏教授在多项自然科学基金项目的资助下,在多媒体音视频压缩标准和数字视频联网监控等关键技术方面取得突破,为实现公共安全从被动应付型向主动保障型的战略转变提供了先进的技术支撑
18年获国际工业博览会银奖。
学术服务
现为美高梅4688集团am信息学部学术委员会副主任委员。曾任国家网络安全学院执行院长、美高梅4688集团am院长,任国家多媒体软件工程技术研究中心主任、国务院政府特殊津贴获得者、 IEEE高级会员、中国通信学会会士、中国计算机学会杰出会员、珞珈杰出学者、科技部国家网络空间安全2030重大专项专家组成员、中国信息技术标准委员会(TC28)委员、国家数字视音频编解码技术专家组成员(音频组执行主席)、中国安全防范报警系统标准化技术委员会特聘专家(TC100)、中国安全防范行业协会专家委员会委员、中国指挥控制学会富媒体专业委员会理事、国家数字化学习工程技术研究中心学术委员会委员、视频图像信息智能分析国家工程实验室学术委员会委员、爱立信公司技术顾问。
近年来连续主持了多媒体安全与编码领域四项自然科学基金重点项目,主持了国家重大科技专项研究。担任IEEE Trans. on Multimedia、中国通信等期刊审稿人,在IEEE Trans.CSVT、Trans.IP、Trans.MM、SP Letter、DCC、ACM MM、中国通信等国内外重要学术期刊和会议上发表论文139 篇,SCI检索35 篇,CCF A类论文15篇。担任美高梅4688集团am院长四年来,美高梅4688集团am计算机学科在QS世界排名中从300上升到了199名,国内排名从14名上升到了第9名;在ARWU世界排名中从150名提升到74名,国内排名从第18名提升到了第11名;ESI计算机国际排名从400+名提升到最新的128名,进入了全球前千分之三,国际排名提升幅度国内第一。2017年底第四轮教育部学科评估中获软件工程A、计算机科学技术A-,综合结果超越多所传统强校,均位列全国前10%优秀学科行列,网络空间安全学科获批国家一流学科示范项目。
1995年和香港和记电讯旗下瑞讯公司合作开发国内第一款支持H.324标准的普通电话线可视电话产品,1999年开发国内第一款支持H.323协议的互联网视频会议系统并在第一届深圳高交会上受到广泛关注。2003年和台湾丽台科技公司联合研制了第一款网络摄像机产品并获2004年拉斯维加斯CES创新大奖。2006年牵头制订国内第一个省级平安城市联网监控技术标准。2007年和广东志成冠军集团合作研制了嵌入式网络视频服务器成功应用于广东省平安城市示范项目东莞平安城市工程,2008年和广东电信天讯公司合作研制大容量视频联网监控平台并成功应用于深圳市13000辆公交车移动视频监控项目,2009年和武汉大千公司合作研制国内第一款视频侦查综合业务平台并成功应用于国内绝大部分省市公安系统。
申请国家发明专利212 项,178项获得授权。曾担任武汉市、鄂州市政府顾问、多家上市公司独立董事、首席科学家/研究院院长、基金公司投审顾问,主持实施多项数字安防行业的重大示范工程。
2010年以后开展包括多媒体、人工智能、大数据和社会行为分析等技术在内的交叉学科研究,重点专注空间海量视频编码、面向环境的3D音频信息处理、可信身份计算、模式行为分析、复杂关系挖掘和社会安全场景解析的理论与方法研究,相关成果可广泛应用于可信身份辨识与溯源定位、复杂人物画像、安全态势感知、智能业务推荐、卫星及无人机视频处理、新媒体智能采编与发布、物联网与云安全系统等领域。
学术兼职:
IEEE高级会员
国家网络空间安全2030计划专家组成员
国家自然科学基金委第八届学科评审组成员
国家电子文档总体专家组成员
公安部十二五科技支撑计划专家组成员
中国通信学会智慧城市专家组成员
中国通信学会IP与多媒体增值业务专业委员会委员
中国计算机学会多媒体技术与应用专业委员会委员
标准化兼职:
中国信息技术标准委员会委员
国家数字视音频编解码技术专家组音频组主席
中国安全防范报警系统标准化技术委员会特聘专家
中国安全防范行业协会专家委员会委员
广东省车载电子产学研创新联盟首席专家
成果展示
其他
我们团队欢迎每一个有梦想的学子,只要你擅长数学,擅长计算机,动手能力强,对科研感兴趣,有坚定的信念,欢迎每一位优秀营员,推免生,意向升学硕士,意向升学博士优秀的你加入我们的团队咨询群: 1146746703。