智能科学与技术学报

平行哲学与智能技术：平行产业与智慧社会的对偶方程与测试基础

王飞跃

2021, 3(3): 245-255. doi:10.11959/j.issn.2096-6652.202126

摘要 ( 458 )

在线阅读 ( 54 )

PDF下载 (4026KB) ( 735 )

可视化

数据和表 | 参考文献 | 相关文章

从卡尔·波普尔的三个世界理论出发，提出面向三个世界的知识体系和相应的哲学问题，将西方哲学的存在和变化扩展至相信，引入对应的平行哲学和相关智能技术的对偶方程和平行测试方法。通过社会物理信息系统空间中物理牛顿方程与赛博默顿方程的对偶互动，基于 ACP 方法实施平行实验和平行执行，为基于平行技术的智能产业构建“真道”：可信、可靠、可用、效益；分布式全中心、自主式自动化、组织式秩序化；相应的分布式自主组织与分布式自主运营，推进实现平行智能产业和智慧社会。

专题导读

赵才荣, 白翔

2021, 3(3): 256-258. doi:10.11959/j.issn.2096-6652.202127-1

摘要 ( 182 )

在线阅读 ( 27 )

PDF下载 (496KB) ( 230 )

可视化

参考文献 | 相关文章

基于深度卷积集成网络的视网膜多种疾病筛查和识别方法

王禾扬, 杨启鸣, 朱旗

2021, 3(3): 259-267. doi:10.11959/j.issn.2096-6652.202127

摘要 ( 261 )

在线阅读 ( 33 )

PDF下载 (3931KB) ( 412 )

可视化

数据和表 | 参考文献 | 相关文章

针对视网膜疾病种类繁多、病灶位置不固定等特点，提出一种基于深度卷积集成网络的视网膜多种疾病筛查和识别方法。首先，根据视网膜眼底图像裁剪掉两侧黑色边框，并去除图像中的噪声，以降低对眼底图像的干扰，提高图像的清晰度；之后，通过对处理完成的视网膜眼底图像使用裁剪、旋转等数据增强方法来扩增数据集；再建立基于深度卷积神经网络的模型进行特征提取，并在网络模型微调后完成视网膜疾病筛查和识别任务，最终将多个模型的结果进行集成。实验结果表明，该方法针对视网膜疾病的筛查和识别的问题取得了较好的效果，视网膜疾病筛查的准确率达到96.05%，视网膜疾病识别的准确率达到72.55%。

基于3D卷积的图像序列特征提取与自注意力的车牌识别方法

曾淦雄, 柯逍

2021, 3(3): 268-279. doi:10.11959/j.issn.2096-6652.202128

摘要 ( 251 )

在线阅读 ( 23 )

PDF下载 (10995KB) ( 442 )

可视化

数据和表 | 参考文献 | 相关文章

近年来，基于自注意力机制的神经网络在计算机视觉任务中得到广泛的应用。随着智能交通系统的广泛应用，面对复杂多变的交通场景，车牌识别任务的难度不断提高，准确识别的需求更加迫切。因此提出一个基于自注意力的免矫正的车牌识别方法T-LPR。首先对图像进行切片和序列化，并使用3D卷积对切片序列进行特征提取，从而得到图像的嵌入向量序列。然后将嵌入向量序列输入基于Transformer Encoder的编码器中，学习各个嵌入向量之间的关系并输出最终的编码结果。最后使用分类器进行分类。在多个公共数据集上的实验结果表明，所提方法对各类困难场景下的车牌识别都非常有效。

基于视觉显著性的车载单目相机自运动估计及前车尺度估计方法

艾明欣, 刘铁, 王净, 丁佳丽, 袁泽剑, 尚媛园

2021, 3(3): 280-293. doi:10.11959/j.issn.2096-6652.202129

摘要 ( 249 )

在线阅读 ( 21 )

PDF下载 (2518KB) ( 358 )

可视化

数据和表 | 参考文献 | 相关文章

提出一种基于视觉显著性的车载单目相机自运动估计及前车尺度估计方法。首先，针对车载相机自运动估计，通过视觉显著性计算方法检测并去除含有噪声的单目图像序列中的运动目标，同时考虑图像的纹理区域和平滑区域，利用加权显著图保留有用特征点，进而对车载相机进行鲁棒的自运动估计。其次，将前车距离转化为前车尺度估计问题，通过描述子匹配与李代数中正则化的强度匹配相结合的方法最小化损失函数，通过设计视觉注意力机制选择有纹理无遮挡的图像块，并对选定的图像块中的像素赋权以减轻被噪声破坏像素的影响，从而实现鲁棒、准确的尺度估计。最后，利用多个具有挑战性的数据集对所提方法进行分析验证。结果表明，单目相机自运动估计方法达到了基于立体相机方法的水平，前车尺度估计方法在充分发挥强鲁棒性优势的同时保证了预测精度。

基于差分特征注意力机制的无锚框多光谱行人检测算法

沈继锋, 刘岳, 韦浩, 左欣, 杨万扣

2021, 3(3): 294-303. doi:10.11959/j.issn.2096-6652.202130

摘要 ( 360 )

在线阅读 ( 42 )

PDF下载 (4937KB) ( 301 )

可视化

数据和表 | 参考文献 | 相关文章

针对多光谱行人检测系统存在特征融合质量低、模型超参数多且锚框匹配算法复杂等问题，提出了一种基于差分特征注意力机制的无锚框多光谱行人检测算法。该算法首先采用差分特征感知融合方法挖掘多模态特征间的互补信息来优化通道特征；然后利用具有高效无锚框机制的CenterNet检测框架大大降低了模型计算复杂度，从而提升检测速度；最后引入差分特征注意力机制，改善特征融合质量，进一步提升检测精度。在KAIST、CVC14和FLIR这3个公开数据集上的实验结果表明，提出的算法和其他先进方法相比，能够同时有效提升检测精度和速度，具有较好的实际应用前景。

基于多尺度卷积神经网络特征融合的植株叶片检测技术

李颖, 陈龙, 黄钊宏, 孙杨, 蔡国榕

2021, 3(3): 304-311. doi:10.11959/j.issn.2096-6652.202131

摘要 ( 255 )

在线阅读 ( 28 )

PDF下载 (2235KB) ( 483 )

可视化

数据和表 | 参考文献 | 相关文章

植株叶片检测是植株科学培育和精准农业过程中重要的环节之一。传统植株叶片检测的做法对操作人员的专业知识提出了较高要求，且人工成本高、耗时周期长。基于此，提出基于多尺度卷积神经网络特征融合（MCFF）的植株叶片检测技术。从深度学习技术辅助植株培育的需求出发，基于多尺度卷积神经网络特征融合，针对莲座模式植物、拟南芥和烟草3种不同类型、不同分辨率的植株进行叶片计数检测。经过与其他主流算法的比较，发现MCFF具备较高的检测精确度，平均精度均值（mAP）为0.662，实现了高度竞争的性能（AP=0.946），各项指标接近实用水平。

基于SE-YOLOv5s的绝缘子检测

田庆, 胡蓉, 李佐勇, 蔡远征, 余兆钗

2021, 3(3): 312-321. doi:10.11959/j.issn.2096-6652.202132

摘要 ( 327 )

在线阅读 ( 38 )

PDF下载 (4481KB) ( 377 )

可视化

数据和表 | 参考文献 | 相关文章

在电力系统需要巡检的大环境下，人工巡检的传统方式存在很大不便和安全隐患，而采用无人机的目标检测方法在绝缘子检测识别方向有很大的应用前景。针对绝缘子图像检测中存在的场景复杂、视角多变、设备计算能力受限等问题，提出了一种改进的轻量级SE-YOLOv5s卷积神经网络来实现对绝缘子的快速目标检测，该方法首先在YOLOv5s网络中融合SE注意力模块，以强化网络对绝缘子目标的辨识能力，随后采用K-means聚类方法构建绝缘子的先验框，以提升定位精度，最后构造置信度与定位任务联合的损失函数，并引入 Mosaic 数据增强策略训练网络，有效解决训练数据不足的问题。经过实验验证发现，与主流目标检测方法相比，提出的SE-YOLOv5s方法在绝缘子检测准确率、召回率、检测速度及平均精度均值等性能指标上均取得了较好的结果。实验结果表明，该网络对于绝缘子检测有很好的效果，具有更好的鲁棒性，对电力系统的巡检方式具有参考价值。

基于角度敏感的空间注意力机制的轻量型旋转目标检测器

尹开石, 杨萌, 顾曦, 王志成

2021, 3(3): 322-333. doi:10.11959/j.issn.2096-6652.202133

摘要 ( 277 )

在线阅读 ( 30 )

PDF下载 (6137KB) ( 284 )

可视化

数据和表 | 参考文献 | 相关文章

随着深度学习的快速发展，近年来越来越多的基于锚框的目标检测算法被应用于遥感图像上，然而提高算法精度的代价是牺牲了检测速度。因此，选择无锚框的目标检测网络框架，针对遥感场景的特点，提出了一种旋转框的遥感检测算法。根据旋转框与其外接矩形框的空间位置关系，提出了一种简单有效的旋转框表示方式。此外，设计了一种用于辅助检测旋转目标的角度敏感的空间注意力机制，通过引入角度信息提升模型对旋转目标的检测能力。提出的算法在公开遥感数据集DOTA上进行了实验，旋转框的目标检测网络的平均精度均值达到了68.5%，检测速度达到了每秒17.4帧图像。

一种基于最大相关熵和局部约束的协同表示分类器

余沁茹, 卢桂馥

2021, 3(3): 334-341. doi:10.11959/j.issn.2096-6652.202134

摘要 ( 198 )

在线阅读 ( 15 )

PDF下载 (1199KB) ( 179 )

可视化

数据和表 | 参考文献 | 相关文章

提出一种基于最大相关熵和局部约束的协同表示分类器（CRC/MCCLC），该分类器能同时利用最大相关熵和局部信息。一方面，通过利用最大相关熵准则，CRC/MCCLC不仅在异常值处理上比L₁范数鲁棒性更高，还可以使用半二次优化技术进行更有效的计算；另一方面，CRC/MCCLC 通过使用局部信息得到近似稀疏表示，以此从训练样本中获得更多的判别信息。在 ORL、Yale 以及 AR 人脸数据集等图像数据集上的实验结果验证了CRC/MCCLC 方法的有效性。

鲁棒的非负监督低秩鉴别嵌入算法

姚裕, 万鸣华

2021, 3(3): 342-350. doi:10.11959/j.issn.2096-6652.202135

摘要 ( 154 )

在线阅读 ( 10 )

PDF下载 (13761KB) ( 248 )

可视化

数据和表 | 参考文献 | 相关文章

非负矩阵分解（NMF）已经得到了广泛应用。但NMF更注重数据的局部信息，忽略了数据的全局信息，而在有噪声图像的分类问题上，数据的全局信息往往比局部信息更具鲁棒性。为了提高算法的鲁棒性，结合数据的局部与全局信息，并且考虑低秩表示的特性，提出了一种新的非负监督低秩鉴别嵌入算法，此算法假设数据存在噪声，将数据分解为干净数据与噪声数据，并通过L₁范数对噪声矩阵进行稀疏约束，增强对噪声的鲁棒性。此外，该算法使用低秩表示学习到一个低秩矩阵，然后通过非负分解再一次增强算法的鲁棒性。最后结合图嵌入理论，同时保留了数据的局部性和全局性。将该算法应用于各种加噪数据库中发现，相对于对比方法，该算法识别率提升了5%～15%。

基于超轻量通道注意力的端对端语音增强方法

洪依, 孙成立, 冷严

2021, 3(3): 351-358. doi:10.11959/j.issn.2096-6652.202136

摘要 ( 328 )

在线阅读 ( 25 )

PDF下载 (2888KB) ( 384 )

可视化

数据和表 | 参考文献 | 相关文章

全卷积时域音频分离网络（Conv-TasNet）是近年提出的一种主流的端对端语音分离模型。Conv-TasNet利用膨胀卷积扩大感受野，使其在空间上可以融合更多语音特征，极大地提高了网络的语音分离性能，但同时忽略了信息在不同卷积通道间的重要性。基于此，提出一种基于超轻量通道注意力的端对端语音增强方法，该方法结合了Conv-TasNet和通道注意力，并在Conv-TasNet编解码器部分增加一组滤波器来提高网络语音特征提取能力，使卷积神经网络可以更有效地结合空间信息和通道信息来提高语音增强效果。实验验证了所提方法的模型容量在只增加了约0.02%的情况下，语音增强性能获得了有效提升。

特征空间中基于半遗传稀疏表示的图像识别

石林瑞, 黄祎婧, 符进武, 郭心悦, 范自柱

2021, 3(3): 359-369. doi:10.11959/j.issn.2096-6652.202137

摘要 ( 161 )

在线阅读 ( 15 )

PDF下载 (1098KB) ( 355 )

可视化

数据和表 | 参考文献 | 相关文章

经典的稀疏表示分类（SRC）通常是基于求解L₁最小化问题的。SRC在原始输入空间中求解L₀范数最小化问题，无法很好地获取数据中的非线性信息。为了解决这一问题，应用非线性映射将原始输入数据映射到一个新的高维特征空间，并提出了一种新的基于L₀范数的表示方法。在所提方法中，表示测试样本的字典包含两个部分：第一部分固定在测试样本的近邻；第二部分的训练样本通过半遗传算法（SGA）来选择，利用表示误差确定第二部分的表示字典。在所提方法中，如果训练样本和已确定的测试样本的近邻产生最小表示误差，那么这些训练样本将被 SGA 确定为表示字典的第二部分。在一些常用的人脸数据集和一个手写体数据集上的实验表明，所提方法能够获得更好的分类性能。

基于半监督学习的人脸识别反欺骗方法研究

李莉, 曾伟良, 黄永慧, 孙为军

2021, 3(3): 370-380. doi:10.11959/j.issn.2096-6652.202138

摘要 ( 339 )

在线阅读 ( 45 )

PDF下载 (2002KB) ( 502 )

可视化

数据和表 | 参考文献 | 相关文章

鉴别图像中的真伪人脸是一个长期具有挑战性的问题。当合成的伪造人脸十分逼真时，机器识别难分真假，甚至肉眼也难以区分。基于监督学习的真伪人脸识别建模往往需要大量的标签样本，模型的性能严重依赖样本的规模。提出一种基于半监督学习的人脸识别反欺骗方法，以减少对大量标签样本的依赖。该方法利用图像修复模型来学习人脸图像潜在的数据分布。在训练过程中，少量标签样本周期性地提供有监督信号来训练分类器，以区分真伪人脸。该方法可用于不同场景的伪造人脸，如基于摄像头拍摄的人脸或生成对抗网络生成的人脸。在NUAA 数据集和口罩遮挡人脸数据集 RMFD 上进行验证，实验结果表明，所提方法能够在不降低修复图像质量的情况下达到理想的分类精度。仅依靠少量带标签图像，所提方法比Improved-GAN方法和常用的半监督机器学习方法优势更明显，并优于支持向量机和卷积神经网络的监督学习方法。

当期目录