神经符号学及其应用研究

doi:10.11959/j.issn.2096-6652.202234

[1]

YANN

L C

, .

Deep learning has outlived its usefulness as a buzz-phrase

[Z]. 2018.

[本文引用: 2]

[2]

BENGIO

Y

, .

From system 1 deep learning to system 2 deep learning

[C]// Proceedings of the 33rd Conference on Neural Information Processing Systems.[S.l.:s.n.], 2019.

[本文引用: 2]

[3]

GARCEZ

A A

, LAMB

L C

.

Neurosymbolic AI:the 3rd wave

[J]. arXiv preprint, 2020,arXiv:2012.05876.

[本文引用: 4]

[4]

张钹, 朱军, 苏航 .

迈向第三代人工智能

[J]. 中国科学:信息科学, 2020,50(9): 1281-1302.

[本文引用: 1]

ZHANG

B

, ZHU

J

, SU

H

.

Toward the third generation of artificial intelligence

[J]. Scientia Sinica (Informationis), 2020,50(9): 1281-1302.

[本文引用: 1]

[5]

GALLI

E

, KAHNEMAN

D

.

Thinking,fast and slow

[J]. Journal of Public Finance and Public Choice, 2011,29(1/2/3): 214-215.

[本文引用: 1]

[6]

MAO

J Y

, GAN

C

, KOHLI

P

,et al.

The neuro-symbolic concept learner:interpreting scenes,words,and sentences from natural supervision

[J]. arXiv preprint,2019, 2019,arXiv:1904.12584.

[本文引用: 1]

[7]

RAEDT

L

, MANHAEVE

R

, DUMANCIC

S

,et al.

Neuro-symbolic =neural+logical+ probabilistic

[C]// Proceedings of the 14th International Workshop on Neural-Symbolic Learning and Reasoning.[S.l.:s.n.], 2019.

[本文引用: 1]

[8]

KAMPFFMEYER

M

, CHEN

Y B

, LIANG

X D

,et al.

Rethinking knowledge graph propagation for zero-shot learning

[C]// Proceedings of 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway:IEEE Press, 2019: 11479-11488.

[本文引用: 2]

[9]

EVANS

R

, GREFENSTETTE

E

.

Learning explanatory rules from noisy data

[J]. Journal of Artificial Intelligence Research, 2018,61: 1-64.

[本文引用: 1]

[10]

SI

X J

, RAGHOTHAMAN

M

, HEO

K

,et al.

Synthesizing datalog programs using numerical relaxation

[J]. arXiv preprint, 2019,arXiv:1906.00163.

[本文引用: 1]

[11]

KALYAN

A

, MOHTA

A

, POLOZOV

O

,et al.

Neural-guided deductive search for real-time program synthesis from examples

[J]. arXiv preprint, 2018,arXiv:1804.01186.

[本文引用: 1]

[12]

ZHOU

Z H

.

Abductive learning:towards bridging machine learning and logical reasoning

[J]. Science China Information Sciences, 2019,62(7): 1-3.

[本文引用: 2]

[13]

XU

J Y

, ZHANG

Z L

, FRIEDMAN

T

,et al.

A semantic loss function for deep learning with symbolic knowledge

[J]. arXiv preprint, 2017,arXiv:1711.11157.

[本文引用: 1]

[14]

CHEN

R Q

, CHEN

T S

, HUI

X L

,et al.

Knowledge graph transfer network for few-shot recognition

[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020,34(7): 10575-10582.

[本文引用: 1]

[15]

LI

A X

, LUO

T G

, LU

Z W

,et al.

Large-scale few-shot learning:knowledge transfer with class hierarchy

[C]// Proceedings of 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway:IEEE Press, 2019: 7205-7213.

[本文引用: 1]

[16]

VAN

EMDEN M H

, KOWALSKI

R A

.

The semantics of predicate logic as a programming language

[J]. Journal of the ACM, 1976,23(4): 733-742.

[本文引用: 1]

[17]

GARRETT

C R

, CHITNIS

R

, HOLLADAY

R

,et al.

Integrated task and motion planning

[J]. Annual Review of Control,Robotics,and Autonomous Systems, 2021,4: 265-293.

[本文引用: 1]

[18]

CASTAMAN

N

, PAGELLO

E

, MENEGATTI

E

,et al.

Receding horizon task and motion planning in changing environments

[J]. arXiv preprint, 2020,arXiv:200903139.

[本文引用: 1]

[19]

HASLUM

P

, LIPOVETZKY

N

, MAGAZZENI

D

,et al.

An introduction to the planning domain definition language

[J]. Synthesis Lectures on Artificial Intelligence and Machine Learning, 2019,13(2): 1-187.

[本文引用: 1]

[20]

FOX

M

, LONG

D

.

PDDL2.1:an extension to PDDL for expressing temporal planning domains

[J]. Journal of Artificial Intelligence Research, 2003,20: 61-124.

[21]

LITTMAN

M L

.

PPDDL1.0:an extension to PDDL for expressing planning domains with probabilistic effects

[Z]. 2004.

[本文引用: 1]

[22]

SERRANO

S A

, SANTIAGO

E

, MARTINEZ-CARRANZA

J

, ,et al.

Knowledge-based hierarchical POMDPs for task planning

[J]. Journal of Intelligent ＆ Robotic Systems, 2021,101(4): 1-30.

[本文引用: 1]

[23]

WANG

Y F

.

Hierarchical task planning for space manipulator with multi-constraint

[J]. Journal of Mechanical Engineering, 2017,53(11): 104.

[本文引用: 1]

[24]

MANHAEVE

R

, DUMANČIĆ

S

, KIMMIG

A

,et al.

Deepproblog:neural probabilistic logic programming

[J]. arXiv preprint, 2018,arXiv:180510872.

[本文引用: 1]

[25]

GU

S X

, HOLLY

E

, LILLICRAP

T

,et al.

Deep reinforcement learning for robotic manipulation with asynchronous off-policy updates

[C]// Proceedings of 2017 IEEE International Conference on Robotics and Automation. Piscataway:IEEE Press, 2017: 3389-3396.

[本文引用: 1]

[26]

ZHANG

F Y

, LEITNER

J

, MILFORD

M

,et al.

Towards vision-based deep reinforcement learning for robotic motion control

[J]. arXiv preprint, 2015,arXiv:151103791.

[本文引用: 1]

[27]

DIXON

J

, BELL

K

.

Electric vehicles:battery capacity,charger power,access to charging and the impacts on distribution networks

[J]. eTransportation, 2020,4:100059.

[本文引用: 1]

[28]

KE

Q D

, ZHANG

P

, ZHANG

L

,et al.

Electric vehicle battery disassembly sequence planning based on frame-subgroup structure combined with genetic algorithm

[J]. Frontiers in Mechanical Engineering, 2020,6:576642.

[本文引用: 1]

[29]

MAHARSHI

S

, REDDY

K J

.

Cloud based disassembly of electric vehicle battery

[J]. Procedia Manufacturing, 2019,30: 136-142.

[本文引用: 1]

[30]

BLANKEMEYER

S

, WIENS

D

, WIESE

T

,et al.

Investigation of the potential for an automated disassembly process of BEV batteries

[J]. Procedia CIRP, 2021,98: 559-564.

[本文引用: 1]

[31]

HARPER

G

, SOMMERVILLE

R

, KENDRICK

E

,et al.

Recycling lithium-ion batteries from electric vehicles

[J]. Nature, 2019,575(7781): 75-86.

[本文引用: 1]

[32]

任伟, 王志刚, 杨华 ,等.

基于神经符号的动力电池拆解任务与运动规划

[J]. 计算机研究与发展, 2021(12): 2604-2617.

[本文引用: 1]

REN

W

, WANG

Z G

, YANG

H

,et al.

NeuroSymbolic task and motion planner for disassembly electric vehicle batteries

[J]. Journal of Computer Research and Development, 2021(12): 2604-2617.

[本文引用: 1]

[33]

DU

Y D

, WANG

W S

, WANG

Z G

,et al.

Learning symbolic operators:a neurosymbolic solution for autonomous disassembly of electric vehicle battery

[J]. arXiv preprint, 2022,arXiv:2206.03027.

[本文引用: 1]

Deep learning has outlived its usefulness as a buzz-phrase

2

2018

... 近年来，在深度学习和大数据的驱动下，人工智能取得了突破性的进展，在一些特定领域（尤其是计算机视觉任务）的准确率甚至超过了人类.因此，人工智能也被尝试应用于不同的领域，以减少日益增长的人力成本.然而在实际落地的过程中，与人类智能相比，目前的人工智能技术尚有诸多不足.究其原因，目前的人工智能尚处于感知层次，认知能力的不足成为制约人工智能发展的关键瓶颈.只有将感知层次提高到认知层次，才能更好地满足各种应用的需求.感知与认知的主要区别在于，感知能力是指通过感官看到、听到或感受到某些具体事物的能力，而认知能力则基于已有的知识对感知到的信息进行加工、整理以支持决策.感知和认知是两个具有内在联系的概念，人类智能将感知智能和认知智能无缝地融合在一起，不仅能获取和正确解析外界环境信息，还能高效鲁棒地对接下来产生的行为做出合适的决策和规划.在现有的计算机理论中，深度学习和符号逻辑分别能够很好地对感知智能和认知智能进行建模和表示.但是，这两套理论尚不能无缝地衔接在一起.可微计算^[1]和双系统理论^[2]为这种融合打开了一扇新的大门，引发了学界的广泛关注，因此，神经符号学应运而生，其被认为是第三代人工智能^[3]. ...

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

From system 1 deep learning to system 2 deep learning

2

2019

... 近年来，在深度学习和大数据的驱动下，人工智能取得了突破性的进展，在一些特定领域（尤其是计算机视觉任务）的准确率甚至超过了人类.因此，人工智能也被尝试应用于不同的领域，以减少日益增长的人力成本.然而在实际落地的过程中，与人类智能相比，目前的人工智能技术尚有诸多不足.究其原因，目前的人工智能尚处于感知层次，认知能力的不足成为制约人工智能发展的关键瓶颈.只有将感知层次提高到认知层次，才能更好地满足各种应用的需求.感知与认知的主要区别在于，感知能力是指通过感官看到、听到或感受到某些具体事物的能力，而认知能力则基于已有的知识对感知到的信息进行加工、整理以支持决策.感知和认知是两个具有内在联系的概念，人类智能将感知智能和认知智能无缝地融合在一起，不仅能获取和正确解析外界环境信息，还能高效鲁棒地对接下来产生的行为做出合适的决策和规划.在现有的计算机理论中，深度学习和符号逻辑分别能够很好地对感知智能和认知智能进行建模和表示.但是，这两套理论尚不能无缝地衔接在一起.可微计算^[1]和双系统理论^[2]为这种融合打开了一扇新的大门，引发了学界的广泛关注，因此，神经符号学应运而生，其被认为是第三代人工智能^[3]. ...

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

Neurosymbolic AI:the 3rd wave

4

2020

... 近年来，在深度学习和大数据的驱动下，人工智能取得了突破性的进展，在一些特定领域（尤其是计算机视觉任务）的准确率甚至超过了人类.因此，人工智能也被尝试应用于不同的领域，以减少日益增长的人力成本.然而在实际落地的过程中，与人类智能相比，目前的人工智能技术尚有诸多不足.究其原因，目前的人工智能尚处于感知层次，认知能力的不足成为制约人工智能发展的关键瓶颈.只有将感知层次提高到认知层次，才能更好地满足各种应用的需求.感知与认知的主要区别在于，感知能力是指通过感官看到、听到或感受到某些具体事物的能力，而认知能力则基于已有的知识对感知到的信息进行加工、整理以支持决策.感知和认知是两个具有内在联系的概念，人类智能将感知智能和认知智能无缝地融合在一起，不仅能获取和正确解析外界环境信息，还能高效鲁棒地对接下来产生的行为做出合适的决策和规划.在现有的计算机理论中，深度学习和符号逻辑分别能够很好地对感知智能和认知智能进行建模和表示.但是，这两套理论尚不能无缝地衔接在一起.可微计算^[1]和双系统理论^[2]为这种融合打开了一扇新的大门，引发了学界的广泛关注，因此，神经符号学应运而生，其被认为是第三代人工智能^[3]. ...

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

... [3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

... [3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

迈向第三代人工智能

1

2020

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

迈向第三代人工智能

1

2020

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

Thinking,fast and slow

1

2011

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

The neuro-symbolic concept learner:interpreting scenes,words,and sentences from natural supervision

1

2019

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

Neuro-symbolic =neural+logical+ probabilistic

1

2019

... 为了让人工智能能够像人类智能一样，近年来一些研究工作开始探讨第三代人工智能^[1,2,3,4]，将前两代人工智能融合在一起，取长补短.目前两者结合的主要挑战在于基于神经网络的方法和基于符号推理的方法在不同空间中进行操作，一个是连续的向量空间，一个是离散的符号空间，因此必须借助新的数学工具才能将二者结合起来.神经符号学的目标是将通过概率学习实现的低层感知能力与通过逻辑系统实现的高层推理能力紧密结合在一起^[3,5]，通过神经网络实现感知和识别，将非结构化信息直接映射成准符号信息，整个过程无须人工介入.高层的逻辑推理基于准符号信息进行，从而完成规划、类比等任务，甚至基于高层反向推理提升低层识别精度和降低低层感知模块的识别难度.神经符号学的方法在一些应用领域都取得了不错的成果^[3,6-7]，各项研究工作在状态表示和融合方法上各有千秋，目前还没有形成统一的解决方案，因此神经符号学仍是一个新兴的研究热点和难点.本文第1节对现有神经符号学方法进行分析，第2节提出一个较为实用的理论框架，第3节介绍基于该框架的3个典型应用，第4节总结全文. ...

Rethinking knowledge graph propagation for zero-shot learning

2

2019

... 神经符号学的基本方法是构建一个准符号空间.该符号空间具备两个特性：一是该空间中的符号具有一定的语义信息，人们不仅可以理解后续的推理过程，还可以把已有的知识编码进这个空间，帮助后续的运算；二是该空间是连续的，这个特点与传统的符号空间存在明显的差异.准符号空间中的运算都是可微的，即反向传播算法在该空间中依然有效，后续可以通过实践中采集到的数据进一步学习和修正相关参数.准符号空间可以位于系统的不同位置，以更好地满足不同的应用需求.目前国内外研究学者提出了多种神经符号学的研究框架，本文根据该准符号空间在系统中的不同位置，将神经符号学系统分为两类：推理导向的神经符号学和学习导向^[8]的神经符号学，如图1所示. ...

... 学习导向的神经符号学的主体同样是神经网络，即用神经网络直接处理非结构化的输入数据，并输出期望的结果.与传统神经网络不同，学习导向的神经符号学在训练过程中引入了知识^[8,13,14,15].图1（b）是学习导向的神经符号学的典型例子，在训练过程中该方法基于神经网络得到非结构化数据中相关中间特征表示的同时，也根据知识图谱获得对应的特征表示（embedding），并通过定义损失函数将图像特征与知识特征进行对齐.因此，这些对应神经网络识别过程中获得的中间特征是与知识一致的，人们可以通过这些特征理解最终的推理结果，甚至将这些特征重新组合，识别没有训练过的事物. ...

Learning explanatory rules from noisy data

1

2018

... 推理导向的神经符号学基本原理如图1（a）所示.推理导向的神经符号学通过神经网络处理非结构化数据，将非结构化数据转换为多维特征向量，并将该特征向量作为准符号输入推理引擎^[9,10,11,12].由于输入特征向量在空间的表示是连续的，推理引擎通常需要先将符号逻辑扩展为概率逻辑，才能支持在连续空间上的推理.值得一提的是，这里的推理引擎不仅能够提供正向推理的能力，还能够提供反向推理的能力.在执行任务的过程中，由于推理引擎的存在，系统不仅知道自己要做什么，还知道这样做的原因以及期望的结果.当真实结果与预期结果不一致时，该系统可以通过反向推理推导出出问题的步骤，对应的结果可以作为前端神经网络的标记真值（ground-truth），帮助神经网络修正模型参数^[12]. ...

Synthesizing datalog programs using numerical relaxation

1

2019

... 推理导向的神经符号学基本原理如图1（a）所示.推理导向的神经符号学通过神经网络处理非结构化数据，将非结构化数据转换为多维特征向量，并将该特征向量作为准符号输入推理引擎^[9,10,11,12].由于输入特征向量在空间的表示是连续的，推理引擎通常需要先将符号逻辑扩展为概率逻辑，才能支持在连续空间上的推理.值得一提的是，这里的推理引擎不仅能够提供正向推理的能力，还能够提供反向推理的能力.在执行任务的过程中，由于推理引擎的存在，系统不仅知道自己要做什么，还知道这样做的原因以及期望的结果.当真实结果与预期结果不一致时，该系统可以通过反向推理推导出出问题的步骤，对应的结果可以作为前端神经网络的标记真值（ground-truth），帮助神经网络修正模型参数^[12]. ...

Neural-guided deductive search for real-time program synthesis from examples

1

2018

... 推理导向的神经符号学基本原理如图1（a）所示.推理导向的神经符号学通过神经网络处理非结构化数据，将非结构化数据转换为多维特征向量，并将该特征向量作为准符号输入推理引擎^[9,10,11,12].由于输入特征向量在空间的表示是连续的，推理引擎通常需要先将符号逻辑扩展为概率逻辑，才能支持在连续空间上的推理.值得一提的是，这里的推理引擎不仅能够提供正向推理的能力，还能够提供反向推理的能力.在执行任务的过程中，由于推理引擎的存在，系统不仅知道自己要做什么，还知道这样做的原因以及期望的结果.当真实结果与预期结果不一致时，该系统可以通过反向推理推导出出问题的步骤，对应的结果可以作为前端神经网络的标记真值（ground-truth），帮助神经网络修正模型参数^[12]. ...

Abductive learning:towards bridging machine learning and logical reasoning

2

2019

... 推理导向的神经符号学基本原理如图1（a）所示.推理导向的神经符号学通过神经网络处理非结构化数据，将非结构化数据转换为多维特征向量，并将该特征向量作为准符号输入推理引擎^[9,10,11,12].由于输入特征向量在空间的表示是连续的，推理引擎通常需要先将符号逻辑扩展为概率逻辑，才能支持在连续空间上的推理.值得一提的是，这里的推理引擎不仅能够提供正向推理的能力，还能够提供反向推理的能力.在执行任务的过程中，由于推理引擎的存在，系统不仅知道自己要做什么，还知道这样做的原因以及期望的结果.当真实结果与预期结果不一致时，该系统可以通过反向推理推导出出问题的步骤，对应的结果可以作为前端神经网络的标记真值（ground-truth），帮助神经网络修正模型参数^[12]. ...

... [12]. ...

A semantic loss function for deep learning with symbolic knowledge

1

2017

... 学习导向的神经符号学的主体同样是神经网络，即用神经网络直接处理非结构化的输入数据，并输出期望的结果.与传统神经网络不同，学习导向的神经符号学在训练过程中引入了知识^[8,13,14,15].图1（b）是学习导向的神经符号学的典型例子，在训练过程中该方法基于神经网络得到非结构化数据中相关中间特征表示的同时，也根据知识图谱获得对应的特征表示（embedding），并通过定义损失函数将图像特征与知识特征进行对齐.因此，这些对应神经网络识别过程中获得的中间特征是与知识一致的，人们可以通过这些特征理解最终的推理结果，甚至将这些特征重新组合，识别没有训练过的事物. ...

Knowledge graph transfer network for few-shot recognition

1

2020

... 学习导向的神经符号学的主体同样是神经网络，即用神经网络直接处理非结构化的输入数据，并输出期望的结果.与传统神经网络不同，学习导向的神经符号学在训练过程中引入了知识^[8,13,14,15].图1（b）是学习导向的神经符号学的典型例子，在训练过程中该方法基于神经网络得到非结构化数据中相关中间特征表示的同时，也根据知识图谱获得对应的特征表示（embedding），并通过定义损失函数将图像特征与知识特征进行对齐.因此，这些对应神经网络识别过程中获得的中间特征是与知识一致的，人们可以通过这些特征理解最终的推理结果，甚至将这些特征重新组合，识别没有训练过的事物. ...

Large-scale few-shot learning:knowledge transfer with class hierarchy

1

2019

... 学习导向的神经符号学的主体同样是神经网络，即用神经网络直接处理非结构化的输入数据，并输出期望的结果.与传统神经网络不同，学习导向的神经符号学在训练过程中引入了知识^[8,13,14,15].图1（b）是学习导向的神经符号学的典型例子，在训练过程中该方法基于神经网络得到非结构化数据中相关中间特征表示的同时，也根据知识图谱获得对应的特征表示（embedding），并通过定义损失函数将图像特征与知识特征进行对齐.因此，这些对应神经网络识别过程中获得的中间特征是与知识一致的，人们可以通过这些特征理解最终的推理结果，甚至将这些特征重新组合，识别没有训练过的事物. ...

The semantics of predicate logic as a programming language

1

1976

... NSFOL框架包含两个主要模块：基于神经符号学的一阶逻辑模块和领域知识模块.一阶逻辑由于其强大的描述能力已经得到了广泛的应用^[16].在一阶逻辑中，原子语句是最基本的语句，它是由谓词表示的物体的属性或关系；复杂语句是使用连接词

(\land, \lor, \neg, \to, \leftrightarrow)

组合原子语句而成的.一阶逻辑基于原子语句和复杂语句完成对已知事实和规则的描述，然后利用推理规则推理出新的结论.式（1）、式（2）、式（3）展示了常见的 3 种推理规则：假言推理（modus ponens，MP）、合取介入（and-introduction，AI）和全称消去（universal elimination，UE）.可见，谓词是一阶逻辑系统中关键的一环.传统的一阶逻辑模块在定义谓词时需要明确地解释它何时为真，何时为假，以方便后续的推理.基于神经符号学的一阶逻辑模块将一阶逻辑中的谓词扩展为神经谓词，即以神经网络的方式分析物体属性或物体间的关系.例如：on(A,B)和clear(A)是规划问题中常用的两个谓词.on(A,B)描述物体A是否在物体B上面，clear(A)描述物体A上方是否有其他物体.由于基于传统符号的方法难以实现谓词与物理世界的直接关联，需要不断地细化谓词的定义才能实现与传感器数据的一一对应.假设物体A和B是二维空间物体，且存在谓词X_min()、X_max()、Y_min()、Y_max() 表示物体在空间中(x, )y 坐标的最小值和最大值.on(B,A)可以被细化成X_min(B)≥X_min(A)且X_max(B)≤X_max(A)且Y_max(A)=Y_min(B).可以看出，即使在二维空间中，这种定义也是非常复杂的，需要有经验的人员才能完成.此外，上述谓词的定义仅限于特定的实验环境，不同环境谓词的定义可能不同.例如上文描述的“在……上”的定义只适用于边界清晰、大小确定的积木世界，难以在模糊、有噪声的环境中推广应用. ...

Integrated task and motion planning

1

2021

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Receding horizon task and motion planning in changing environments

1

2020

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

An introduction to the planning domain definition language

1

2019

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

PDDL2.1:an extension to PDDL for expressing temporal planning domains

2003

PPDDL1.0:an extension to PDDL for expressing planning domains with probabilistic effects

1

2004

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Knowledge-based hierarchical POMDPs for task planning

1

2021

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Hierarchical task planning for space manipulator with multi-constraint

1

2017

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Deepproblog:neural probabilistic logic programming

1

2018

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Deep reinforcement learning for robotic manipulation with asynchronous off-policy updates

1

2017

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Towards vision-based deep reinforcement learning for robotic motion control

1

2015

... 机器人任务规划是指根据被操纵对象的初始状态和目标状态，自主选择合理的动作序列改变机器人和被操纵物体的状态，通过多步实现从初始状态到目标状态的转移^[17-18].机器人任务规划是机器人研究中的热点问题.目前，这类方法大部分以逻辑推理为基础展开任务规划，通过对规划领域定义语言（planning domain define language，PDDL）^[19-21]进行调整和扩展来更好地定义问题，实现针对问题优化的解决方案^[22,23,24].这类研究的共同问题是需要符号学专家预先定义系统状态的符号表示，并将其作为规划器的输入，这极大地限制了应用范围.近年来，部分学者尝试通过深度强化学习的方式实现机器人任务规划^[25-26].由于深度学习通常需要大量的数据才能训练出满足要求的规划器，目前大部分的研究工作仍基于实验室场景（易于保证虚拟环境和真实环境一致）完成.此外，由于数据获取难度的限制，基于深度强化学习的机器人任务规划难以用于长程任务的规划. ...

Electric vehicles:battery capacity,charger power,access to charging and the impacts on distribution networks

1

2020

... 本文选取了动力电池拆解这一极具挑战同时非常有实际意义的任务进行 NSFOL 框架的应用研究.随着大容量锂离子电池技术的成熟，越来越多的汽车制造商将动力电池作为新能源汽车动力源^[27].动力电池中含有的多种金属元素都是稀缺资源，处理不当容易污染环境，这使得动力电池回收成为亟须解决的问题^[28].目前动力电池的拆解回收仍采取人工拆解为主，少量引入机器辅助拆解的方式^[29-30].这种方式不仅低效，而且需要工人长期在恶劣的环境中工作，用工成本和风险都很高.为了减少拆解工作环境对拆解工人的伤害，提高经济和社会效益，以应对大规模急速增加的拆解任务的工作量，相关企业都在积极探索使用机器人自主智能化拆解回收动力电池的可能性^[31]. ...

Electric vehicle battery disassembly sequence planning based on frame-subgroup structure combined with genetic algorithm

1

2020

... 本文选取了动力电池拆解这一极具挑战同时非常有实际意义的任务进行 NSFOL 框架的应用研究.随着大容量锂离子电池技术的成熟，越来越多的汽车制造商将动力电池作为新能源汽车动力源^[27].动力电池中含有的多种金属元素都是稀缺资源，处理不当容易污染环境，这使得动力电池回收成为亟须解决的问题^[28].目前动力电池的拆解回收仍采取人工拆解为主，少量引入机器辅助拆解的方式^[29-30].这种方式不仅低效，而且需要工人长期在恶劣的环境中工作，用工成本和风险都很高.为了减少拆解工作环境对拆解工人的伤害，提高经济和社会效益，以应对大规模急速增加的拆解任务的工作量，相关企业都在积极探索使用机器人自主智能化拆解回收动力电池的可能性^[31]. ...

Cloud based disassembly of electric vehicle battery

1

2019

... 本文选取了动力电池拆解这一极具挑战同时非常有实际意义的任务进行 NSFOL 框架的应用研究.随着大容量锂离子电池技术的成熟，越来越多的汽车制造商将动力电池作为新能源汽车动力源^[27].动力电池中含有的多种金属元素都是稀缺资源，处理不当容易污染环境，这使得动力电池回收成为亟须解决的问题^[28].目前动力电池的拆解回收仍采取人工拆解为主，少量引入机器辅助拆解的方式^[29-30].这种方式不仅低效，而且需要工人长期在恶劣的环境中工作，用工成本和风险都很高.为了减少拆解工作环境对拆解工人的伤害，提高经济和社会效益，以应对大规模急速增加的拆解任务的工作量，相关企业都在积极探索使用机器人自主智能化拆解回收动力电池的可能性^[31]. ...

Investigation of the potential for an automated disassembly process of BEV batteries

1

2021

... 本文选取了动力电池拆解这一极具挑战同时非常有实际意义的任务进行 NSFOL 框架的应用研究.随着大容量锂离子电池技术的成熟，越来越多的汽车制造商将动力电池作为新能源汽车动力源^[27].动力电池中含有的多种金属元素都是稀缺资源，处理不当容易污染环境，这使得动力电池回收成为亟须解决的问题^[28].目前动力电池的拆解回收仍采取人工拆解为主，少量引入机器辅助拆解的方式^[29-30].这种方式不仅低效，而且需要工人长期在恶劣的环境中工作，用工成本和风险都很高.为了减少拆解工作环境对拆解工人的伤害，提高经济和社会效益，以应对大规模急速增加的拆解任务的工作量，相关企业都在积极探索使用机器人自主智能化拆解回收动力电池的可能性^[31]. ...

Recycling lithium-ion batteries from electric vehicles

1

2019

... 本文选取了动力电池拆解这一极具挑战同时非常有实际意义的任务进行 NSFOL 框架的应用研究.随着大容量锂离子电池技术的成熟，越来越多的汽车制造商将动力电池作为新能源汽车动力源^[27].动力电池中含有的多种金属元素都是稀缺资源，处理不当容易污染环境，这使得动力电池回收成为亟须解决的问题^[28].目前动力电池的拆解回收仍采取人工拆解为主，少量引入机器辅助拆解的方式^[29-30].这种方式不仅低效，而且需要工人长期在恶劣的环境中工作，用工成本和风险都很高.为了减少拆解工作环境对拆解工人的伤害，提高经济和社会效益，以应对大规模急速增加的拆解任务的工作量，相关企业都在积极探索使用机器人自主智能化拆解回收动力电池的可能性^[31]. ...

基于神经符号的动力电池拆解任务与运动规划

1

2021

... 基于 NSFOL 的动力电池拆解回收任务定义了两个神经谓词：目标无遮挡（target_clear）和目标已对准（target_aim）.并基于该谓词定义了拆解螺栓所需的5个基本动作原语：靠近目标（approach）、拨动杂物（push）、姿态调整（mate）、螺栓套接（insert）和解除连接（disassemble）.每个动作原语的定义中包含执行该动作的前提条件（PRECOND）和执行后的效果（EFFECT）.执行动作会使得状态中的某些值从真变成假，某些值从假变成真，为了方便后续演算，本文把从真变成假的值集中在EFFECT_negative 中，把从假变成真的值放在EFFECT_positive中.动作规划的问题就被转换成了一个一阶逻辑演算的问题.演算过程中一个动作能否被执行可以由式（4）得出，其中s代表当前的系统状态，它可以通过将神经谓词应用于当前传感数据得到，也可以在演算中假设某些动作被执行，根据式（5）获得.ACTION(s)表示在状态s下可执行的操作.RESULT(s, )a 表示在状态s下执行动作a的结果，可作为下一步演算的状态.这样，系统可以根据机器人当前的传感数据，通过式（4）和式（5）迭代搜索出能够到达目标状态的操作序列.同时，在执行过程中机器人还不断地检查当前的输入是否与规划过程中产生的预期状态一致，如果不一致则及时进行调整.整个过程都是可解释的，当机器人发现自己无法完成任务时，可主动寻求人工帮助.由于目标明确，人工介入易于实现.此外，由于人工的介入，正确的操作给系统提供了反向推理的线索，可为后续实现持续学习提供必要的依据，具体细节见参考文献[32].实验表明，该系统能够根据拆解场景中的不确定因素动态进行调整，完成目标任务，尤其在不确定环境实验中的整体成功率达到98%，表现出较高的自主性. ...

基于神经符号的动力电池拆解任务与运动规划

1

2021

... 基于 NSFOL 的动力电池拆解回收任务定义了两个神经谓词：目标无遮挡（target_clear）和目标已对准（target_aim）.并基于该谓词定义了拆解螺栓所需的5个基本动作原语：靠近目标（approach）、拨动杂物（push）、姿态调整（mate）、螺栓套接（insert）和解除连接（disassemble）.每个动作原语的定义中包含执行该动作的前提条件（PRECOND）和执行后的效果（EFFECT）.执行动作会使得状态中的某些值从真变成假，某些值从假变成真，为了方便后续演算，本文把从真变成假的值集中在EFFECT_negative 中，把从假变成真的值放在EFFECT_positive中.动作规划的问题就被转换成了一个一阶逻辑演算的问题.演算过程中一个动作能否被执行可以由式（4）得出，其中s代表当前的系统状态，它可以通过将神经谓词应用于当前传感数据得到，也可以在演算中假设某些动作被执行，根据式（5）获得.ACTION(s)表示在状态s下可执行的操作.RESULT(s, )a 表示在状态s下执行动作a的结果，可作为下一步演算的状态.这样，系统可以根据机器人当前的传感数据，通过式（4）和式（5）迭代搜索出能够到达目标状态的操作序列.同时，在执行过程中机器人还不断地检查当前的输入是否与规划过程中产生的预期状态一致，如果不一致则及时进行调整.整个过程都是可解释的，当机器人发现自己无法完成任务时，可主动寻求人工帮助.由于目标明确，人工介入易于实现.此外，由于人工的介入，正确的操作给系统提供了反向推理的线索，可为后续实现持续学习提供必要的依据，具体细节见参考文献[32].实验表明，该系统能够根据拆解场景中的不确定因素动态进行调整，完成目标任务，尤其在不确定环境实验中的整体成功率达到98%，表现出较高的自主性. ...

Learning symbolic operators:a neurosymbolic solution for autonomous disassembly of electric vehicle battery

1

2022

... 基于 NSFOL 的自学习机器人运动规划的系统工作流程如图5所示.图5中专家演示动作序列包含动作的标签以及动作对应的图像状态.神经符号运算符学习包含变分自编码器（variational autoencoder，VAE）模型、状态聚类和状态转移预测.首先依据人的操作演示动作序列训练变分自编码器模型，从而得到神经符号运算符的状态向量表示（latent vector）.通过对变分自编码器模型中损失函数的设计，相关联的图像状态向量表示之间的距离相互接近，不相关的图像状态表示之间相互远离.变分自编码器的主干网络采用残差网络ResNet，通过注意力机制建模空间上下文信息.接下来，系统根据图像状态向量表示自动地确定聚类类别的数量，并通过k-means对图像状态向量表示进行聚类C ₁,C₂,…,C_n.通过对人的操作演示动作序列的学习还可以得到神经符号状态表示之间的转移关系，状态转移预测模型基于状态之间的转移关系如P_push、P_mate等预测每次动作执行后的状态.系统依据状态转移预测在状态空间中搜索出能够实现目标状态的最优动作序列.基于神经符号自学习的机器人运动规划方法可以根据当前的环境变化实现在线规划，若当前状态与执行中的原始规划不一致，则自动执行重规划.本文在电池螺栓拆卸任务上对基于神经符号自学习的机器人运动规划方法进行了实验验证，实验结果与第3.1节的基于NSFOL的机器人任务规划方法取得的结果基本一致^[33]，在配置相同的动态环境中总体成功率达到96%. ...

神经符号学及其应用研究

Study on NeuroSymbolic learning and its applications

0 引言

1 神经符号学简介

图1

2 NSFOL框架

图2

3 NSFOL应用探讨

3.1 基于NSFOL的机器人任务规划

图3

3.2 基于NSFOL的自学习机器人运动规划

图4

图5

3.3 基于NSFOL的教育实验评估系统

图6

图7

图8

4 结束语

图9

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

神经符号学及其应用研究

Study on NeuroSymbolic learning and its applications

0 引言

1 神经符号学简介

图1

2 NSFOL框架

图2

3 NSFOL应用探讨

3.1 基于NSFOL的机器人任务规划

图3

3.2 基于NSFOL的自学习机器人运动规划

图4

图5

3.3 基于NSFOL的教育实验评估系统

图6

图7

图8

4 结束语

图9

参考文献 View Option 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子