知识主题间先序关系挖掘

图1 先序关系不对称性实例

图2

图2 知识主题间先序关系是否可通过先序关系不对称性特征推导的统计结果

4 先序关系挖掘方法

基于先序关系的不对称性特征，本文提出端到端的先序关系挖掘模型，如图3所示。

对于知识主题对(t_a,t_b)，该模型将对应知识主题的原始文本描述D_a和D_b作为输入，输出一个衡量知识主题t_a和t_b之间先序关系的值v：

v = {\begin{cases} 1, f (t_{a}, t_{b}) \in (ϕ, 1] \\ 0, f (t_{a}, t_{b}) \in [0, ϕ] \end{cases} (1)

其中，φ为先序关系判断阈值。当v=1时，知识主题t_a是知识主题t_b的先序；当v=0时，知识主题t_a和知识主题t_b间不存在先序关系。整体来说，该模型可细分为两个模块：文本中专业术语与上下位关系抽取模块和先序关系判别模块。

文本中专业术语与上下位关系抽取模块：该模块挖掘文本描述D中术语间的上下位关系。首先，该模块将文本描述D中所有有效的文本跨距作为候选的专业术语；然后，抽取专业术语之间的上下位关系。该模块抽取出的术语间的上下位关系是先序关系判别模块衡量先序关系不对称性的基础。

先序关系判别模块：该模块预测知识主题t_a和t_b之间的先序关系。该模块首先从候选的专业术语集中识别出知识主题的相关术语，然后基于术语间的上下位关系计算知识主题的相关术语集之间先序关系的不对称性。

图3

图3 端到端先序关系挖掘模型框架

4.1 文本中专业术语与上下位关系抽取模块

在衡量先序关系的不对称性时，首先需要识别文本中与特定知识主题相关的专业术语，挖掘每个句子中术语间的上下位关系。将文本描述D中的每一个文本跨距作为候选的专业术语。文本跨距指连续的单词序列，如图4所示，“红”“红黑”“红黑树”均为语句“红黑树是一种自平衡二叉查找树”中的文本跨距。对于文本描述D，每个文本跨距i可用二元组(i_start,i_end)定位，即该文本跨距是从文本描述D中的第i_start个单词开始，到第i_end个单词结束。

该模块包含3个部分：跨距表示、术语评估及上下位关系抽取^[18,28]。其中，跨距表示部分将每个语句中可能的专业术语表示为具有一定语义的跨距词向量；术语评估部分根据跨距词向量的语义表征进一步判定其是否为真正的专业术语；上下位关系抽取部分衡量同一语句中的不同专业术语间是否存在上下位关系。

（1）跨距表示

对于文本中的每个单词，用预训练好的ELMo（embeddings from language model）词向量来表征其高层语义，则文本中每个单词的词向量表示为 ${x_{1}, \dots, x_{t}}$ 。考虑到语句中的上下文信息，本节采用双向长短时记忆（bi-directional long shortterm memory，Bi-LSTM）网络^[29]对文本中的每个语句进行重编码，进一步获得单词t在当前语境下的词向量 $x_{t}^{*}$ 。

任一文本跨距与其所在语句中的很多其他单词存在语义关联^[18]，其中，第一个关联单词称为该文本跨距的语义头单词。文本跨距和其语义头单词之间通常存在上下位关系。为此，本文使用头注意力机制^[18]来预测文本跨距i的语义头单词 ${\hat{x}}_{i}$ 。具体来说：

β_{t} = F F N N_{β} (x_{t}^{*}) (2)

a_{i, t} = \frac{\exp (β_{t})}{\sum_{m = i_{s t a r t}}^{i_{e n d}} \exp (β_{m})} (3)

{\hat{x}}_{i} = \sum_{m = i_{s t a r t}}^{i_{e n d}} α_{i, t} x_{t}^{*} (4)

其中，β_t为单词t的得分，α_i,t为文本跨距i的单词t的概率分布。 $F F N N_{β} (\cdot)$ 表示前馈神经网络。

在获得每个文本跨距的上下文表征以及语义头单词的词向量之后，将它们聚合，以获得最终文本跨距的词向量 $R_{i}$ ：

R_{i} = [x_{i_{s t a r t}}^{*}, x_{i_{e n d}}^{*}, {\hat{x}}_{i}] (5)

（2）术语评估

在对每个文本跨距进行语义表征后，需要准确判断该文本跨距是否为专业术语，以达到识别专业术语间是否存在上下位关系的目的。考虑到专业术语的单词数一般不会过长，因此过滤文本中长度大于L个单词的文本跨距。对于剩余的文本跨距i，根据式（6）估算其属于专业术语的得分值g(i)。

图4

图4 文本跨距实例

g (i) = W_{m} F F N N_{m} (R_{i}) (6)

其中， $W_{m}$ 表示学习的权重矩阵，FFNN_m(⋅)表示前馈神经网络，m表示术语评估模块。为使本文端到端先序关系抽取模型更加关注有价值的文本跨距，对术语得分值g(i)从高到低进行排序，选取得分高的前λT个文本跨距作为专业术语，记作Y={i:g(i)≥ε}，其中，ε表示第λT个术语得分值，λ为保留的文本跨距的比例，T为文本描述D中包含的单词个数。

（3）上下位关系抽取

给定文本描述D中的任一语句，对于该语句中的文本跨距对(i,j)，当i∈Y且j∈Y时，文本跨距i与j都被判定为专业术语。在此基础上，通过计算文本跨距对(i,j)的函数值r(i,j)来判定是否存在上下位关系，具体如下：

r (i, j) = W_{r} \cdot F F N N_{r} ([R_{i}, R_{j}, R_{i} \cdot R_{j}]) (7)

其中， $W_{r}$ 表示权重参数矩阵，FFNN_r()⋅表示前馈神经网络，r表示属于上下位关系抽取模块。通常，上下位关系只存在于有一定语义关联的专业术语之间，且与某一术语存在上下位关系的其他术语是有限的。为此，在计算上下位关系得分r(i,j)时，考虑了两个专业术语特征向量间的语义相似性 $R_{i} \cdot R_{j}$ （其中，⋅表示两个向量的点乘操作）。同时，对于语句中的任一文本跨距i来说，最多考虑K个在当前语句中与其具有上下位关系的专业术语。

4.2 先序关系判别模块

对于知识主题对(t_a,t_b)，该模块首先从文本D中识别出的专业术语集Y中选取出知识主题t_a、t_b的相关术语，然后进一步根据相关术语间的上下位关系来判断t_a、t_b之间是否存在先序关系。

知识主题的相关术语选取：将知识主题t_a表征为知识主题词向量 $R_{t_{a}}$ 。基于相似函数s(t_a,i)来衡量知识主题t_a与文本中任意专业术语i之间的相似性。使用曼哈顿相似性定义的相似函数s(t_a,i)，如下：

s (t_{a}, i) = | R_{t_{a}} - R_{i} | (8)

当相似函数值s(t_a,i)大于相似阈值θ时，知识主题t_a与专业术语i相关。同理，使用相似函数s(t_b,i)选取与知识主题t_b相关的专业术语。

权重策略：不同的相关术语在计算知识主题间先序关系的不对称性时具有不同的作用。为此，使用权重函数衡量不同相关术语在计算知识主题间不对称性的重要性。提出以下两种不同的权重策略。

● 相同权重：当术语与知识主题相关时，所有相关术语具有相同的重要性。权重策略w_e(t_a,i)定义为：

w_{e} (t_{a}, i) = {\begin{cases} 0, s (t_{a}, i) ＜ θ \\ s (t_{a}, i), s (t_{a}, i) \geq θ \end{cases} (9)

● 不同权重：在衡量知识主题对之间先序关系的不对称性时，给予不同相关术语不同的重要性。术语与知识主题越相似，则该术语对知识主题越重要。使用相似函数s(t_a,i)衡量相关术语对知识主题的重要性w_d(t_a,i)：

w_{d} (t_{a}, i) = {\begin{cases} 0, s (t_{a}, i) ＜ θ \\ s (t_{a}, i), s (t_{a}, i) \geq θ \end{cases} (10)

不对称性计算：知识主题的相关术语集之间的先序关系是不对称的，该模块根据相关术语集之间上下位关系指向的差异来衡量知识主题之间的先序关系。提出不对称性函数f(t_a,t_b)，以衡量先序关系指向的不对称性。

f_{t_{a}} = \frac{\sum_{i = 1}^{K} r (i, j) \cdot w (t_{a}, i) \cdot w (t_{a}, j) \cdot g (j)}{\sum_{i = 1}^{K} w (t_{a}, i) \cdot g (i) \cdot w (t_{a}, j) \cdot g (j)} (11)

f_{t_{b}} = \frac{\sum_{i = 1}^{K} r (i, j) \cdot w (t_{a}, i) \cdot w (t_{a}, j) \cdot g (j)}{\sum_{i = 1}^{K} w (t_{a}, i) \cdot g (i) \cdot w (t_{a}, j) \cdot g (j)} (12)

f (t_{a}, t_{b}) = f_{t_{a}} - f_{t_{b}} (13)

其中，j为与文本跨距i具有上下位关系的文本跨距。 $f_{t_{a}}$ 用于计算知识主题t_a先于知识主题t_b学习的概率，即t_a是t_b的先序的概率。 $f_{t_{b}}$ 用于计算知识主题t_b先于知识主题t_a学习的概率，即t_b是t_a的先序的概率。不对称性函数f(t_a,t_b)用于衡量t_a的大多数相关术语是否为t_b的相关术语的先序，即t_a和t_b之间是否存在先序关系的不对称性。因此不对称性函数f(t_a,t_b)用于计算t_a和t_b之间存在先序关系的概率。

4.3 损失函数

由于先序关系的稀疏性，正例先序关系的数量远小于候选知识主题对的数量。本文使用了交叉熵损失函数L(t_a,t_b)，使得本文提出的端到端先序关系抽取模型更加关注正例先序关系。

L (t_{a}, t_{b}) = - W_{p o s} u (t_{a}, t_{b}) \log \hat{u} (t_{a}, t_{b}) -

(1 - u (t_{a}, t_{b})) \log (1 - \hat{u} (t_{a}, t_{b})) (14)

其中， $W_{p o s}$ 是正例先序关系样本的权重矩阵，u(t_a,t_b)是知识主题对(t_a,t_b)的真实先序关系标签， $\hat{u} (t_{a}, t_{b}) = s i g m o i d (f (t_{a}, t_{b}))$ 为模型预测的知识主题对(t_a,t_b)的先序关系。当t_a是t_b的先序时，u(t_a,t_b)=1。

该模型优化了损失函数L(t_a,t_b)，使得模型可以更加准确地识别相关术语及抽取术语间的上下位关系。

5 实验与分析

5.1 实验数据集

本文在CrowdComp数据集上进行实验，以验证本文所提端到端先序关系抽取模型的有效性。CrowdComp数据集包含5个不同领域的先序关系数据（见表1）。在该数据集中，每对知识主题对(t_a,t_b)的先序关系有4种可能：t_a是t_b的先序；t_b是t_a的先序；知识主题t_a与t_b不相关；知识主题t_a与t_b间的先序关系未知。本实验将第一类先序关系作为知识主题对先序关系的正例数据，其他类作为先序关系的负例数据，并使用留一法验证本文方法在不同领域的实验效果。

在该数据集中，每个知识主题对应一个维基百科页面。本文将每个知识主题的维基百科页面中的文本内容作为知识主题的描述文本D。

5.2 模型参数

经过多次实验发现，以下参数取得了最优效果：使用1 024维ELMo词向量以及8维卷积神经网络（convolutional neural network，CNN）词向量。前馈神经网络FFNN(⋅)为两层的神经网络。有效文本跨距的最大长度L=15，且λ=0.4。每个知识主题的描述文本中，最多包含K=50个上下位关系。知识主题的相关术语相似性阈值θ=0.3，先序关系判别阈值φ=0.3。

5.3 对比实验

选取CrowdComp数据集上3个经典的先序关系抽取方法作为本文端到端先序关系抽取模型的对比方法。实验结果见表2。

表1 CrowdComp数据集

领域	知识主题对数量/个	先序关系对数量/个
减数分裂	400	67
公钥加密	200	27
平行假设	200	25
牛顿定律	400	44
全球变暖	400	43

新窗口打开| 下载CSV

表2 对比实验结果（准确率）

领域	MaxEnt	RefD	MLP	端到端模型
领域	MaxEnt	RefD	MLP	相同权重策略	不同权重策略
减数分裂	51.0%	55.7%	79.0%	65.7%	77.12%
公钥加密	67.1%	57.7%	58.0%	72.4%	85.93%
平行假设	64.7%	67.9%	85.0%	51.7%	80.79%
牛顿定律	53.9%	64.6%	68.0%	45.5%	86.99%
全球变暖	56.8%	60.1%	82.0%	33.5%	84.26%
平均	58.7%	61.2%	74.4%	53.8%	83.02%

新窗口打开| 下载CSV

● 最大熵（maximum entropy， MaxEnt）^[13]方法是第一个在CrowdComp数据集上挖掘先序关系的方法。它同时考虑了基于图的特征以及基于文本的特征，如PageRank分值、编辑历史信息、超链接信息以及概念的长度等。使用最大熵分类器识别概念对的先序关系。

● RefD^[1]方法是一种仅根据引用信息衡量先序关系的方法。引用信息即页面中存在的超链接或者页面中提及的另一专业术语。RefD方法首先根据标题匹配的规则获得知识主题的相关术语；然后，通过衡量知识主题的相关术语集之间引用的差异，判断主题之间的先序关系。实验证明，该单一的衡量规则可以简单有效地衡量出概念间的先序关系。

● 多层感知机（multilayer perceptron， MLP）^[16]方法从文本资源中抽取全面的特征以识别先序关系。它从维基百科的3个层次（文本、超链接、目录）分别提取特征，如文本中概念出现的次数、概念间存在超链接的数量、概念间是否存在目录层级关系等；并使用所提出的特征训练分类器有效识别出概念间的先序关系。

表2中，加粗字体表示该领域最优先序关系挖掘性能。本文提出的使用不同权重策略的端到端模型在平均性能上最优，且在不同领域的性能差异较小。详细分析如下。

使用不同权重策略的端到端模型的平均性能较使用相同权重策略的端到端模型提高了29.22%。在衡量相关术语集之间先序关系的不对称性时，相同权重策略赋予每个相关术语相同的权重。而不同的相关术语对知识主题的重要性不同，因此在不对称性衡量中的影响也不同。当赋予弱相关的相关术语与紧密联系的相关术语相同的权重时，将导致最终的先序关系结果产生偏差。不同权重策略则赋予不同相关术语不同的权重，使得紧密联系的相关术语在判断先序关系结果时产生较大的影响。因此，不同权重策略使得端到端模型更关注可体现知识主题间先序关系的术语之间的关系，有助于端到端模型更加准确地计算各术语间关系对衡量先序关系不对称性的重要性，进而使得端到端模型取得更优的性能。

显然，基于不同权重策略的端到端模型的性能优于对比方法RefD。端到端模型与RefD均通过衡量知识主题的相关术语集之间互相引用的差异来预测知识主题间的先序关系。端到端模型和RefD的性能差异主要由以下两个原因引起。

● RefD将超链接等引用信息作为计算知识主题相关术语间先序关系差异的依据，而端到端模型将从文本中挖掘的相关术语间的上下位关系作为判断知识主题相关术语间先序关系的依据。超链接等引用信息不能反映知识主题间的先序关系，仅能体现知识主题间存在某种联系。因此，超链接不能作为判断知识主题间先序关系的依据，甚至可能导致错误判断先序关系。而端到端模型使用的文本中专业术语之间有向的上下位关系则是判断知识主题间先序关系不对称性的有力证据，其正确反映了知识主题间的不对称性。因此，端到端模型中挖掘的文本中术语间的上下位关系有力支撑了对知识主题间先序关系不对称性的计算。

● Ref D使用流线型的方式挖掘先序关系。其将知识主题的相关术语的确定以及相关术语集之间引用的差异视为两个独立的模块进行。RefD直接确定知识主题的相关术语，并且不在后序计算过程中对相关术语进行优化，即错误识别的相关术语不会被改正，该方法会造成错误的累积。端到端模型将整个先序关系挖掘过程视为一个整体，模型可根据最终预测出的先序关系与真实标签之间的偏差调整对文本中术语的检测以及术语间上下位关系抽取的正确性。即端到端模型通过不断地迭代学习，可以更准确地识别文本中的术语及术语间的上下位关系，并为计算先序关系的不对称性提供了有力的证据。因此，端到端模型的性能优于RefD。

本文所提的基于不同权重策略的端到端模型的性能优于MaxEnt和MLP。MaxEnt和MLP均根据大量的从结构化信息中提取的与先序关系直接相关的特征来预测先序关系。结构化信息在不同的学习资源中是不易获得的。而本节所提的端到端模型仅将知识主题的文本信息作为输入，使得端到端模型被广泛应用到更多的领域中。表2中，MLP方法在平行假设领域的性能高于端到端模型。对平行假设领域的数据集进行分析，该领域在维基百科上存在丰富的结构化信息，而MLP方法基于从维基百科中提取的综合的特征，获得了全面的信息，并表现出很好的性能。虽然端到端模型在该领域的性能稍差于MLP方法，但是在平均性能上优于MLP方法。MLP方法中的特征需由领域专家构建，该特征构建过程耗时且领域通用性差。而端到端模型并不使用人工提取的特征，具有更优异的性能。

5.4 相似函数对模型的影响

由于相似函数会影响相关术语以及权重策略的确定，本文进行了对比实验，以验证不同相似函数对模型效果的影响，即在使用不同权重策略的端到端模型上，探究不同相似函数对模型效果的影响。使用余弦相似函数和欧几里得相似函数进行对比实验。

图5为在CrowdComp数据集上使用不同相似函数的模型的实验结果。端到端模型使用不同相似函数对模型效果影响较小，这表明先序关系判别模块可稳定地判别知识主题间是否存在先序关系，该模块具有鲁棒性。在精确率和召回率上，不同相似函数可能降低正例先序关系对被正确预测的概率。不同的相似函数会影响先序关系判别模块正确地识别知识主题的相关术语，使得该模块在计算先序关系的不对称性时产生偏差，最后影响本文端到端模型的先序关系挖掘效果。当相似函数可准确识别出知识主题的相关术语时，本文所提的端到端模型可取得优异的性能。

6 结束语

本文对先序关系数据集进行分析，并发现了先序关系的不对称性特征。基于先序关系的不对称性，本文提出一种从文本中挖掘知识主题间先序关系的端到端模型。该模型包含两个模块，文本中专业术语与上下位关系抽取模块和先序关系判别模块。文本中专业术语与上下位关系抽取模块挖掘文本中专业术语间的上下位关系，上下位关系是一类有向的学习依赖关系。先序关系判别模块在上下位关系的基础上，识别知识主题的相关术语，并计算知识主题的相关术语集间先序关系的不对称性，从而预测知识主题间的先序关系。在CrowdComp数据集上进行实验，并验证了本文所提端到端模型的性能，相比于其他算法，本文所提方法取得了最优的性能。

图5

图5 不同相似函数在不同领域的实验结果

由于部分专业术语间的先序关系需进行跨句子的关系推理才可得出，而本文仅考虑了单一句子中存在的专业术语间先序关系。因此在未来的工作中，需进一步考虑跨句子的专业术语间先序关系，为知识主题间先序关系判断提供更多更有利的关系依据，从而更准确地挖掘知识主题间的先序关系。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

LIANG

, WU

, HUANG

,et al.

Measuring prerequisite relations among concepts

[C]// 2015 Conference on Empirical Methods in Natural Language Processing. Stroudsburg:ACL Press, 2015: 1668-1674.

[本文引用: 7]

[2]

WILEY

D A

Learning object design and sequencing theory

[D]. Provo:Brigham Young University, 2000.

[3]

ZHU

, TIAN

, WU

,et al.

A multiconstraint learning path recommendation algorithm based on knowledge map

[J]. Knowledge-Based Systems, 2018,143: 102-114.

[4]

AGRAWAL

, GOLSHAN

, PAPALEXAKIS

Toward data-driven design of educational courses:a feasibility study

[J]. Journal of Educational Data Mining, 2016,8(1): 1-21.

[5]

CHEN

, LU

, ZHENG

V W

,et al.

Prerequisite-driven deep knowledge tracing

[C]// 2018 IEEE International Conference on Data Mining (ICDM). Piscataway:IEEE Press, 2018: 39-48.

[6]

LYU

, WANG

, XU

,et al.

Utilizing knowledge graph and student testing behavior data for personalized exercise recommendation

[C]// ACM Turing Celebration Conference-China. New York:ACM Press, 2018: 53-59.

[7]

CHEN

, LAN

A S

, CAO

,et al.

Behavioral analysis at scale:learning course prerequisite structures from learner click streams

[C]// The 11th International Conference on Educational Data Mining.[S.l.:s.n. ], 2018: 66-75.

[本文引用: 5]

[8]

ALSAAN

, BOUGHOULA

, GEIGLE

,et al.

Mining MOOC lecture transcripts to construct concept dependency graphs

[C]// The 11th International Conference on Educational Data Mining.[S.l.:s.n. ], 2018: 467-473.

[9]

CHAPLOT

D S

, YANG

, CARBONELL

,et al.

Data-driven automated induction of prerequisite structure graphs

[C]// The 9th International Conference on Educational Data Mining.[S.l.:s.n. ], 2016: 318-321.

[本文引用: 3]

[10]

PIECH

, BASSEN

, HUANG

,et al.

Deep knowledge tracing

[C]// Advances in Neural Information Processing Systems. Cambridge:MIT Press, 2015: 505-513.

[11]

MEDIO C

, GASPARETTI

, LIMONGELLI

,et al.

Automatic extraction and sequencing of Wikipedia pages for smart course building

[C]// 2017 21st International Conference Information Visualisation (IV). Piscataway:IEEE Press, 2017: 378-383.

[本文引用: 3]

[12]

LIANG

, YE

, WANG

,et al.

Investigating active learning for concept prerequisite learning

[C]// The 32nd AAAI Conference on Artificial Intelligence. Menlo Park:AAAI Press, 2018: 7913-7919.

[13]

TALUKDAR

, COHEN

Crowdsourced comprehension:predicting prerequisite structure in Wikipedia

[C]// The 7th Workshop on Building Educational Applications Using NLP. Stroudsburg:ACL Press, 2012: 307-315.

[本文引用: 6]

[14]

UPADHYAY

, BINDAL

, KUMAR

,et al.

Construction and applications of TeKnowbase:a knowledge base of computer science concepts

[C]// The Web Conference 2018. Canton of Geneva:International World Wide Web Conferences Steering Committee, 2018: 1023-1030.

[本文引用: 3]

[15]

WANG

, ORORBIA

, WU

,et al.

Using prerequisites to extract concept maps from textbooks

[C]// The 25th ACM International Conference on Information and Knowledge Management. New York:ACM Press, 2016: 317-326.

[16]

GASPARETTI

, DE

MEDIO C

, LIMONGELLI

,et al.

Prerequisites between learning objects:automatic extraction based on a machine learning approach

[J]. Telematics and Informatics, 2018,35(3): 595-610.

[本文引用: 5]

[17]

MANRIQUE

, .

Towards automatic learning content sequence via linked open data

[C]// The International Conference on Web Intelligence. New York:ACM Press, 2017: 1230-1233.

[18]

LEE

, HE

, LEWIS

,et al.

End-toend neural coreference resolution

[C]// The 2017 Conference on Empirical Methods in Natural Language Processing. Stroudsburg:ACL Press, 2017: 188-197.

[19]

, LIU

, LI

,et al.

Jointly optimized neural coreference resolution with mutual attention

[C]// The 13th International Conference on Web Search and Data Mining. New York:ACM Press, 2020: 402-410.

[20]

VUONG

, NIXON

, TOWLE

A method for finding prerequisites within a curriculum

[C]// The 4th International Conference on Educational Data Mining.[S.l.:s.n]. 2011: 211-216.

[21]

LIANG

, YE

, WU

,et al.

Recovering concept prerequisite relations from university course dependencies

[C]// The 31st AAAI Conference on Artificial Intelligence. Menlo Park:AAAI Press, 2017: 4786-4791.

[22]

ROY

, MADHYASTHA

, LAWRENCE

,et al.

Inferring concept prerequisite relations from online educational resources

[C]// The 33rd AAAI Conference on Artificial Intelligence. Menlo Park:AAAI Press, 2019: 9589-9594.

[23]

LIU

, JIANG

, WU

,et al.

Mining learning-dependency between knowledge units from text

[J]. The VLDB Journal, 2011,20(3): 335-345.

[本文引用: 2]

[24]

ADORNI

, DELL’ORLETTA

, KOCEVA

,et al.

Extracting dependency relations from digital learning content

[C]// Italian Research Conference on Digital Libraries. Heidelberg:Springer, 2018: 114-119.

[本文引用: 2]

[25]

NAFA

, KHAN

J I

, OTHMAN

,et al.

Mining cognitive skills levels of knowledge units in text using graph tringluarity mining

[C]// 2016 IEEE/WIC/ACM International Conference on Web Intelligence Workshops (WIW). Piscataway:IEEE Press, 2016: 1-4.

[26]

MIASCHI

, ALZETTA

, CARDILLO

F A

,et al.

Linguistically-driven strategy for concept prerequisites learning on Italian

[C]// The 14th Workshop on Innovative Use of NLP for Building Educational Applications. Stroudsburg:ACL Press, 2019: 285-295.

[27]

FILLMORE

C J

Frame semantics

[J]. Cognitive Linguistics:Basic Readings, 2006,34: 373-400.

[28]

LEE

, HE

, ZETTLEMOYER

Higher-order coreference resolution with coarse-to-fine inference

[C]// The 2018 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies,Volume 2 (Short Papers). Stroudsburg:ACL Press, 2018: 687-692.

[29]

HOCHREITER

, SCHMIDHUBER

Long short-term memory

[J]. Neural Computation, 1997,9(8): 1735-1780.