您的当前位置:首页基于知识图谱及案例推理的MOOC资源推荐算法研究

基于知识图谱及案例推理的MOOC资源推荐算法研究

2022-08-27 来源:乌哈旅游
第29卷第1期 2018年1月 陇东学院学报 Journal of Longdong University Vo1.29 No.1 Jan.2018 文章编号:1674.1730(2018)01-0010-04 基于知识图谱及案例推理的MOOC资源 推荐算法研究 门 瑞,杨芳萍 (陇东学院信息工程学院,甘肃庆阳745000) 摘要:在对各种推荐算法分析研究的基础上,经过多次试验,得出适合MOOC资源的推荐算法,实现了较 好的推荐效果。对于使用过MOOC资源的用户,根据其历史记录,查找已使用资源在知识图谱中的位置, 推荐满足个性化需求的后续资源;对于未使用过MOOC资源的用户,根据其选定的知识领域,利用基于案 例推理的推荐算法,在案例库中查找相同或相似度最高的案例,根据案例中用户的选择,为其推荐最优的 资源。此算法解决了国内MOOC平台中存在的没有推荐模块或推荐结果不合理的问题,在某实验平台上 取得了良好的推荐效果。 关键词:知识图谱;案例推理;慕课资源;推荐算法 中图分类号:TP311 文献标识码:A Research on the Algorithm of MooC Recommendation Based on Knowledge Map and Case-based Reasoning MEN Rui,YANG Fang-ping (College ofInformation and Engineering,Longdong University,Qingyang 745000,Gansu) Abstract:Based on the analyses research of several recommendation algorithms and experiments,this pa· per finds out an algorithm which works effectively on recommendation of MOOC resources.In detail,for those who used to access MOOC resources,the algorithm checks their location on the knowledge map ac- cording to their history records and recommends them resources which meet their personalized require— ments.For those who do not have access history,according to the knowledge area they choose,the algo— rithm firstly applies a case—based reasoning to find the most analogical case and then based on the choices of the user ̄in the case,recommends them the best resources.Generally,the algorithm solves the prob- lem that the most MOOC platforms do not have recommendation module or unreasonable module,and gets good recommendation effects on an experimental platform. Key words:knowledge map;case based reasoning;MOOC;recommendation 随着MOOC资源数量的急剧增加,帮助用户迅 强的MOOC资源,再回到推荐模块后,推荐的是与一 速找到适合自己的MOOC资源已经成为一件非常有 开始完全相同的6门MOOC,这种推荐不能满足用 意义的事情,而国内外众多的MOOC平台尚未很好 户的个性化需求。开发适合MOOC资源特点的推荐 地解决这一问题…。笔者实地试用了国内某慕课平 系统将更好地推动这种教育形式的发展。 台,进入主页后,点击推荐模块,为笔者推荐了6门 推荐算法的本质是通过挖掘用户与项目之间的 MOOC,并且提示注册登录后会有更好的推荐,于是 二元关系,帮助用户从海量数据中便捷发现其感兴 笔者注册登录,且有选择性地观看了一类专业性较 趣的对象,并生成个性化推荐列表以满足其兴趣偏 收稿日期:2017-09-07 基金项目:甘肃省教育科学‘十三五’规划2016年度《基于云计算的甘肃省高校教学资源共享及推荐平台研究 (GS[2016]GHBZ021) 作者简介:门瑞(1987一),女,甘肃宁县人,讲师,硕士,主要从事推荐算法的应用研究。 第1期 门 瑞等:基于知识图谱及案例推理的M00C资源推荐算法研究 好。传统的推荐算法主要可以分为3大类:基于内 计、操作系统、数据库原理、计算机网络、JSP程序设 容的推荐算法、协同过滤推荐算法以及混合推荐算 计、软件工程和编译原理,根据这些课程之间的先后 法。这些传统推荐算法重点考虑用户与项目之间的 次序如图1所示。 二元关系,大都可以转化为评分预测问题,根据用户 如果用户在MOOC平台中学习了c语言程序设 对项目的评分进行排序后产生推荐列表 。Adoma— 计课程和计算机导论课程,根据图1中所展示的课 vicius等人给出了推荐算法的形式化定义:假定用户 程之间的先后关系,可以为其推荐数据结构这门课 集合用C表示,S表示需要推荐给用户的项目集合, 程的MOOC资源,以供其继续学习后续课程之用。 U是一个效用函数用以计算项目s对用户C的相关 以此类推,根据其他专业课程之间的先后关系,构建 程度,计算过程表示为U:C×S—R,其中,R为排序 后的项目集合。推荐算法的目标在于找到最终的项 目列表,使得效用函数U()取得最大值 J。用户的 最大效用函数值的项目用.s 来表示,即: Vc∈C,s =arg maxu(c,s) dcu 1相关技术研究 1.1基于知识图谱的推荐算法 基于知识图谱的推荐算法,利用在特定领域制 定的规则进行基于规则和实例的推理,并根据推理 结果生成推荐 J。其中,规则的获取与推断、规则知 识库的构建等是基于知识的推荐技术的关键所在。 基于知识图谱的推荐算法能够很好地解决其他推荐 算法存在的新用户的冷启动问题和打分矩阵过于稀 疏等问题,由此提高推荐结果的可解释性 ]。 图1计算机专业课程先后关系图 MOOC本质是一种课程资源,课程资源之间的 关系和知识图谱间有天然的联系,即相同领域的课 程资源之间存在较为稳定的先后关系,这种先后关 系可以通过高校的培养计划或其他相关教学文件而 得出。以计算机科学与技术专业为例,国内大部分 高校均开设此专业,为了兼顾不同水平的用户,收集 整理了国内顶尖高校、重点高校、普通高校和地方院 校各个层次的计算机科学与技术专业本科阶段专业 课程,统计得出开设院校较多的14门课程,分别是c 语言程序设计、计算机导论、离散数学、模拟电路、数 字电路、数据结构、计算机组成原理、算法分析与设 对应的知识图谱,实现资源的个性化推荐。 1.2基于案例推理的推荐算法 基于案例推理的核心是通过对以前解决问题的 方法的修改或使用,来解决现在的问题 J。这种算 法依赖于推荐系统中对于项目的描述,然而,基于案 例推理的推荐系统和其他的基于内容的推荐系统不 同的是,它需要项目的良好结构和对于项目的详细 描述 。大多数基于案例的推荐系统都将问题的陈 述和解决方法作为案例,以构建案例库。每一个案 例都包含两部分,问题的详细描述和解决方法,当遇 到一个新的问题时,试图从案例库里检索相似的问 题的解决方法,用旧问题的方法尝试去解决新问 题 。这种思想很适合于MOOC资源的推荐。 2 M00C推荐算法 本文的慕课推荐算法结合基于知识图谱和基于 案例推理的推荐算法的优点进行计算,首先将用户 分为两类,一类为已经完整的使用过某一个MOOC 资源,另一类为从未使用过MOOC资源。然后,对于 已使用过MOOC资源的用户,从知识图谱里提取用 户已学习的课程所在领域内的后续课程,如果资源 数量小于5门,则不进行排序,直接呈现在页面上; 如果资源数量大于5,则使用基于案例推理的推荐算 法对后续课程进行计算,根据其相似程度的排序,对 前5门课程资源进行推荐;对于未使用过资源的用 户,根据其注册时填写的问卷,使用基于案例推理的 推荐算法,对其进行推荐。 2.1知识图谱的构建和更新 知识图谱的构建是整个推荐算法能否成功的关 键步骤,包括培养计划的获取,由培养计划得到课程 之间的先后次序,以此建立知识图谱。另外,由于新 的专业和领域不断出现,还要定时更新知识图谱,以 便能更全面地实施MOOC资源的推荐。 2.1.1原始文件的获取 一般来说,各个高校的培养计划是公开的,获取 渠道畅通,且各个学校之间的相同专业的培养方案 12 陇东学院学报 第29卷 差异不是太大,因此,一个专业选取3—4个高校的 3实验及结果分析 培养方案基本可以确定课程种类及先后关系。根据 3.1推荐系统的评价标准 《专业分类》决定专业总数,获取各个专业的3—4个 可以根据推荐列表中待推荐MOOC资源的得分 培养方案的word文档用于后续分析。 2.1.2课程先后关系排序表 与实际用户给MOOC资源的打分间的偏差来衡量推 荐算法的好坏。目前主要的效用评价标准有准确率 根据培养方案中各门课程的开课学期大致可确 (precision)、召回率(recal1)、NDCG(normalized dis— 定课程之间的先后次序,但对于课程之间是否有确 counted cumulative gain)、MAE(mean absolute error) 定的先后关系,从文件中不能直接得出,需请相关专 等¨卜 ],本文中主要通过分析准确率、召回率和绝 家确定,而这相对来说是一个争议较少的问题,因此 一个专业邀请两名专家即可得到课程先后关系排 序表。 2.1.3构造知识图谱 根据各个专业的课程先后关系排序表,即可构 造知识图谱,可以是表的形式,也可以是图的形式, 本文选择构造图形式的知识图谱,因为这种结构的 知识图谱能直观展示课程之间的关系,逻辑清楚,修 改方便。 2.1.4知识图谱的更新 当出现新的专业时,需要对知识图谱进行更新, 更新方法是构造新专业的知识图谱,并加入到原有 的知识图谱中去 J。另外,随着旧专业的发展,课程 类型和先后次序有可能也会发生变化,采取定期更 新和不定期更新相结合的方法,定期检查对照知识 图谱和最新培养方案,若有差异,进行更新,而当有 新专业的培养方案发布时,立即进行更新,即不定期 更新。 2.2案例库的构建和更新 基于案例推理的推荐算法主要包含3个方面的 技术:案例描述、案例对比、案例重利用。新用户在 进行平台注册时需要填写一份问卷调查,包括本人 所学专业、对于课程的偏好、观看过的MOOC资源和 对相关慕课资源的评价,这些作为案例描述时的条 件选项,而用户在后续使用平台时,有选择性地观看 某些MOOC资源,这些选中的资源作为案例描述中 的结果选项,将这种因果关系作为案例存储在案例 库中。当需要为新用户推荐MOOC资源时,将此用 户的问卷调查和案例库中所有案例的条件描述进行 对比,选取相似度最高的前5个项,将这5个案例中 用户的选择结果即结果选项推荐给新用户。用户浏 览推荐结果,将最终的选择作为新的案例描述,更新 案例库。随着系统的使用,案例库中案例的数量越 来越多,推荐的精度会提高,推荐效率降低,可以采 用概率的方法进行案例的分类以降低推荐算法的计 算时间 。。。 对平均误差标准来检验系统的效用。 准确率/召回率来评测推荐算法的精度 , 见公式(2)、(3)。其中,对用户U推荐N个物品的 集合记为R(U),而u在测试集上喜欢的物品集合为 T(u)。 ∑I R(u)n ( )l 加一— 一 ∑l ( )n (M)l rerall=— —————————————————————一 f 3、 ∑I』 一、 I( )I_f, I 一 为了说明准确率和召回率的计算方法,需要将 待推荐的所有MOOC资源进行分类,如表1所示: 表1 系统中的MOOC资源分类 准确率(Precision)。在MOOC资源推荐系统 中,准确率定义为系统的推荐列表中用户认可的 MOOC资源与所有被推荐资源的比率,表示用户对 一个被推荐资源感兴趣的可能性_1 。公式如(4) 所示: P= Nyy (4) +召回率(Recal1)。在MOOC资源推荐系统中, 召回率定义为推荐列表中用户认可的MOOC资源与 系统中所有用户认可的总数的比率,表示用户认可 的资源被推荐的概率。如公式(5)所示: Ip—一 Nvv+Nny , 、 绝对平均误差是预测准确度的又一个经典度量 方法,此标准用来衡量推荐系统的预测打分值和用 户实际打分值之间的平均绝对偏差 J。同样地,设 测试集中项目个数为N,这时实验的目的是让推荐 系统预测某个用户对测试集中这些项目的打分值并 检查误差,设推荐系统对项目i的预测打分为Pi,实 1期 J瑞等:基于知识 埂案例推 的MOOC资源推荐算法研究  3【_ 佑镁,叶爱敏,赖义华.MOOC何 ¨从—— 际J1j 打分为r.,则绝对 均误差计算公式为公式 1(6)所乐: 、 于 识图谱的图『人J研究热点分析l Jj.1II…} 化辙 育,2015(7):12—18. ∑P 一ri J l 1 4 lf午J、 饷. 矢¨ 推荐服务的消费者n 物决 (6) 策研究[D].南京:南京 ] 火学硕 20I2:6一I5. :f 沦义, 3.2推荐结果及分析 1 5 j徐进.块十知 情景的项 研究[D].成鄙:两 文,20I5. 表永’j推 力‘法 I : 沦 在 M()()c平台卜验l 小文提{l{的推荐算法, 住未使用推荐算法时,使用前和使f_fj后推荐的为蚓 0比课程资源, 台rl|的推荐结果戡图如图2所爪: 推荐课 交通人学倾[6]Fatilla Bousbahi,He,.1a Chorfi.MOOC一 A Ca Based Re ̄·OlⅢlltⅢ(1 r Syslet11 fo,’MOOCs l J¨. 【I(‘t 一 dia—Soc-ial an(1 Behavioral Seiene.es.2015(195):I 813 l 822. 【7]谭红I1 一文剑,李始.计算思维和M()t)(: 念卜 王阳明 tL,学:认识阳微观化学世界 高山滑雪 明学来探险你的人, 2839人864人 的汁算机导沦课俘l J J.汁算机教育.2()15(15):46 324人 49. 『8]战德臣,聂 顺.计算思维 _人学计算饥 改- 图2 原推荐结果页面截图 的 本思路¨J].叶1闻人学教学,2013f 2):56—60. 『9] 柑,潘星,李静,等.基于案例推理的 IIjl僻 俗 if=IJ系统[I『].清华大学学报(自然科 :版),2006 (46):990—995. 在该平台巾使用本文提出的基于知识 谱及案 例推理的MOOC资源推荐算法后,能为用 推荐满 足个性化需求的MOOC资源 某用户注册并学习_r [10 J姜丽红,徐博艺.席俊红.基于案例推 的过滤斡: C语占程序没 课程后的系统自动为该用户推荐相 法及智能信息推荐系统l J].清华大学学报(f't然 天课程,敲图如图3所示 推荐课程 科学版),2006(46):1074—1077. [1 1]艾 ,赵辉.基于知识的推荐系统川』 楚, 擞J 究[J].软件导刊.20l5(3):15一I7. [12]郭K娟,吴森,杜欢,等.MOOC学习抒 ’ : 动机激 发策略研究fII].软什导刊·教育技术.2()15(5):36 数据结构 数据结构 数据结构 37. 1 13]赵旭.个性化视频推荇技术住微课系统I{l的研究 tj_腹川[I)].长存:东北帅范大学顸 :他沦义, 图3 使用推荐算法后推荐页面截图 20I5:8—30. 4结语 俘算法均 r /J, ̄4j MAE,更高的准确率及 牢, [14]孙建凯. 向排序的个性化推荐算法研究 J [I)j.济南:Lj J东大学硕士学位论文,2014:15—32. 各种实验条件相同的情况下,MOOC资源推 [15]胡饮太,林晓儿.【fif rn】社会教育的M()‘)(:s』、 川馍 』 及优化设¨‘研究[J].电化教育研究,2()14(1 1): 30—36. 满足J,』T1 的个悱化需求,取得了较好的推荐效果 . 参考文献: 1] 博.MOOC课 推 系统的设计与实 l 1).】.I,t『 安: 发电f科技大学硕十学位论文,2014:9 【16 l|IUANG Jianbif】,.IUN XuP,FU HIlang,cl a1.Ba ̄’k— Ward I):ath( r()ⅥIll )r Eficientf Mobi h St、(iuenl ial l{ 【 ()I1lI11en【lalit’n. IEEE Transaclions Oli Kll0、 ̄h Il t illltl Dala F;nginee,’ing.2014(1):25—31. 23. {17 赵蔚,姜强,下}】J]娇,等.本体驱动的 (5):84—89. ‘ning :2]藏 71 3. .张 雯,田存岐,等. f排序学 的推 以资源个性化推挣 究[J].中国电化敦fr,2015 【责任编辑朱世广】 法研究综述[j].软什学报,2016,27(3):691 —

因篇幅问题不能全部显示,请点此查看更多更全内容