一个基于网络的智能个性化学习系统的设计与应用
2021-08-16
来源:乌哈旅游
维普资讯 http://www.cqvip.com CN43—1258/TP ISSN i007—130X 计算机工程与科学 COMPUTER ENGINEERING&SCIENCE 2006年第28卷第7期 Vo1.28,No.7,2006 文章编号:i007—130X(2006)07—0103—02 一个基于网络的智能个性化学习系统的设计与应用 Design and Application of a Network—Based Intelligent and Individualized Learning Sys tem 游星雅,杨清 YOU Xing-ya,YANG Qing (湖南科技大学物理学院,湖南湘潭411201) (School of Physics,Hunan University of Science and Technology,Xiangtan 411201,China) 摘要:本文以数据挖掘和机器学习技术为基础,提出了一种基于网络的智能学习系统的基本结构,该系统以学习者 为中心,根据学习者的学习兴趣,为其提供智能的个性化学习平台;通过对系统关键技术的讨论,介绍和分析了学习者个性 化学习兴趣模型建立和个性化学习的基本过程。 Abstract:The fast development of computer and network techniques leads tO the continuous innovations of service mod— els,service environments and service means of library.Based on data mining and machine larnieng,this paper proposes the basic structure of a network-based intelligent learning system,which offers an intelligent learning platform focusing on learners and their learning interests.Through discussing the key techniques of the system,the paper introduces and analy— ses the process of individualized learning and the creation of learning interest models. 关键词:网络学习系统;图书馆;数据挖掘;机器学习 Key words:network learning system;library;data mining;machine learning 中图分类号:TP18 文献标识码:A 它是以计算机网络技术为基础、以多媒体技术为手段的自 1 引言 计算机技术和网络技术的飞速发展对图书馆情报服务 的模式和手段的创新奠定了技术基础。现在,图书馆情报 主学习模式。通过网络,它能实现学生和老师虚拟的face- to-face交流平台L1.2]。 目前,网络学习系统风起云涌,学习资源种类繁多,但 这些系统功能并不令人满意,还有待进一步完善。首先,对 学习者的学习过程缺乏智能化的管理,没有很好地跟踪学 和信息服务的形式包罗万象,正服务于高等院校和其他科 研机构。 基于网络的学习系统的建设和开通也是图书馆服务的 一习者的学习过程,并记录其相关信息以形成学习档案或记 录;其次,网络信息检索方式的非智能化不能很好地适应学 习者兴趣的变化[2]。这样,使学习者在信息的海洋中很难 找到自己真正所需要的信息资源。 本文从图书馆的个性化服务理念人手,提出了一种基于 网络的智能的远程学习系统。该系统是以数据挖掘和机器 学习技术为基础的网络智能学习系统,它根据学习者在系统 个重要方面,它是以现代教育学、认知科学等学科为指 导,充分发挥教育技术学优势,打破传统“教学以教师为中 心、知识获取以课本为中心、学习场所以教室为中心”的知 识继承为主的单一应试教育的被动局面,全面创建IT教学 环境,积极开发多媒体CAI课件和网络课程等IT教学资 源,将现代信息和传播技术融入教学过程中,推进教育创 新,探索信息社会“教学以学生为主体、教师为主导、学生可 以随时随地向IT资源获取知识、具备自学和协作学习能 力、具有终身学习意识”的IT环境下的数字化学习新模式。 中的学习记录,建立学习者个性化的学习兴趣模型;然后以 该模型为基础,实现学习者自主学习、主动学习和远程学习, 根据学习者的学习兴趣,为其提供了智能的个性化学习平 台。该文通过对系统关键技术的讨论,介绍和分析了学习者 ・ 收稿日期:2OO6-03—12;修订日期:20O6一O4—12 作者简介:喜蓉界 妻靠嚣游星雅( 一1育970 叁 《),女,湖南长沙人, ? ,讲师,研究方向为数字图书馆;杨清,博士生,副教授,研究方向为计算机网络和机器 通讯地址:411201湖南省湘潭市湖南科技大学物理学院tTel:(0732)8291081 E-mail:xyyou@hnust.edu.cn Address:School of Physics,Hunan University of Science and Technology,Xiangtan,Hunan 411201,P.R China 103 维普资讯 http://www.cqvip.com 个性化学习兴趣模型建立和个性化学习的基本过程。 接给用户反馈学习者学习资源的同时,也给智能处理中一if, 2 系统的基本结构及特点 2.1系统的基本结构 个性化智能远程学习系统是以网络为基础,跟踪个性 提供用户的个性化学习信息,并为学习者学习个性化模型 的修改提供直接和真实的学习实例,确保了学习模型的准 确性。 3智能处理中心 3.1基本结构 智能处理中心是整个系统的核心部分,它的设计直接 化用户对信息资源的访问记录和内容,建立起用户信息访 问的个性化学习模型,为用户在将来的学习中主动地提供 用户所需要的学习资源。这样解决了用户资源和信息获取 准确度和效率问题,为用户提供了自主学习、主动学习和协 影响整个系统的性能。我们的系统是采用机器学习的方法 作学习的智能远程学习平台。 该系统由数据服务器、智能个性化应用服务器、网络应 用系统平台、用户信息库和信息资源库、用户终端几个部分 组成,详细的结构组成如图1所示【3]。 图1个性化智能学习系统结构 2.2系统组成功能 用户学习访问平台是整个系统的最高层,用户可通过 基本网络设施以Web方式来方便、快捷和透明地获取学习 资源,实现资源的远程访问和信息推送。 网络应用服务系统包括智能学习系统的事务处理逻 辑,实现与相关应用服务器之间的信息交互。首先,它可以 将用户请求的原始数据进行组装,形成XML信息;然后将 这些信息传递给相关应用服务器,应用服务器处理完毕后 以HTML或XML的形式反馈给网络浏览器,显示给用 户E4]。 智能应用服务器包括信息收集器、智能信息处理中心、 信息调度中心几个组成部分,直接为网络应用系统提供相 关的服务,处理以HTML或XML文档组成的用户事务请 求信息。其中,智能个性化应用服务器是该部分的核心。 信息收集器能自动地从用户信息库中收集学习者的相关信 息,主要包括学习者的个人信息、感兴趣的话题、讨论区话 题、经常访问的地址与栏目、访问的时间段等,并将这些信 息传递给智能信息处理中心_3“]。信息处理中心接收到用 户信息后,利用数据挖掘和机器学习技术对学习者信息进 行处理和分析,形成学习者的个性化学习模型,主动为学习 者提供支持。根据学习者的学习模型,信息调度器从信息 资源库中主动搜索、学习与读学习模型一致的学习资源,并 通过网络反馈给学习者。 数据服务器由用户服务器、资源服务器和用户信息数 据库、信息资源数据库组成。用户信息库中记录了用户相 关的信息和相关的个性化学习模型;信息资源数据库记录 了用户对学习资源访问的相关记录;信息资源服务器在直 】04 和数据挖掘技术通过信息过滤来形成学习者的学习兴趣模 型。根据该个性化的学习模型,系统能自动、智能地从资源 信息库搜索学习者的个性化学习资源,自主地实现学习者 的个性化学习[s,63。本文提出的智能处理中心的个性化系 统结构如图2所示_2]。 图2智能处理中心工作过程 3.2工作过程 该模块的工作过程主要分为四个阶段:用户信息的预 处理、分类识别器、用户兴趣模型的形成和用户个性化知识 库的形成E4]。 (1)用户信息的预处理:从用户信息库和信息资源库中 自动搜集和收集用户学习信息,主要包括学习者的个人信 息、感兴趣的话题、讨论区话题、经常访问的地址与栏目、访 问的时间段等,并采用一定的方法对这些信息预处理。 (2)分类识别器:这是整个系统的核心,其性能的好坏 直接影响对用户兴趣信息的识别和获取。常用的算法主要 有KNN分类算法、贝叶斯算法等。 (3)用户兴趣模型的形成:它包括了三个步骤,首先从 知识库中利用一定的算法采集用户训练数据构成用户兴趣 数据集,经过预处理后,将训练数据表示成空间向量,然后 选择一定的技术形成用户兴趣特征向量,最后形成用户的 兴趣模型。 (4)用户兴趣知识库:用户可以通过网络直接浏览通过 该系统自动形成的用户兴趣数据库,同时可对数据库进行 修改和补充,这样也使该用户的兴趣模型得到了修正。 4系统的关键技术 4.1信息的收集和表示 用户学习信息的收集和表示是建立学习者学习模型非 常关键的一部分。收集信息项目内容直接反映学习者的学 (下转第126页) 维普资讯 http://www.cqvip.com ture[,C].2003. [3]Peter Mattsom Imagine Programming System Developer’S 的分类识别方法有贝叶斯分类法、KNN、支持向量机等。 在该系统中,我们采用了最为简单的贝叶斯分类法嘲。 Guide[EB/OL].http://eva.stanford.edu,2002—05. [4] 【I1an Amarasinghe,William Thie ̄Stream Languages and Programming Models-[A].PACT 2003[C].2003. [5]Francois Labonte,Peter Mattson,Ian Bunk,et a1.The Stream Virtual Machine[,A].PACT 2004[C].2004. [6]Saman Amarasinghe,Willim aThies.Stream Architectures [A].PACT 2003[C].2003 [7]Nan Wu,Mei wen,Chunyun aZhang,et a1.Programming esiDgn Patterns for the Imagine Stream Architecture[J]. Journal of Computer Research and Development,2004,41 5结束语 从图书馆的个性化服务理念人手,以数据挖掘和机器 学习技术为基础,针对目前学习资源丰富多样但缺乏智能 化管理的网络学习系统,本文提出了一种自动跟踪学习者 学习记录和学习过程的智能化远程学习系统。通过对系统 结构的详细介绍,分析和讨论了学习者学习兴趣模型建立 的基本过程和关键技术。该系统能依据学习者相关的学习 (1O):328—333. [8]Peter Mattson.A Programming Systme for the Iamgine Media Processor.[Ph D Thesis][-D].Department of Eleetri— acl Engineering,Stanford University,2001. [9]TI Company.Reed Solomon Decoder:TMS320C54x Imple— mentation[,R].Application Report,2000. [1O]PACT 2003 Tutorial,Architectures,Languages,and oCm— pilers for the Straeming Domain[EB/OL].http://catfish. csail.mit.edu/streamit/talks/pact03tutorial/,2003—09. [11]Reed oSlomon Decoder[EWOL].http://www.1atera1.0orn, 20o2一l】. (上接第104页) 习兴趣,代表学习者的学习个性。如何从他们的学习记录 中发现学习者个人的个性化知识和建立个性化的学习模型 是我们要解决的主要问题[7]。 智能学习方法主要有基于关键词的学习和字典学 习[3]。关键词学习方法是对学习者在学习系统中留下的学 习记录信息进行处理,将信息表示成关键词的集合;然后可 以根据词频信息来确定表征信息体的关键词,并具有相同 表征关键词的信息聚类。在字典学习方法中,对每个学习 者都维护一个动态的、个性化的学习字典;只有当关键词的 权重达到学习权重时,该关键词才能被收录到字典中来表 征信息体。这样,经过不断地学习,可以得到一个较为稳定 的学习字典。本文将字典学习方法应用于系统中[ ~。 4.2信息的分析和识别 数据挖掘是主要的信息分析和处理方法,利用该技术 能从大量的数据信息中提取抽象的、潜在的有用信息形成 知识。聚类分析和分类识别都是数据挖掘的信息分析方 法,被广泛应用于各类知识发现系统中[6]。 聚类分析是根据信息的相似度原则来进行信息聚集的 一种方法,它工作在预先不知道预定类别的情况下。它能 最大化类内的相似性,最小化类间的相似性。通过聚类方 法能发现学习者各种记录或属性之间的有机联系,形成学 习者的个性化模型,典型的方法主要有K-means等。 分类识别方法是根据预定义的类别模型对信息资源进 行分类识别,只有和预定义的分类模型的相似度达到某一 阈值的信息被保留或被过滤。这是一种常用的信息过滤方 法。在本文的智能学习系统中,我们通过对学习者学习记 录的学习,形成了学习者的个性化学习模型,然后采取分类 识别的方法来获取和识别学习者的个性化学习资源。常用 】26 信息建立学习者的个性化学习模型,为学习者提供主动学 习和自主学习的网络学习平台,使学习者能在信息的海洋 中自主地、主动地找到自己真正需要的信息资源L2朋。 参考文献: [1]游星雅.高校网络数字图书馆建设中的知识服务[刀.湘潭师 范学院学报(社科版),2003,25(1):141—144、 [2]杨清,游星雅,蒋向红.基于LSI的图书馆个性化情报服务研 究与设计口].计算机工程与科学,2005,26(10),11—14. [3]王云,史浩山.一种基于网络的智能远程学习系统的研究 口].情报技术,2005,18(3):27—29. [4]K J Maschho,D C Sorensem A Portable Implmeentation of ARPACK for Distributde Memory Parallel Computers[,A]. Proc of the Copper Mountain oCnf on Iterative Methods.Vol 1[c].1996. [5]杨清,游星雅,蒋向红.基于智能信息处理的数字图书馆知识 服务系统的研究与设计[J]、计算机工程与科学,2004,26 (1O):11-14. [6]D Keller,M Sahami.Hierarchiaclly Classifyign Documents Usign very Few Words[,A].Proc of the 14th Int’l Conf on Machine Learning(ICML’97)[c].1997.170-178. [7]T Joachims.A Probabilistic Analysis of the Rocchio Algo— rithm with TFIDF for Text Categorization[,A].Proe of the 14th Int’l Conf on aMchine Learnign(IcML’97)[c].1997 143—151. [8]D Mladenic.Feature Subset Selection in Text-Learning[,A]. Proe of the 10th European oCnf on aMchine Learning[C]. 1998. 1-9]M P ̄.znai,D Billsus ̄Learning and Revising User Profiles: The Identification of Interesting web Site[J].Machine Learning,1997,27(3):313—331.