admin 管理员组

文章数量: 1087139


2024年6月16日发(作者:anything)

第23卷第2期 

计算机技术与发展 

V0】.23 No.2 

2013年2月 

COMPUTER TECHNOLOGY AND DEVELOPMENT 

Feb.2013 

基于模糊集和RSS的Web教育资源Rank算法 

王 杨,杨娜娜,陈付龙,赵传信 

(安徽师范大学数学计算机科学学院,安徽芜湖241000) 

摘要:随着Web教育资源指数级增长以及受污染程度的加剧,如何汇聚异构网络环境下面向用户的Web教育资源成为 

新的挑战。为了使终端用户能够获得高效有序的Web教育资源,文中提出了一种基于模糊集和RSS的Web教育资源 

Rank算法,并进行了相关分析。算法首先通过模糊集中的Euclid模糊度刻画查询内容与资源之间的模糊关联度;其次采 

用RSS聚合技术快速汇聚用户需要的Web教育资源;最后基于中国知网数据集的实验表明,该算法能满足Web教育资源 

终端用户个性化资源获取的需要。 

关键词:模糊集;RSS;web教育资源;Rank算法 

中图分类号:TP393 文献标识码:A 文章编号:1673—629X(2013)02—0127—04 

doi:10.3969/j.jssn.1673—2013.02.032 

Rank Algorithm of Web Educational Resources 

Based on Fuzzy Sets and RSS 

WANG Yang,YANG Na-na,CHEN Fu-long,ZHAO Chuan-xin 

(School of Mathematics and Computer Science,Anhui Normal University,Wuhu 241000,China) 

Abstract:With the exponential growth of Web educational resources and the degree of contamination increased,how to aggregate user-o— 

riented Web educational resources has b ̄ome the new challenge in the heterogeneous network environment.In this paper。present a kind 

of Web educational resources Rank algorithm based on fuzzy sets and RSS in order to make terminal USelS obtain efifcient Web education— 

la resources ordered.First of lal。the algorihtm depicts the fuzzy association degree between the query and the resources through the Euclid 

ambiguity of fuzzy sets.Second,hte USe of RSS aggregation technologies rapidly aggregates the Web educational resources users needsi 

Finally,hte experiment of CNKI data set shows that the algorithm Can meet the needs of personalized educational resources access. 

Key words:fuzzy set;RSS;Web educational resource;Rank algorithm 

O 引 言 

电子、信息技术对不同自治域中的相关知识内容进行 

web教育资源是指以数字信号在互联网上共享 

采集、加工、存储、传输、检索和利用,以新的序列化的 

的具有教育价值的各类信息资源”’ 。形式多样的 

知识单元呈现给教育终端用户的服务性工作。根据用 

Web教育资源主要分布在: 

户群体,现有的Web资源排序可分为三大类。 

(1)大型的搜索网站(如Google、Baidu等); 

是面向社会群体用户的排序算法,如PageRank 

(2)付费的数字图书馆(如中国知网、万方数据库 算法 、HITS算法 ' 等; 

等); 二是面向组用户的排序算法,如Direct Hit算 

(3)教育服务提供商(如新东方、英孚教育等)。 

法 、基于群体特性的排序算法 等; 

面对日益丰富的教育资源,用户不仅需要透明的 

三是面向个性化用户的排序算法,如BM25加权 

协同与共享,又需要有效地选择和汇聚“以用户需求 

算法 、个性化排序算法口¨等。 

为中心”高可信的教育资源手段。 

总体来说,上述方法均难以满足用户获取领域相 

异构网络web教育资源汇聚和选择是指以开发 

关、时间相关、内容优质的高可信Web教育资源的需 

利用网络信息资源为基础,根据教育主体的需求,运用 

求。因此,文中提出了基于模糊集和RSS的Web教育 

资源Rank算法。 

收稿日期:2012—06—03;修回日期:2012-09—05 

基金项目:201 1年教育部人文社会科青年基金项目(1 1 YJC8801 19) 

作者简介:王杨(197l一),男,教授,博士后,主要研究方向为可信 1 相关理论与技术 

计算、教育技术。 鉴于模糊集中的Euclid模糊度可以刻画查询内容 

128・ 计算机技术与发展 第23卷 

与资源之间的模糊关联度,RSS文档聚合技术可以快 

速汇聚用户需要的教育资源,因此,采用其作为Web 

教育资源Rank方法的理论基础和技术手段。 

1.1模糊集 

给定一个论域 ,从 到E0,1]的一个映射 : 

一[0,1],设A= (u)l u∈ },则称A为论域 

上的一个模糊集,函数 为模糊集A在论域 上的 

个隶属函数, (“)为“对模糊集A的隶属度¨ 。 

鉴于模糊数学的原理,隶属函数可以对资源进行 

评估。根据模糊集中的隶属函数,可以刻画查询内容 

与教育资源之间的隶属度。隶属函数定义如下: 

定义1:隶属函数定义为 

Ⅳ( ) 

( )=——

(1) 

N (ui) 

其中u 为代表教育资源的词集或要查询的内容, 

rt为“ 的个数,Ⅳ(Ui)为u 在教育资源中的数量,而 

/x ,)的值为 对模糊集A的隶属度。 

Euclid模糊度通过隶属度来确定查询内容可以模 

糊代表教育资源的模糊关联度。Euclid模糊度定义如 

下: 

定义2:Euclid模糊度定义为 

厂 ———————————一 

d(A)= ^/∑I/

√n ‘ 

XA(H )一/ ̄a0,(u )I (2) 

其中, 

):f /x ‘ 0.5 (3) 

【0 (u )<0.5 

1.2 RSS技术 

简易聚合(Really Simple Syndication,RSS)是根据 

用户的需要,把相关站点的教育资源高效聚合,把预定 

信息(标题、摘要、内容)“推送”到用户桌面 。 

由于RSS技术是根据用户的需要,则需要自定义 

用户标签。RSS标签定义如下: 

定义3:RSS标签定义为 

Tag={Tagl,Tag2,Tag3,…,Tag } (4) 

其中,Tag 为刻画Web教育资源的第i个关键属 

性,C【Tag ]为用户自定义的对Tag。的关注度, 

(0≤C[Tag]≤1)。 

RSS技术需要根据用户定义的标签,对教育资源 

集计算其资源标签比重。资源标签比重定义如下: 

定义4:资源标签比重。设教育资源集为ER= 

{er1,el"2,…,er ),资源el 中Tagj的数量为Ne。【Tag] 

则RSS标签Tag,.在资源el" 中所占的比重,即 

er ̄

[Ta (5) 

其中, 

M =∑N E Tagy] (6) 

又根据用户自定义的标签比重,计算出用户最满 

意的教育资源,再推送给用户。 

定义5:用户满意度。对于资源er ,用户满意度 

定义为 

姜。。 (7) 

其中, ,的大小体现用户对Web教育资源满意 

程度的高低。 

2 基于模糊集和RSS的Web教育资源 

Rank方法 

教育资源检索涉及三方面的内容:教育资源集的 

表示、教育资源终端用户查询的表示、用户查询与教育 

资源集的匹配及其排序。文中教育终端用户除了输入 

标签和查询的内容外,还需要输入标签和查询内容对 

用户所需要的重要程度,重要程度分为十个等级,等级 

越高,表示越重要。 

2.1算法描述 

算法1:基于模糊集的Rank算法。 

Input:Q={q1,q2,…,g );//用户查询内容 

WQ={ W啦

,…,W

qs

);//用户查询内容的比重 

Output: ,;//通过模糊集理论查找后的教育资源 

排序结果 

BEGIN 

for el"l to er

n 

{ 

extract U={“l

“2,…,ttt); 

for lto 

(ui)一Ⅳ(M )/∑Ⅳ(u );//关键词的隶属度 

厂 ———————————————一 

d( 。)一砉√ ‘ ( × 一 ( ; 

//用户查找内容可以模糊代表教育资源e 的模 

糊度 

1| ad(eT 

return ; 

} 

END 

算法2:基于RSS技术的Rank算法。 

Input:Tag={Tag1

Tag2,…,Tag );//用户定义 

标签 

W ={ W 

WTag

);//用户标签比重 

Output: ;//通过RSS技术推送给用户的教育资 


本文标签: 教育资源 用户 内容 资源 查询