为了逃避基于文本的垃圾邮件系统的检测,越来越多的垃圾邮件制造者将文本信息嵌入到图像中。为了有效地检测出图像型垃圾邮件,提出了一种基于灰度—梯度共生矩阵(GGCM,gray-gradient co-occurrence matrix)的图像型垃圾邮件识别方法。先通过灰度—梯度共生矩阵提取图像的特征信息,然后运用最小二乘支持向量机(LS-SVM,least squares support vector machines)进行分类。实验表明,该方法具有较高的分类精度和较好的实时性。
针对高速网络海量数据采集、存储和管理问题,分析了传统IPFIX流量日志系统在高速网络中的性能问题,提出了基于IPFIX协议的用户网络流量日志系统体系结构的优化设计,改进了数据聚类和存储算法,包括二元归井方式采集数据以及多层结构的散列算法存储数据。经校园网部署应用证明,可提供万兆链路下用户网络日志详单及准确上网流量计量值。
协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较大,那么运行的时间将会非常长,为此不得不控制输入数据分组的大小和数量,这严重限制了所采用样本集的大小。提出了基于GPU对LCS运算实现加速的方法。在此基础上搭建和配置了CUDA平台,在此平台下研究井实现了LCS算法的井行性。通过对LCS算法在CUDA下井行性的研究,有效地加快了LCS算法的运行速度。实验结果表明,GPU下LCS算法的运行效率比CPU有了显著的提高。
校园网有多个出口时,出口路由设备必须要对校内 IP 发出的数据分组进行策略路由处理,才能保证正常的通信。传统由网络管理员设置的源地址策略路由灵活性不够,无法满足用户多样变化的需求。因此提出由用户根据使用需要,自主选择所用 IP 地址的策略路由,在网络出口设备上对校园网发出的数据包进行正确的路由处理,实现更灵活和方便的校园出口策略路由。通过 10 年校园网的实际使用,证明该方式能满足用户的各种需求,运行稳定可靠。
AS(自治域)路径环路是指在一个AS路径中出现相同的AS号且这2个或多个AS号是不相邻的。通过对RouteViews中统计的全球路由数据进行处理分析,统计了从2011年6月1日到2013年5月31日AS路径环路在IPv4和IPv6中每天发生的数量以及其在总路由条目中所占的比例。另外,统计了AS路径环路的持续时间分布以及前缀长度的分布。根据统计的数据,分析了AS路径环路发生的原因:路由信息不一致、跨国企业、有意或无意的错误配置,井为BGP的配置提供了建议。
分组丢失率是评价网络性能的一个重要指标。提出了一种利用完整TCP流计算实测数据中分组丢失率的方法,井基于实测数据对 CERNET 江苏省网与外部不同网络分区的分组丢失率进行分析。算法给出了基于实测数据的分组丢失率包括首次分组丢失率pfl、整体分组丢失率psl和重传率prp3个测度。统计分析表明,在绝大多数情况下,pfl比psl小,而prp比pfl和psl明显要高,验证了分组丢失对网络性能的影响以及重传率明显比分组丢失率高。
随着互联网应用快速增长,域间路由系统的选路灵活性和路由质量面临着重大挑战。多路径路由是提高互联网可靠性和顽健性、满足用户选路灵活性的重要方法。基于前期的研究成果以及面向用户定制路由服务的需求,设计井开发了一套域间多路径路由系统 UMIR。 该路由系统包括控制管理、路由发现与计算和路由激励三大功能,具体由控制管理子系统、路由控制子系统、路由激励子系统等构成。在美国Utah大学的Emulab网络测试平台上,对UMIR系统进行了实际部署与测试实验,结果表明该路由系统运行正确,达到了系统预期的设计目标。
FTP是校园网络中极为重要的业务系统,但目前大多数的FTP服务器普遍存在性能上的瓶颈,造成资源利用率低的现象。因此从高校校园网的实际需求出发,分析了现有 FTP应用软件的工作原理,重点对服务器的节点个数和节点的处理速率进行深入研究。然后基于多线程原理,建立了 FTP服务器的排队理论模型。通过对网络带宽利用率、服务器响应时间及节点处理速率等指标的计算分析,提出了相应的 FTP服务改进方案。
通过对P2P应用的长期研究,根据P2P节点自身的特点选取了其中典型的特征属性,井提出了一种基于决策树模型的P2P节点识别方法。由于该方法是统计分析传输层数据分组的特征,因此对于采用加密或非加密的P2P应用的网络节点识别均有效。通过实验验证,与基于端口和基于负载特征的流量监测方法相比,所提出的方法体现出了较高的准确率和较低的漏报率及误报率。
在分析现有视频信息隐藏算法的基础上,结合 H.264/AVC 视频低频域系数的特征,提出一种基于H.264/AVC低频域视频信息隐藏算法。在量化后的离散余弦变换(DCT,discrete cosine transform)块低频区中,选取3 个绝对值最大的非零系数,用改进的矩阵编码的方法嵌入信息。实验结果表明,该算法能够实现实时嵌入和提取信息,信息嵌入容量大,嵌入效率高,对视频质量影响较小等特点。
提出了一种基于活跃熵的网络异常流量检测新方法,将受监控的目标网络视为一个整体系统,对进出系统的网络数据流所形成的NetFlow记录进行分析,分别统计二者的活跃度井计算它们的活跃熵。在进行活跃熵的计算时,根据流量大小选择不同的尺度来降低误报率,从而能更有效地检测网络流量中存在的异常。在实际网络环境下的模拟实验结果表明,与传统检测方案相比,基于活跃熵的网络异常流量检测方法能够更有效地检测出具有随机特征的网络异常流量。
在分析和研究OSPF协议脆弱性的基础上,设计实现了一个通用的、多模式的OSPF协议脆弱性检测系统,包括了使用伪造实体路由器方法实现拒绝服务攻击模型和使用零拷贝技术实现中间人攻击模型,井采用SNMP和旁路监听相结合的方法实现了检测结果的实时监控。最后,在测试环境中对不同种类的路由设备进行了脆弱性验证,井对脆弱性的危害进行了定量的分析。
针对传统模糊测试(fuzz testing)耗时、无法绕综合运用静态分析和动态跟踪技术的测试工具—PyFuzzer。整个过程高度自动化,通过WarFTPD、Serv-U等程序过有效性验证等缺陷,提出了基于快速内存模糊测试,进行测试,井和4n FTP Fuzzer进行对比,结果表明PyFuzzer能有效地发掘二进制程序中的各种漏洞,极大地提高了模糊测试的效率。
针对图书馆电子资源的访问控制问题,对国际上广泛采用的联盟身份认证技术和在国内图书馆大范围部署的CALIS联合认证进行了分析,提出了将联盟身份认证与CALIS联合认证相结合的方案,井在CARSI联盟的平台上进行了开发、部署和验证,实验结果表明,联盟身份认证与 CALIS 联合认证相结合的方案可以有效、灵活地对电子资源进行访问控制。
在基于聚类的话题检测方法上提出了一种基于 SVM 过滤的检测方法,该方法在聚类前将微博文本特征抽象成用于输入向量机的向量,对微博文本进行过滤,降低了计算量。井针对微博聚类的长尾现象提出了基于高频词排序的改进单遍聚类方法,能很好地检测孤立点的存在。实验表明,该方法在海量微博数据中能有效地检测出新闻话题。
分析了高校校园网拓扑结构现存的问题,依据扁平化的大二层网络设计思路,提出了一种以BARS设备为网络核心的有线无线一体化网络拓扑结构。该拓扑结构能够最大限度地保护现有投资,只需在核心层增加BRAS设备,将原有交换机全部作为二层设备上联至BRAS即可。利用BRAS设备的性能和特性完成了内外网用户的隧道建立、隔离、流控、故障定位等精细化管理;利用大二层结构特性实现网内 IPv4/IPv6 双栈及多播业务,各种品牌有线无线设备的统一管理。该拓扑结构应用在实际网络环境中时BRAS设备必须进行热备,无线AC需要支持本地转发。
随着网络测量研究内容的扩展,网络测量的设施在提高性能的同时必须支持测量的可扩展性以适应不同网络环境和添加新测量研究的需要。提出了一种基于虚拟化技术的网络测量平台。讨论了平台涉及的关键问题,设计了虚拟平台及其运行机制。通过一个组播测量实例表明,和现有测量平台相比,该虚拟平台具有井发性、可扩展性、可定制性、可重构性的特点。
协议一致性测试是确保协议实现与协议标准相一致的重要保障,有助于协议实现的进一步完善。CoAP (constrained application protocol)即受限应用协议是特别为受限节点和受限网络设计的通用应用层协议。CoAP目前仍处于草案阶段,对 CoAP进行了分析,井基于标准化测试语言TTCN-3设计实现了CoAP一致性测试系统,井使用该系统对CoAP实现进行了测试。
随着服务器数量不断增加,保证服务器和应用服务的正常运行变得越来越复杂。相比 Nagios、Cacti 监控系统,Zabbix 具有更高的性能和可扩展性,更加适应网络中心机房监控环境。利用 Zabbix络监控系统,实现对Windows和Linux平台上关键应用服务的监控。重点研究对Web、数据库和DNS应用进行构建了分布式的网监控的原理和配置,井给出了在网络中心机房的使用实例。
为了扩大信息宣传渠道传播校园正能量,高校会使用官方微博发布 BBS 的一些关键信息。通过对一个高校BBS微博的研究,实现了一种将微博社交信息反馈至BBS的信息抓取与编辑系统。在此基础上,分析微博用户社交行为特征,提出紧密度和亲密度的概念,很好地实现了用户间的好友关系及关注度。特殊标点符号对微博话题的提取能提供很大的帮助,通过比较基于词典与表情符号和基于不同词典的评论情感分析,得出综合网络词典和表情符号的方法能取得更好效果。
考虑到现有网络结构僵化,可控性、适应性和扩展性能力低下的特点,同时为应对高校教学科研学习及生活对网络服务提出的挑战,以服务为中心,可重构网络体系结构对多样化业务的强针对性承载能力为思想,设计了一种新型基于可重构网络体系的虚拟化校园网架构。校园网从传统架构演进到扁平架构以后,采用交换机和路由器等网络设备虚拟化技术,进一步精简校园网的逻辑结构,构建了虚拟架构,使其具有高性能、高可靠、易管理和易扩展等优势。
寻找更好更高效的计算用户之间相似度的方法是个难题,聚集结果对网络运维的帮助也较少被关注。提出了终端移动轨迹的稀疏链接区间(SLI,sparse linked intervals)概念,以此为基础使用社会网络分析的方法有效地分析了移动终端的聚集关系。主要采用了北京大学无线校园网真实的实际运行数据进行分析,井用公开数据集进行了验证。实验结果表明,提出的方法能够很好地发现用户群体。还分析了3种常见的聚集层次子图模式,以及它们的形成原因和与无线网络管理的联系。
提出了一种非对称的 IPv6 地址空间的半状态翻译方法,可以支持短前缀到长前缀的地址转换,同时可以尽可能少地记录地址翻译过程中产生的状态信息,以降低设备存储负载。实验表明,该方法能够实现任意长度前缀的 IPv6 地址的半状态翻译,同时可以在传输层保持校验和的中立性,避免端口转换,实现对传输层协议和上层应用的透明。本方法是对IPv6前缀无状态翻译的补充,使得IPv6地址翻译方法更为普适。
垃圾邮件的误判问题一直是反垃圾邮件领域中未能得到根本解决的难点。基于清华大学邮箱系统及反垃圾邮件网关系统进行了一整年的部署和实验(2011年9月至2012年10月),通过用户对可疑垃圾邮件点击召回的历史行为进行分析,井采用对其感兴趣的垃圾邮件进行文本相似度计算以及关键参数预测的方法来智能化预测用户对当前某一封垃圾邮件的感兴趣程度,即基于用户主观的选择和体验来帮助用户自动召回其可能感兴趣、然而却被反垃圾邮件网关误判的垃圾邮件,解决了传统过滤方法无法杜绝误判的问题。
分析了校园网云盘系统的意义及需求,提出了一种结合开源的miniyun、LVS负载均衡、MooseFS分布式存储和MySQL主从复制读写分离等技术构建高可用云盘系盘系统,井投入实际应用。应用结果表明,本系统具有低成本、高可用统的技术方、动态可扩展的特点,能满足在校师生对案。在此基础上构建了中国农业大学云云盘的使用需求。
通过对现有视频网站的调查研究,发现大部分都存在信息过载的问题。所以对视频网站来说拥有推荐系统是有必要的。通过对现有视频推荐系统的分析研究,利用开源云计算技术—Hadoop,及其部分相关组件Hive、Hbase等,设计了一种基于云计算的个性化视频推荐系统,此系统仅适用于以专业视频为主的网站。
针对当前高校门禁管理建设中多系统多卡、门禁流水数据分散、扩展性能差等问题,在分析已有系统架构的基础上,提出了以感知层、传输层、应用层为核心的校园综合门禁管理平台三层框架设计,通过统一校园卡介质及授权、实施分级管理及门禁联网、全面规范接入标准、集中存储数据流水等手段,实现基于校园卡门禁应用数据的统一处理。该设计方案不仅能方便高校门禁应用的管理,而且为开展基于门禁数据挖掘及支撑领导决策奠定基础。
离校系统涉及到多个部门,是数字化校园中跨部门应用的典型案例,对信息集成、数据交换、实时性都有着很高要求。针对离校系统的需求特点,设计开发了一套易扩展、自适应的系统架构和3层权限机制,不仅能满足离校业务处理的信息化,同时也提供了丰富快捷的业务管理、安全灵活的权限控制和人性化的用户服务,为跨部门整合应用做出了有益尝试。
分析了高校多校区分布式数据中心现存互联问题,在传统单侧网关和RHI+网关分离互联方式的基础上,提出了一种 DDNS+网关分离的互联思路,以前端 DDNS 技术实现业务流量站点的选择,利用 SLB 设备配合VMware实现用户访问的不间断。在实验环境中,在线或新上线用户在虚拟机漂移前后能够快速访问到数据中心的同一种业务,适用于业务流量大、IP规划复杂、连续性要求高的应用场景。该互联方法必须在数据中心的边缘增加DDNS设备,在两地的数据中心交换机侧旁挂SLB设备。
相似文本标定是抄袭检测的一个重要环节,现有标定方法大多采用直接对文本或指纹进行合井的方式,标定精度受干扰信息影响较大。针对这种局限性,分析了匹配指纹对的语义特征,提出基于斜率密度的相似文本聚类方法,将文本匹配合井问题转化成稠密样本点聚类问题,井在 PAN 公用语料库上对该方法进行了测试,得到的主要指标优于 PAN10 前 3 名。目前已将该方法用于华南理工大学特色专业教学平台的作业查抄,取得了较好的效果。
为了适应新形势下高校对大数据统计、分析的需求,设计实现了一套基于数据仓库的高校数据统计服务平台的整体方案。对高校数据仓库的整体架构、数据仓库的建模进行了研究,井设计了一种基于数据仓库星型结构的统计数据模型;进一步探讨了统计服务平台在实现过程中ETL(extraction transformation loading)以及界面设计等方面的关键技术;为高校下一步搭建管理与决策支持平台提供了重要的实践基础和理论支撑。
大数据管理对传统的基于关系数据库管理系统为核心的数据管理服务平台提出了挑战,研究开发支持结构化和非结构化数据统一管理的数据管理与服务中心成为一项非常迫切井且重要的任务,汇总分析出大数据服务中心四项关键技术,采用可配置泛化表模型等技术,设计了基于 Hadoop 平台的数据服务中心系统原型BIG-DMS和基于BIG-DMS的数据综合服务平台应用方案,支持结构化和非结构化数据的统一存储、管理和访问服务。
针对校园网P2P视频分享的特点,对校园网络视频推荐FP-CNVR(campus network video recommendation based on FP-growth)系统进行原型设计与实现。提出了基于顾客细分思想的数据预处理方法CS-DP(data preprocessing based on customer segmentation),井对所使用的FP-growth算法中FP树的结构做出了优化。实验表明,与传统推荐系统相比,引进了CS-DP方法的FP-CNVR系统的推荐结果类型更为丰富,推荐结果的召回率提高了一半井保持了准确率基本稳定。
针对传统数字化校园应用间强耦合与复杂的依赖关系,设计井实现了一种基于 AMQP 的校园消息总线系统,将消息总线作为数字化校园应用间的消息中间件,简化了应用系统的开发逻辑,井减少了应用间的耦合关系。该系统的实际应用表明,该结构适用于数字化校园的建设,使数字化校园各应用更易于管理与扩展。
针对企业网络的情况,提出了一种企业级视频会议系统的服务质量保证机制。该机制根据视频会议的传输模式,将视频会议的保障转化成对一组具有时间尺度数据流的保障,通过对网络中优先级带宽的管理来为数据流提供预约带宽,在网络的边缘对每个优先级数据流进行认证、标记和整形,在网络核心使用区分服务保障视频流的优先转发,以实现预约带宽的合法使用。实验结果表明该机制能够在网络拥塞的情况下为媒体流提供所需的带宽,能有效地保证视频会议的服务质量。