大学专业介绍

发布 2022-09-12 01:12:28 阅读 6049

1 基网络环境下的科技情报工作。

1. 1 新形势下科技情报工作的主要特点。科技情报工作是科技发展的重要基础,我国科技情报系统是国家科技创新体系的重要组成部分,数据库存储和网络技术的发展,使传统的情报信息工作发生了重大的变化,近年来,经过不断探索与实践,科技情报工作与科技信息服务产业都得到快速发展,结合黄委数字黄河工程和科技创新工作的新形势,笔者认为科技情报工作有了如下特点:

1)很强的目的性和针对性。即情报研究必须紧紧围绕治黄科技工作的需要,围绕数字黄河工程、维持黄河健康生命等特定的目标,经过广泛信息收集、加工,有针对性地从大量的信息中挖掘出目标明确的、有价值的、系统的情报。

2)情报研究的需求量增大。近年来,黄委科技创新投入逐年提高,课题的数量也大幅度增长,情报分析需求呈稳定上升的势头,可见科技情报工作的重要性。

3)情报研究要有前瞻性。情报研究必须针对需求,通过对大量信息的分析,抓住治黄工作及水利行业的新动向、新趋势,及时提供最新的情报信息,要求研究报告提出具有新意的方案和建议,以前瞻性的情报分析服务于治黄决策。

4)情报工作的交叉性和边缘性。现代科学技术的发展使各学科互相渗透、交叉,并形成许多新型边缘科学。近年来,治黄科技工作越来越广泛地与数字技术、网络技术、卫星遥感、地址勘测等等前沿科技发生交叉,因此情报研究工作必须能够体现出各个学科、专业之间的关系和相互影响。

2 数据挖掘与网络挖掘。

网络挖掘是数据挖掘技术在web上的应用。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,抽取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。从更广义的角度来讲,数据挖掘就是在一些事实或观察数据的集合中寻找模式的决策支持过程。

因此,挖掘的对象不仅是数据库,还可以是任何组织在一起的数据集合。数据挖掘最初针对的是大型数据库,而电子政务中的数据挖掘技术是基于网络的,即所谓的网络数据挖掘,它除了处理传统数据库中的数值型的结构化数据外,处理更多的是文本、图形、图像、ww信息资源等半结构、非结构的数据。

2.1 数据挖掘的对象从形式上来看,被挖掘的数据对象有结构化数据、异构化数据、半结构化数据,或非结构化的数据;根据被挖掘的数据库类型来划分主要有以下4种。1 关系数据库:

关系数据库具有良好的操作性,目前它是数据挖掘应用最多的数据库之一;2 数据仓库:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库中的数据是经过清洗、集成、选择、转换等处理的,最符合数据挖掘的条件,因此它能为数据挖掘提供最佳的挖掘环境;3 文本数据库:

这一类数据库主要存储的内容是文本,信息含量大。此类数据多数是非结构化或者是半结构化的(如html,e-mail、web页等),对这类数据的挖掘比较复杂。针对此类数据库的数据挖掘主要有文本特征的提取、文本分类、文本聚类、文本摘要;4 复杂类型数据库:

主要指非单纯文本的数据库或能够表示动态序列数据的数据库,主要有空间数据库、时序数据库以及多**数据库,挖掘比较复杂。

3 网络挖掘技术。

网络(web)挖掘发展自数据挖掘,数据挖掘方法通常可以分为两类,一类是建立在统计模型的基础上;另一类是建立一种以机器学习为主的人工智能模型,采用的方法有神经网络、自然法则计算方法等。

3.1 网路挖掘的分类。

1) web内容挖掘:web 内容挖掘是指对web 页面内容及后台交易数据库进行挖掘,从web 文档内容及其描述中的内容信息中获取有用知识的过程。它又可分为web 文本挖掘和web 多**挖掘,针对的对象分别是web文本信息和web多**信息。

web内容挖掘的重点是页面分类和聚类。

2)web结构挖掘:web结构挖掘是对web的组织结构和链接关系进行挖掘,从人为的链接结构中获取有用的知识。由于文档之间的互连,www能够提供除文档内容之外的有用信息。

利用这些信息,可以对页面进行排序,发现重要的页面。结构挖掘又可分为超链接挖掘、页面内部结构挖掘和url 挖掘。

3)web使用记录挖掘:web 使用记录挖掘是通过挖掘相应站点的日志文件和相关数据来发现该站点上的浏览者的行为模式,获取有价值的信息的过程。

4 基于网络挖掘的情报工作系统模型的提出。

当前科技情报源越来越多,包括企业内部数据库、数据仓库、外部网络、外部数据库等等。科技情报工作需要向用户提供面向主题的数据挖掘及深层的数据分析,要实现这些功能,将科技情报工作系统建立在网络挖掘技术基础上是一个很好的选择。

结合治黄科技情报工作的传统模式。笔者提出的基于网络挖掘的情报工作模型是建立在大量科技情报数据基础上的系统,包含四个子系统,即科技情报收集子系统、科技情报数据转换子系统、科技情报分析子系统、科技情报服务子系统(如图1所示)。

图1 基于网络挖掘的科技情报系统模型。

4.1 科技情报收集子系统。即基于网络挖掘的科技情报挖掘系统,主要包括各信息源以及各种信息收集工具,主要负责收集来自网络以及行业内部、外部的信息。

科技情报系统所面临的信息环境主要包含黄委外部环境和内部环境。内部信息主要通过内网intranet来实现信息的共享。intranet通过防火墙同外部因特网相连,通过防火墙来实现信息安全。

内部信息一般是各业务部门进行公务处理所累积的数据信息,主要包括关系型数据库、文档数据库等。外部信息主要来自外部互联网,如web服务器日志文件、各相关**、各相关专业数据库等。各种信息收集工具可以简单地统称为数据采集器,收集内网和外网的不同信息源的数据和文件格式,包括像html网页,word文件、报表这样的不规整的信息,还有像xml这样的半规整的信息,同时还有像rdbms, lotus notes, oracle数据库这样的规整信息。

4.2 科技情报数据转换子系统。该子系统的功能是对从各种情报源收集到的数据的格式进行处理,为数据挖掘提供符合要求的数据。

数据转换子系统与数据收集系统相连,功能主要是对数据采集器收集到的数据(主要是非结构化和半结构化的数据)进行提炼、固化、过滤、清洗、转换以及整合,从而形成一个本质上是数据仓库的数据集合,该集合中的数据符合数据挖掘的要求,再加上已有的数据库中结构化的数据,为下一步数据挖掘提供了良好的环境。

4.3 科技情报分析子系统。经过转换的数据,送入科技情报分析子系统中。

数据挖掘是其核心技术。数据分析工具包括clap、各种数据挖掘工具、查询工具、报告生成工具、决策支持系统以及其它的统计分析工具等。其中的数据挖掘工具是实现数据深层次的挖掘,可以在大量的数据中发现未知的关系、模式以及趋势等,是科技情报分析子系统的核心,功能包括概念描述、关联分析、分类与聚类、偏差检测、时序演变分析、信息摘要、信息抽取、元数据挖掘等。

随着互联网技术的发展,网络已经成为科技信息的重要**。

4.4 科技情报服务子系统。即科技情报网络服务系统,是为整个科技情报系统提供一个信息交流和共享的平台,它包括对内和对外两部分。

对内的服务子系统功能主要是将整个系统的信息在内部网intranet上发布,提供内部信息交流、使用、共享的平台,保证每个部门,尤其是战略决策部门的信息获取和信息交流渠道的通畅。对外的服务子系统主要功能是提供与外网信息交流的平台。

5 结束语。

在计算机和网络技术极其发达的今天,科技情报工作和研究必须面对海量的信息源,而数据挖掘和网络挖掘无疑是处理海量数据并从中发现规律的绝佳手段。但迄今为止数据挖掘与网络挖掘技术并没有发展的十分成熟,而且,这种工作模式没有固定的范例。将它应用到科技情报工作中还需要经过很长时间的探索,但是**将两者相结合的应用模式是非常必要的,无疑可以为科技情报实践提供一定的参考。

大学专业介绍

山西大学专业介绍。专业类型。专业名称。专业层次。专业名称。专业层次。医学类。药学。本科。历史学类。历史学。本科。博物馆学。本科。考古学。本科。历史学类。本科。哲学类。哲学。本科。哲学类。本科。工学类。食品科学与工程。本科。计算机科学与技术。本科。环境工程。本科。生物工程。本科。电子信息工程。本科。电...

大学专业介绍

目录。案例二 小浪底工程11 通过此案,请你分析影响项目采购管理的因素主要有哪些?12 从小浪底工程成功应对国际索赔的案例中,你认为应该如何理解索赔的。含义?23 阅读上述案例后你有什么感想?3参考文献4案例三 tcl项目研发成本的控制案例51 tcl公司项目成本控制的关键是什么?研发成本的控制有效...

大学专业介绍

自动化专业在学位分类里叫 控制科学与工程 属于一级学科。另外一级学科或二级学科只是从属的关系,并不是反映一个学校相关专业的水平的标准。该学科在本科阶段叫自动化,研究生阶段叫控制科学与工程,下设五个二级学科 控制理论与控制工程,检测技术与自动化装置,系统工程,模式识别与智能系统,导航 制导与控制。自动...