您的位置:网站首页 > CAD新闻

基于虚拟文件夹的文档管理研究

时间:2011-02-26 19:31:01 来源:

产品数据管理(PDM)是一门用来管理所有与产品相关信息和所有与产品相关的过程的技术。PDM系统包括以下主要功能:电子仓库、文档管理、产品结构配置管理、工作流程管理、分类与查询管理和项目管理等。

在现代化企业中,CAX系统,OA系统软件的大量应用,使文档的产生、保存形式逐渐趋于数字化。对于已有的纸质图档,利用高速扫描设备以及中文光学字符识别(OCR)技术将其数宇化也十分方便。由于电子文档产生于不同的软件系统、工作组织、工作目标中,并且存储于不同部门的计算机中,不便于对文档的统一管理。有效地管理和维护这些企业文档,为产品开发人员提供一个透明、一致、安全和实时的产品信息共享环境,是PDM系统开发与实施的基础。

在文档管理方面,已有许多学者已进行了研究与开发工作解凡这些研究多是以文档的基本信息为主要管理对象、以产品BOM为组织结构。企业的工作文档往往是由一组文件构成,某个文档除了归属于某个产品或零部件,还可能康属于部门、项目、工作流等组织结构。以上研究工作虽然对文档进行了分类管理,但缺乏对类别的访问控制,难以实现按类别管理文档及自动归档的需求;而单一的组织结构缺乏文档组织结构描述的多样性口同时.用户化的需求也应当是文档管理研究重点之一。

本文介绍了一种以虚拟文件夹技术为基础的文档管理系统。主要目标是:(1)将文件类别加入主要管理对象中,加强分类管理;(2)建立多重分类机制;(3)对文档进行自动或辅助归档;(4)建立个人工作区.满足用户个人管理需要。

1、文档管理系统概述

1.1体系结构

与多数基于Web应用系统相同,文档管理系统为3层结构。在表示层上,用户根据工作的需求选择处理文档的类型,如产品文档、部门文档、项目文档等;事务层根据用户的操作选择,处理与文档相关的各类流程、功能;数据层为事务层提供数据源以及相关服务,如用户、文件分类信息FTP月良务等。如图1是文档管理系统的体系结构模型。

newmaker.com
文档管理系统的体系结构模型

1.2功能结构

各种应用软件系统的使用,产生了从不同方面描述产品的技术文档,这些文档有不同的类型(逻辑的分类)和不同的格式(物理分类)。

文件夹是操作系统用来管理文件的重要技术手段,通过文件夹可以实现对物理文件的分类、网络共享、访问控制等许多功能,具有结构层次清晰、分类方便等优点。但操作系统的文件夹管理方式难以实现文档位置的透明性、查询的方便性、共享与保密的安全性等诸多功能或性能。

与普通的文件夹不同.虚拟文件夹并不是用来保存文档,而是对文档进行逻辑分类的工具。虚拟文件夹是利用数据库技术、以文件夹的结构形式对企业或个人的计算机文件进撰充一管理的一种文档管理技术,操作人员并不需要知道文件夹中的文件实际物理位置。它可以实现按主题对文档进行结构化分类的目的。同时,通过扩充虚拟文件的功能.可使之成为文档管理的基础。

一个完整的文档管理系统需要完成各种与文档相关的操作功能,包括文档的分类、注册、复制、检入、检出、冻结、审核、权限、版本、查询、浏览等等。同时,在企业中。CADCAPPCAM设计过程及工作流系统中,通过专用接口将文档管理直接嵌入到这些软件系统中,方便设计人员的处理。系统建立个人工作区,通过虚拟文件夹保存搜索的结果,或存储临时工作文档。通过中间件卜还可与其它系统进行数据交流。基于虚拟文件夹的文档管理系统由多个功能子系统组成,其功能模型如图2所示。

newmaker.com
功能模型

2、虚拟文件夹对文档的管理

采用虚拟文件夹技术对文档进行管理,需要实现以下几方面的功能和性能:

(1)灵活的建立与维护;
(2)便捷的文件分类与归档;
(3)准确的搜索与查阅;
(4)个性化及本地化的管理;
(5)安全的文件访问;
(6)多系统的接口与扩展。

这些功能与性能需求对应了整个文档管理系统的虚拟文件夹数据结构1文件分类与归档、文档搜索与阅览、个人工作区、访问权限、系统集成接口等的结构与功能设i十、实现。由于篇幅所限,其它功能的设计实现不在此一一讨论。

2.1虚拟文件夹的数据结构

与物理文件夹一样,虚拟文件夹的表现形式为树型结构。而能够表达树型结构的数据结构有许多种,如层次编码法、高津托图,气分层存贮法,层次矩阵存贮等。

高津托图(Gazintograph)法具有结构简单、灵活、易扩展、少冗余的优点,因此,系统采用高津托图法作为虚拟文件夹的数据结构。

高津托图法采用两张表来表达产品的结构层次:一张表存储的是所有虚拟文件夹的特征属性信息〔如表1),通过外键与文件基本信息等建立关系;另一张表存储的是虚拟文件夹的结构关系信息(如表2),即虚拟文件夹的父子关系。

newmaker.com

在构建树型结构视图时,采用深度优先遍历算法加载所有的虚拟文件夹节点。采用高津托图图法无法从物理结构上避免循环的产生,但可以通过在引用等操作时,判断这个节点在其子树中是否会出现第z次来判断是否存在循环。

2.2文件的分类

企业的各项生产活动中,根据工作的需要,相同的文档可有多种分类依据.如部门、项目、类型、密级、产品等。不同的分类依据形成不同的分类方法。根据企业的需求,这些分类方法都必须兼顾。

系统采用了虚拟文件夹多重视图的方法,即在结构关系表中,加入了分类方法标识ID,通过该标识可以区分虚拟文件夹结构的类属关系。在构建虚拟文件夹的树型结构时,属于不同方法的虚拟文件夹就可以建立不同的分类树,从而满足了企业对文档不同的分类的需求。如图4所示,是一组虚拟文件夹在不同的分类标示中形成的两个分类视图。

newmaker.com
虚拟文件夹的多重分类视图

2.3文件归档

文件在归档时,必须包含在某个虚拟文件夹中。归档的过程可以手工打开分类树中每层文件夹,对文档进行注册。同时,系统还可通过虚拟文件夹的分类关键字对文档注册的内容进行自动或辅助归类。

分类关键字是根据分类树的层次,由概括到详细进行逐层设置。在自动分类时。根据关键字的匹配率来判断文件的归档路径。匹配率的定义如下:

newmaker.com

其中,函数lev(n,m,k)可获得对某个子树进行访问时,其第n层的、第二个节点的、第k个关键字的序号;k为第a个关键字在文档内容中的出现次数;w是第a个关键字在该节点的权重;Km是在该节点关键字的个数。

在同一层分类中,若关键字的匹配率越高则其归属该类的可能刊嗽越大。取同层的匹配率最高的2个节点的P,和P,继续查看其下一层所有节点的匹配率,并获得其匹配率的平均值Ui和Uj。比较Ui和Uj,取其中较大的作为分类路径选择节点。如此循环,当某节点的所有子节点匹配率都为0或已经没有子节点时宁就可将同层中匹配率最高的节点作为该文档归属的分类节点。若在其分类路径上的匹配率都过低时,将建议重建分类。

如图5所示,是一个通过关键字的匹配率对文档自动归类示意图。

newmaker.com

归档的物理文件存储在公共文件服务器上。文档的存取方式有2种:对于一般公用的文档,通过如存放在文俐民务器中,但其信息(包括分类、内容介绍等)注册在公共文档信息库中;对于专属文档,直接保存在公共文档信息库中。

2.4文档的搜索与阅览

当用户需要查阅文档时,可通过文档管理的查询系统进行搜索。

在文档分类时已经建立了多重视图的虚拟文件夹分类,因此,用户可以选择最熟悉的分类方式,在文件分类树中获得所需的文档。

通过关键字搜索,也可得至关相关文件所在的文件夹或文档基本信息。由于在虚拟文件夹中包含了文档分类的关键字,所以可进行搜索的文档对象不沦是有文字内容的文档还是无文字内容的图形文件,并且保证了搜索的准确性。

搜索结果罗列了相关文件夹或文档基本信息条目。通过文档基本信息条目的查看按钮就可阅览该文档的内容。

2.5、个人工作区

文档管理系统的最终用户是企业的员工,每个员工都有自己的使用习惯,并且在网络无法连接的时候,必须保证工作的正常进行。因此,在文档管理中必须体现个性化以及本地化。

系统通过建立个人工作区来实现个性化及本地化。个人工作区是建立用户计算机上的个人文档管理子系统.有自己的文档管理数据库,同样采用虚拟文件夹的方式对文档进行管理。在个人工作区中,用户通过建立自己的虚拟文件夹,管理计算机中的文件。同时,还可建立公共虚拟文件夹的映射。

个人工作区中的虚拟文件夹与公共虚拟文件夹的数据结构基本相同,可以对文档进行多重分类,并且无需知道在计算机中物理位置。与公共虚拟文件夹不同的是无需访问权限一类的限制。

个人工作区中的文档注册通过对计算机文件的自动搜索和手工添加来完成。在自动搜索中,通过文件系统对象(File System Objeut)获得计算机中所有文件夹中文件的名称、物理位置、创建时间、修改时间、文件类型、相关应用程序等属性。而对于一些特别的文件,如文本文件、Word文件等,通过文件访问或ActiveX Automation对象技术获得文件的内容。根据虚拟文件夹的分类关键字,将文件自动的注册到个人工作区中。每个系统用户通过建立对公共虚拟文件夹的映射,可方便地访问到自己喜好的或频繁使用的公共虚拟文件夹,无需进行大量的搜索操作。如图6,是个人工作区对公共虚拟文件夹的映射示意。

newmaker.com
公共虚拟文件夹的映射

2.6文档的访问安全

安全是企业信息管理的重点工作之一。在文档管理系统中采用了基于角色的文档访问安全管理机制。

角色是文档管理系统中,用户所具备的访问权限的集合。全部角色由高级到一般分为多个层次,高级别角色可包含低基本角色,形成角色主水乏树。如图7表示了一个角色权限树的结构。

newmaker.com
角色权限树

每个系统用户都被分配了一个以上的角色.而每个虚拟文件夹也对应了一个角色列表,该列表中包含了能够访问该文件夹的所有角色。通过角色匹配,只有在角色列表中的以及包含列表角色的用户才允许访问该虚拟文件夹包含的文档,以及该文件夹之下的子文件夹中所包含的文档。

在用户查阅文档时,文件的物理存放位置以及文件所在计算机访问口令用户看不到,并且进行了加密处理,这样,也进一步增强了文档、信急保存的安全性。

2.7系统集成接口

企业PDM中还包含了其它子系统和应用软件系统的集成,如工作流子系统,AutOCAD,SolidWorks,MasterCAM等,这些系统在工作中都会产生中间文件和结果文件。

工作流子系统是PDM系统重要的组成部分。需要完成对文档的签入、签出、审核、冻结、发放、版本管理等活动功能。这些活动针对文档管理系统,主要涉及以下3个方面的功能:

(1)添加虚拟文件夹;
(2)注册文档信息;
(3)查阅文件。

文档管理系统对这些功能进行了封袭,提供了以ActiveX技术为基础的文档管理接口。通过接口调用实现了文档管理子系统与工作流子系统的集成。

许多优秀的CAD/CAM软件系统都提供了二次开发环境或接l3,如AutoCAD可使用ObjectARX,ActiveXAutomation,Lisp,VBA等方法进行二次开发;SolidWorks提供了AYI函数以及ActiveX对象模型,MasteiCAM可使用Hook等。

通过软件的二次开发。在其中调用封装了多种功能的ActiveX,以实现文档管理系统与CAx应用系统的充分集成。

3、文档管理系统的开发应用

文档管理系统需要应用到企业的许多部门,同时为工作便利和防范网络问题,因此,系统开发时既要实现文档管理的集中统一,又要兼顾个性化需求。

在系统访问模式方面采用B/S与C/S结合的模式。在公共文档访问中采用B/S模式,在个人工作区中采用C/S模式。

开发工具选用了ASP.NET和VB.NET,分别用于开发公共文档访问管理和个人工作区。数据库采用了SQL Server2000。在各功能模块开发过程中,广泛采用了ActiveX技术,方便了功能的实现和代码重用,并提供了功能封装接口,为其它系统的集成提供了有力保证。

4、结束语

本文从文档管理系统的模型、功能结构设计、开发应用等三个方面,详细阐述了基于虚拟文件夹技术的文档管理系统结构框架和实现细节。

以虚拟文件夹技术为基础,将虚拟文件夹不仅作为分类的工具,同时成为文档管理的基本对象,加强了对类别的管理,拓展了虚拟文件夹技术的外延。

文档管理是PDM系统的基础功能子系统。采用虚拟文件夹技术可以方便、灵活地实现企业对各类文档的统一管理,并为PDM其它子系统提供文档管理平台。通过实际应用,为企业管理带来良好的效益。