2003年4月“档案文献检索”串讲资料
1. 广义的档案文献检索包括存储和查找两个具体过程。前者是指将档案中具有检索意义的特征标识出来,通过编制检索工具、建立数据库等方法使之成为有序的档案信息集合的过程;后者则是指在档案信息集合中选择、获取特定档案信息的过程。
2. 简答档案文献检索的基本原理:是实现档案需求与相关档案信息的匹配,即将特定的档案需求与存储在检索系统中的档案信息进行相符性比较,根据一定标准从中选择出符合需求的档案信息。匹配的实现是存储和查找互相作用的结果。
3. 存储阶段的目的是:使档案信息达到高度的组织化。主要采取对档案文献进行标识化压缩处理的方法,即把档案文献中具有检索意义的特征用语词、代码等符号表示出来,通过编目、编写提要等方式将档案原件转换成一种篇幅较短的特殊文献形式,一般成为简短记录档案文献特征的一个条目,并按照一定的规则把这些条目组织起来,形成有序的档案信息集合,供查找之用。
4. 查找阶段的目的:是获取所需档案信息,主要方法是对档案需求课题进行标识化处理,形成检索提问,再将提问标识与档案信息集合中的标识进行相符性比较,选择出所需要的档案信息,也就是说,在存储的逆过程中把所需档案查找出来。(3、4题可合并一题)
5. 档案文献检索同其他文献检索一样,可以采取三种形式:
(1) 数据检索。这种检索是直接回答利用者所需要的有关特定主题的查询,检索出的结果是数据、公式、图表等。
(2) 事实检索。这种检索也是直接回答利用者所需特定主题的确定性检索,检索出的结果是某种事实。
(3) 文献检索。这种检索是要查出记载所需信息的档案文献,但检索结果所提供的并不是文献本身,而是文献线索,检索人员借助文献线索中提供的存址提取档案文献,再从文献中获得所需信息。
6. 试述档案文献检索系统的构成与功能?
档案文献检索系统是一个由若干因素、若干工作环节构成的动态系统,这些因素或环节互相影响、互相制约。从检索系统的整体功能出发,去设计规划各个因素或环节的构成方式及其相互关系,可以使整个检索系统的功能得到改善,从而获得较好的检索效果。档案文献检索系统包括两大部分:存储部分和检索部分。存储部分的主要功能是通过著录标引、编制检索工具、建立数据库等手段使档案信息有序化;档案部分的主要功能是通过编制检索策略实现利用者提问与档案信息的有效匹配。
在存储档案时,档案标引人员首先要对档案文献的内容进行主题分析,形成若干能反映其主题的概念,并借助于检索语言把这些概念转换成规范化的检索标识,这一段工作就是档案的著录标引。
在检索(查找)档案文献时,档案检索人员首先要根据利用者的提问确定其所需档案的实质内容,形成概念,然后同样借助于检索语言,把表示检索课题的概念转换成规范化的检索标识,并按实际需求把这些标识之间的逻辑关系表达出来,形成检索表达式。
7. 档案文献单元方式按照目录构成或计算机文档中数据排列方式的不同,可区分为文献单元方式和标识单元方式。
8. 文献单元方式:在计算机检索中又称为顺检方式、顺序文档。它以一份文献为一个条目,指明该文献的各种特征,即以文献为单元进行检索。
9. 标识单元方式:在计算机检索中又称为逆检方式、倒排文档。它以文献的一个属性标识为单元,指明含有该属性的全部文献,一般只有标识和文献号(档号)两个项目。
10. 检索效率是指在检索过程中满足利用者的全面性和准确性程度,它是衡量检索系统性能的一个最基本的指标。检索效率通常采用查全率和查准率两个指标来衡量和表示。
11. 查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。
12. 查准率是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。
13. 简答查全率和查准率的关系:查全率和查准率之间存在着互逆关系的结论。也就是说,如果放宽检索以达到较好的查全率,那么查准率就会下降;反之,若是限制检索范围以改善查准率,则查全率就会变坏。当进行范围宽泛的检索时,查全率很高,可以达到90%左右,而这时查准率则很低;相反,当检索范围小,很专指时,则查准率较高,查全率较低。
14. 论述影响检索效率的因素:
(1)检索语言的功能。检索语言是沟通档案文献存储和查找两个过程的桥梁,对于特定的需求信息与纳入检索系统的信息集合的准确匹配具有直接的影响。
(2)检索途径的数量。从理论上说,档案在存入检索系统之后,该系统向利用者提供的检索途径愈多,它被查到的概率也就愈高。
(3)著录标引的质量。检索标识是组织检索工具、进行检索的依据,因此,检索标识的准确性也是影响查全率、查准率的一个重要因素。
(4)检索策略的优劣。 如果说,档案著录标引的结果对于文献存储的质量至关重要,那么,检索策略在查找过程中则具有决定性的作用。
(5)检索人员的素质。不论是手工检索系统还是机械检索系统,都要由检索人员来参与和控制检索过程,上述因素中除检索语言之外,均与检索人员的素质有关,因此检索人员的素质对于检索效率有直接的影响。
15.简档案文献检索系统评价的目的和作用:系统评价就是对系统的效率和价值进行测定,它是对系统进行科学管理的重要依据。主要目的是对系统整体及其组成要素的功能、特性和运营情况进行评测。作用主要有三个方面:(1)明确系统当前的性能特征,从而科学地、最大限度地发挥系统的功能。(2)发现系统现存的缺陷及其原因,提出改进意见或其他对策。(3)为设计和建立新的档案文献检索系统提供参考。
16.试述系统评价的指标体系:档案文献检索系统评价的指标主要包括数据覆盖率、检索效率、响应时间、可存取性、费用等。
(1)数据覆盖率又称为收录范围,指一个检索系统已收录数据量与应收录数据量的百分比,它反映该检索系统的资源拥有状况。
(2)查全率和查准率。二者实质上反映了系统运行结果与利用者检索要求的吻合程度,是衡量检索系统性能的最重要的指标。需要说明的是,在实际测评时根据公式计算出来的查全率和查准率常常不能完全准确地反映系统的实际检索效率,其主要原因是:①对文献相关性的判断不可避免地带有主观性和模糊性。②查全率是以检索系统中与某一检索要求相关的文献总数作为分母,计算检出的相关文献在全部相关文献中的比例,而检索人员和评价人员都难以确定这个总数是多少。③在计算查全率、查准率时,“相关文献”被同等看待,不作任何区分,而实际上,在一组相关文献中,每一份文献的相关程度是有差异的。
(3)响应时间。它是指一次检索过程中从利用者向检索系统提出问题到检索系统完成匹配过程,形成检索结果,交付利用者所需的全部时间。
(4)可存取性。是指一个档案文献检索系统的易用程度。
(5)费用。构造和维持一个档案文献检索系统需要投入一定的费用,利用者检索档案文献也要有一定的支出,这些投入包括货币和活劳动两种形式。
17.简系统评价步骤:(1)制订评价方案。包括确定对该系统进行评价时采用哪些评价指标。
(2)评价对象调查。可根据评价对象以及评价指标的特点采用问卷调查、抽样调查等不同的方法。(3)测试。根据样本进行检索测试,然后对检索结果的相关性、响应时间、系统易用程度等进行判断。(4)数据处理与分析。对调查测试的各种原始数据进行整理、计算,得出有关评价对象的各种性能指标。(5)对评价结果进行分析,提出改进意见。
第二章 检索语言
1.检索语言:是根据检索的需要而创制的人工语言,专门用于各种手工的和计算机化的文献信息检索系统,表达文献主题概念和检索课题概念。
2.简答检索语言的基本功能:主要有以下四个方面:①对文献的主题加以标引的功能;②对内容相同及相关的文献主题加以集中或揭示其相关性的功能;③对大量文献信息加以系统化或组织化;④便于将标引用语和检索用语进行相符性比较。
3.产生检索语言第一项基本功能的结构:(1)编码型标识结构。(2)组配型标识结构。(3)层次型结构标识。
4.产生检索语言第二项基本功能的结构:(1)等级结构(2)参照系统结构(3)轮排聚类结构。
5.按构成原理,可分为分类检索语言、主题检索语言和代码检索语言三大类型。
6.简答构成原理:(1)分类检索语言。其特点是用分类号来表达各种概念,把各种概念按知识分类进行系统组织和排列,有很好的系统性。(2)主题检索语言。其特点是用取自自然语言的语词来表达各种概念,把各种概念完全按字顺排列而不管其相互关系如何,其标识有很好的直接性。(3)代码检索语言。它一般只就事物的某一方面特征,用某种代码系统来加以标引和排列。(4)引证关系追溯法。即引文索引法,是显示科学论文之间互相引证而形成的论文网的一种方法。
7.主题检索语言包括标题词语言(标题法)、单元词语言(单元词法)、叙词语言(叙词法)和关键词语言(关键词法),它们可统称为主题法系统。
8.简答先组式语言与后组式语言有何区别:先组式语言就是文献标识在编表时就已固定组配好,或绝大部分已固定组配好,如体系分类法和标题词法。后组式语言就是文献标识到标引和检索时才组配起来,如单元词法和叙词法。
第三章 分类检索语言及《中国档案分类尖》
1.简答注释的作用:具体可归纳为三点:(1)当类目的雠不够明确时,用注释来明确。(2)当类目之间的关系不可能用等级结构来显示时,用注释来显示。(3)当在分类方法上有有某些需要说明的地方时,用注释来加以说明。
2.论述分类检索语言的特点和作用:特点:(1)它是一部类目的汇编,对表达事物概念的类目起登录作用;(2)它是一个类目的体系,从学科分类、事物分类或职能分类等角度揭示类目之间的关系;(3)它是一部类目的“词典”,除类目名称本身外,还借助于等级体系形式以及注释,对类目起定义作用;(4)它是一种类目的排列表,通过线性排列形式和分类号,明确规定着各个类目在分类体系中的位置和次序。
作用:(1)它是进行分类标引和组织分类检索工具的规范。(2)它能作为对文献资料进行分类排架的依据。(3)它是检索者从分类途径检索文献资料的指南。(4)它是文献工作人员工作中常用的参考手册。
3.简答分类应遵守哪些规则:第一,在每一次划分时,只使用一个划分标准,不能同时使用两上或两个以上的划分标准,否则会出现划分后所得各子类互相交叉、重叠的混乱现象;第二,划分后所得各子类的外延之和应等于其母类的外延,避免不完全划分的错误和多出子类的错误;第三,要选择反映事物本质的符合分类目的的属性作为划分标准。
4.简答类目划分:类目的划分包括分类标准的选择和分类标准使用次序的选择两个问题。(1)分类标准的选择决定着提供什么检索途径。分类标准的选择是指在一类事物的各种可作为分类标准的属性中,选择什么属性作为分类标准。(2)分类标准使用次序的选择,决定着形成什么样的分类体系结构。分类标准的使用次序,是指当某一类事物连续划分需要采用几种分类标准时,这几种分类标准使用的先后次序。
5.论述自然序列对同位类排列的要求及其在《中国档案分类法》中的运用:自然序列对同位类的排列要求是:连续性、规律性、稳定性、重要类目的突出性。其中最重要的是连续性。在《中国档案分类法》中采用了如下几种自然序列:(1)按社会及各种现象的发展过程排列。(2)按从低级事物到高级事物的次序排列。(3)按生产流程或制作流程的次序排列。(4)按习惯次序排列。(5)按时间顺序从古到今排列。(6)按地理位置由近及远排列。
6.同位类排列的人为序列的主要形式:人为序列就是按照事物的重要程序排列。这种排列法虽带有人为性,但如能合理安排,也能产生很好的效果。人为序列包括:(1)从重要事物类目到次要事物类目的排列次序。(2)从有较多文献论述的事物类目到只有很少文献论述的事物类目的排列次序。(3)从抽象的、理论的、一般性问题的类目到具体的、应用的、个别性问题的类目的排列次序。
7.列类的方法与原则:(1)正规列类法。即对一个外延较广的概念或范围较大的类目。(2)列举列类法。即虽是采用某一个分类标准来编列一系列子目,但其子目之和少于被划分的上位类,未列子目的事物概念或者设一其他类加以概括。(3)重点列类法。即只列出少数几项重点内容作为子目,其余内容仍包括在上位类中。(4)罗列列类法。有两种情况:一种是并非根据某个明确的划分标准。另一种是根据某一分类标准构成一系列子目。(5)对应列类法。即采用相关专业的同一分类标准来构成相应的一组子目。(6)集中列类法。即根据检索上的特殊需要,把按照一般划分原则应分散的内容集中列类。(7)突出列类法。即将个别重要事物单独列类。(8)归附列类法。即将按学科、专业、职能分类不能集中在一起事物按某种联系归附于有关类目。(9)合并列类法。即将若干个相近的并列概念合并设立一个类目。(10)交替列类法。即对可以隶属于两个或两个以上学科、专业、职能的事物在各有关类下都设立子目。(11)专表列类法。
8.简答类目注释的作用与方式:概括起来说,注释的作用是明确类目的涵义,明确类目之间的关系,明确分类方法。一部分类表的注释可适当多一些,但必须是必要的。特别应注意的是:注释必须准确、简短、明白,力求避免作那些含糊的、自相矛盾的、冗长的、不必要的甚至是错误的确良注释。要写好注释,写注释的人员就要对分类体系时常明了。注释要与分类体系协调而不能与分类体系相抵触。对类目作注释,既不强求一律,也要有一定规范。可根据具体情况,采用合适的注释方式和措辞。
9.简答分类标记的配置:分类标记即分类号,它是由具有自然顺序的标记符号构成的。分类号是类目的代号,是分类检索语言的语词。现代分类法都用分类号作标识。使用分类号作为分类检索语言语词的优点在于:(1)可以明确各个类目之间的先后次序,便于排列目录和组织馆藏;(2)用分类号标引文献比较简单;(3)在检索时容易将代表检索课题的分类号与代表文献内容的分类号作相符性比较;(4)层累制分类号在一定程度上可以表达各个类目之间的从属关系和并列关系;(5)层累制标记法和分段标记法在一定程度上可以帮助分辨一个类目的涵义。
10.标记制度是指分类号的构成方法,可分为顺序制、层累制和混合制三种。
11.简答标记制度的分类:标记制度是指分类号的构成方法,可分为顺序制、层累制和混合制三种。(1)顺序制。即用若干个数字或字母编成固定长度的连贯的号码,按分类体系中类目的直线排列顺序,不分级别依次标志全部类目。(2)层累制。即用一位数字或一个字母来标志大类,再加一位数字或一个字母来标志它的下位类……如此层层累加数字或字母,用来表达类目的层层划分以及类目之间的隶属和并列关系。(3)混合制。一般是将分类号分成两部分,一部分用层累制,一部分用顺序制。
12.试述体系分类法的局限性:(1)体系分类法自身存在着一个难以克服的矛盾——集中与分散矛盾。这一矛盾使得体系分类法在适应利用者需求方面表现出很大的局限性。(2)体第分类主要采用列举式的列类方法。(3)体系分类法严格的逻辑体系给增加、删减类目造成困难。
13.简答《中国档案分类法》的分类原则:《中国档案分类法》是以不同历史时期的国家机构、社会组织,从事社会实践活动的职能分工为基础,并紧密结合档案记述和反映的事物属性关系,来建立从总到分,从一般到具体的逻辑体系。《中国档案分类法》是一部完整的体系分类表,它主要由编制说明、大纲、简表、详表、辅助等组成部分构成。这些组成部分分别具有自己的结构和功能,各自发挥着独特作用,并互相配合丰富和增强体系分类表的整体功能。
14.简答分面组配分类法:是根据概念的分析和综合编制的文献分类法,又称分面分类法、组配分类法、分析—综合分类法。它将主题概念分解为简单概念,按照它们所属的方面或范畴,分别编列成表。标引时用两个或多个简单概念的分类号的组合来表达一个复杂的主题概念。
15.简答分面分类法的特点:第一,分面组配式分类法虽然类目较少,但能通过类目的组配表示众多的主题概念,标引文献的能力强于体系分类法。第二,可以较自由地扩大或缩小检索范围,能多多途径检索文献,还可以进行比较精确的组配检索,在检索性能和检索效率方面都优于体系分类法。第三,采用分段标记制度,便于分类标记,便于分类表的增补和修订,检索较为灵活。第四,可用于组织分类目录以及建立分类检索系统等。
第四章 主题检索语言及《中国档案主题词表》
1.简答主题检索语言的特点和性能:它的特点是:语词标识几乎都是事物的名称,关于同一事物的文献全部被集中标引在同一语词标识下,所以要在主题检索系统中查全同一事物的档案就比较容易。它的性能有:(1)控制主题检索系统所用的语词标识,以保证其具有较高的检索效率。(2)引导使用者周密选用检索词,以便准确、全面地标引和检索文献。(3)方便标引人员和检索人员查找所需检索词。
2 .简叙词的优点有哪些:叙词法就其基本性质而言,是一种采用表示单元概念的规范化语词的组配来对文献主题进行描述的后组式词汇型概念标识系统。叙词法比其他主题检索语言具有更好的性能,体现了检索语言的发展趋势。绝大部分计算机检索系统都采用叙词法。
3.简叙词法的构成原理:(1)按主题集中文献;(2)用规范化的、可以通过组配来表达复杂概念的语词直接标引文献主题;(3)用参照系统、分类索引、等级索引、轮排索引和主题词关系图等多种方式来显示主题概念之间的相互关系;(4)用字顺序列直接提供主题检索途径;(5)用于标识单元方式手工检索系统或用于计算机检索系统时,具有标引深度大,能够实现我途径检索,扩大、缩小或改变检索范围灵活,适应多种检索要求等优点。
4.简答主题词的组配:概念组配是决定其特点的基本原理。概念组配即概念的分析与综合。概念组配与字面组配在形式上有时相同,有时不同;从性质上说,两者有着原则性的区别。字面组配,其实质是词的分拆与组合;概念组配,其实质是词义的分析与综合。两者检索效果有很大差异。
5.简主题词组配的作用:(1)可以控制词汇量。(2)可以对同一项情报进行多途径检索。(3)可以自由扩大、缩小或改变检索范围。(4)可以及时地反映新事物、新学科。
6.简《中国档案主题词表》特点:其特点仅在于:(1)在文书档案用词方面,为体现文献保证原则,因而所选的词一般主题词表有较大区别。而就科技档案和某些专门档案的主题词表而言,其区别不大。(2)其范畴索引也如档案分类表一样,以国家机构和社会组织从事社会实践活动的职能分工为基础来建立分类体系和对主题词进行归类。(3)为保持历史原貌,便于标引和检索,对古代档案用词也予收录。(4)档案主题词表除个别的以外一般不需要标注外文同义词和设置双语种对照索引。
7.简《中国档案主题词表》的结构体系:(1)主题词字顺表;(2)主题词分类索引;(3)主题词等级索引;(4)主题词轮排索引;(5)词双语种对照索引;(6)专有主题词索引;(7)正式主题词索引和款目词索引;(8)主题词关系图。
8.每条词款目大体可分为款目词、标注项和参照项三部分。
9.简字顺表的功用:一是提供从字顺查词的途径;二是可通过参照系统,获知与所查获词有密切联系的词,既可提高选用主题词的准确性,又有助于检索中扩大、缩小、改变检索范围;三是可以通过其标注的范畴类号和族首词,比较容易地进入范畴索引和词族索引;四是还可获得主题词的其他信息。
10.简词族索引的功能:词族索引是把主表中具有属分关系、包含关系和整体部分关系的正式主题词,按规定属分级别展开全显示的一种词族系统。词族索引的功能是可以从一族中外延最广的主题词出发,找到其全部同族词,并且可以明确它们之间的层层隶属关系,从而弥补主题词字顺表族性检索功能差的缺点。在机检系统中是实现自动扩检、缩检及上位词登录的重要手段。
本文标签:山东自考 串讲笔记 2003年4月“档案文献检索”串讲资料
转载请注明:文章转载自(http://www.sdzk.sd.cn)
《山东自考网》免责声明:
1、由于各方面情况的调整与变化,本网提供的考试信息仅供参考,考试信息以省考试院及院校官方发布的信息为准。
2、本站内容信息均来源网络收集整理,标注来源为其它媒体的稿件转载,免费转载出于非商业性学习目的,版权归原作者所有,如有内容与版权问题等请与本站联系,本站将第一时间尽快处理删除。联系邮箱:812379481@qq.com。