1、信息的搜集与筛选是必不可少的,信息的搜集是多元化的,当我们将信息检索出来时,如何才能更加有效的将我们想要搜索出的信息?
答:在检索之初就缩小范围,尽可能的准确有效的指向我们的目标文件。这就对我们在信息的筛选方面,有了较高的要求。在搜索时,根据自己的需求,挑选适合目标的网站,即对搜索工具进行首次筛选,其次,将自己的目标,尽可能准确且有重点的输入搜索栏,挑选较有重点的关键词,拒绝尽可能多的无关信息。这样搜索结果便可以相对有效了。
1.1主题指南与搜索引擎结合使用
1.2 缩小检索范围,采用恰当的检索表达式,限定检索范围,利用进阶检索功能,搜索力求具体化。
1.3扩大检索范围,使用同义词或近义词检索,使用All-in-one整合型检索。
1.4使用组合搜索关键词。
1.5搜索之前先思考,点击搜索结果前先分析。
2、网络信息检索的困难
因特网所涵盖的信息远远大于任何传统媒体所涵盖的信息。人们在因特网上遇到的最大的困难是如何快速、准确地从浩如烟海的信息资源中找到自己最需要的信息,对于我国用户来说,除了和国外用户面临同样的问题之外,还有信道拥挤、检索费用高、远程检索国外信息系统反应速度慢、语言和文化障碍及大多数用户没有受过网络检索专业培训等多种困难。
答:网络信息检索困难的解决办法 :1.明确检索目标,要完成一个有效检索,首先应当确定检索的目标。检索目标是指要检索的主要内容以及对检索深度和广度的要求。2.选择查询策略,不同目的的查询应使用不同的查询策略,这主要取决于是想得到一个问题的多方面信息还是简单的答案。要进行有效的搜索,最好输入与主题相关的、尽可能精确的词或词组。提供的词组越精确,检索结果就越好。同时,应通过不同词组的检索,逐渐缩小搜索范围。3.分步细化逐步接近查询结果,如果想查找某一类信息但又找不到合适的关键词,可以使用分类式搜索逐步深化。4.使用模糊查询和精确查询 。
3、信息容量大,垃圾信息多,信息真假难辨,良莠不齐,缺乏组织。
答:采用系统的检索方法和合适的检索途径和检索工具,一是要对自己的信息需求有全面详细的了解,并用简单准确的语言表达出来;二是要在平时积累检索渠道,并将好的检索渠道和工具收藏起来,以便以后再次使用;三是要在平时多练,找的多了,就有经验了。
4.、网络信息资源检索中存在的问题
4.1搜索引擎中存在的问题
用户在使用搜索引擎检索信息时,经常会搜索出一些毫不相干的内容,大大降低了信息资源的可利用度。分类目录搜索引擎采用人工干预技术,信息分类不规范,没有一个统一的控制词表和参照标准,分类目录差别较大;搜索范围较小,数据库更新慢,查询交叉类目时容易遗漏;如果用户检索请求没有对应的分类目录,则无法进行查找;信息遗漏不可避免,查全率低。关键词式全文搜索引擎采用机器人搜索技术,自动标引不完善,数据库更新快,检索功能强,但是信息关联难以控制且重复链接信息较多,查准率低。搜索引擎索引库中全部或部分下载的网页中有许多无用或暂时信息,影响了索引速度,也浪费了网络通信资源;站点、网页的内容经常变化,实时性难以保证。另外,搜索引擎的截词技术、词位限定检索、字段限定检索或范围检索技术应用十分有限,信息检索结果不太令人满意。
4.2媒体技术方面存在的问题
信息检索技术正在从传统的线性文本检索向超文本支持的非线性多媒体检索发展,然而图像、声频、视频的多媒体检索技术却还是襁褓中的婴儿,需要特别的关心与爱护。目前,多媒体检索技术主要借助于文本的信息检索,一般不涉及多媒体自身特征的分析处理,即用户从反映多媒体信息内容的文字性描述(如题名、类别、主题等)角度来入手检索,而以多媒体本身的颜色、纹理、形状、轮廓、时空关系等基本特征为入口进行检索的技术还处于研究之中。基于内容的多媒体信息检索存在的缺陷有:对其进行基于内容的识别和解释,多媒体特征的提取在检索中占有重要地位;多媒体的许多特征并不能用简单的数值和字符来精确表达,需要能表达多媒体内容特征的查询方式及用户接口;具有时空关系的多媒体数据必须确保各对象间的时空同步,它直接影响到数据库的数据模型和索引方式。
4.3信息工作者方面存在的问题
网络信息资源检索不尽如人意主要是因为从事网络信息工作的人员大多不是专业的分类人员,缺少专业知识,具体网站的信息组织人员也受到工作量的制约,不可能经过仔细的考虑去对信息资源进行组织与检索。这必然导致了信息资源检索过程中,类目名称设置得不够合理,此类问题屡见不鲜,给用户查询网络信息在一定程度上造成误导。这些问题集中表现在检索人员在检索前,常常忽视对检索课题主题内容的确切分析,而导致在检索过程中走了很多的弯路,浪费了宝贵的时间和精力。
4.4信息用户方面存在的问题
用户使用网络也存在着不适应性和局限性。网络信息资源在数量、结构、分布、类型和控制机制、传递手段等方面,都与传统的文献信息资源有着显著差异,传统的文献信息检索行为习惯,对用户仍有着广泛而深刻地影响。用户对网络信息资源的了解及其利用还存在着一个认识、接受和熟悉的过程,加之用户的受教育程度、知识结构等原因,也造成用户利用网络信息资源的局限性。主要表现在:用户对信息检索需求的理解和检索策略的制定关系到信息检索的质量;用户的计算机操作能力及网络相关知识的掌握程度影响着信息检索的效率;用户对网络信息检索工具的应用熟练程度影响着信息检索的效果;用户的外语水平影响着信息检索的广度与深度。
5、网络信息资源检索应采取的对策
5.1统一网络信息资源在分类组织上的标准
网络信息资源纷繁杂乱,需要对数据进行挖掘以实现精确分类。因此,必须制定一个统一严格的分类方法来管理,新的网络信息分类标准应是传统文献分类标准与当前网络信息分类方法相互融合的产物,传统文献分类标准应兼备传统文献分类的科学性和目前网络信息分类方法的灵活性。同时,国家应制定相关法律加强网站管理监督,严格把关,对质量较差的网站加以限制,甚至予以取缔;制定相关政策,提高网络规范程度,以保证用户的检索效率;规范网络术语,使其与常规术语接轨,提高资源共享程度。
5.2 发展搜索引擎技术,弥补不足
现有搜索引擎漏检、误检率较高,检索效率不甚理想。新开发的搜索引擎技术必须具有:信息发掘功能,数据零点更新,即及时链接新增的信息,剔除被删除的站点;多途径检索功能,用户进行交互式检索,控制信息输出,获得满意的结果;信息推荐功能,按信息关联程度排序,重要而准确的信息排在前列;高检索效率功能,虚假信息和垃圾信息被过滤,真实信息不遗漏,检准率和检全率最佳化;智能检索功能,自动分析、理解与处理检索词,为用户提供所需信息;协作检索功能,信息检索系统协同作业,不同地区、专业、语种、类型的搜索引擎应当实现数据库有条件共享或互相满足对方的信息检索请求。搜索引擎技术需要运用查询分派、数据库选择、文本选择和结果综合等技术,将多个搜索引擎有机整合,使网络信息搜索能力和覆盖面增大。
5.3 开发基于多媒体的信息检索工具
鉴于网络信息资源中多媒体成分越来越多,应积极开发基于多媒体的信息检索工具,突破传统的基于文本检索技术的局限。这种检索工具可直接对图像、视频、音频内容进行分析,抽取特征和语义,对其内容进行全面准确的标引,建立“内容—对象”关系型索引多媒体数据库。检索时计算机程序自动获取用户查询内容,然后与多媒体索引库匹配并提供内容完全一致的检索结果。对于多媒体信息对象的语义、特征,还应该包括根据人的自身体验进行明确的或者模糊的信息检索;将各类数据库合并,可提供综合的各种特征信息;甚至在图像、视频、音频的多媒体基础上,增加诸如气味、口感等多媒体检索。
5.4 注重检索主题的正确分析与选择
信息工作者要在检索前对要检索文献的范围和内容进行界定,对检索课题的主题进行正确、全面的分析。这样,既能保证检索质量也能提高检索效率,同时也是实现检索策略质量和效果最优化的基础。信息工作者需要对主题进行以下正确的分析和选择:(1)一般概念的分析。分析出检索课题主题内容所涉及的主要概念,并找出能代表这些概念的若干个词或词组,分析概念之间的关系。概念分析的结果应以单元词或词组的形式列出,以便制定下一步检索策略。(2)隐含概念的分析。隐含概念是指课题中没有明确指出的,但又与课题密切相关的概念,通常包括相关概念和上下位概念。有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够反映课题内容的检索概念。例如“废物利用”中的“利用”一词隐含着“处理”、“回收”等具体的处理方法,因此“处理”、“回收”是“废物利用”这个课题的隐含概念。(3)核心概念的选取。在分析课题中,挑选出能反映课题要求的最重要的概念,在概念分析中对有些检索词中已经含有的某些概念应予以排除。例如,课题“搜索引擎搜索信息”,从字面上看,这个课题可划分为三个概念,即“搜索引擎”、“搜索”、“信息”。但搜索引擎即是搜索信息之用,因此可将“搜索”这一概念排除在外,因此对这一课题可提出两个核心概念即“搜索引擎”和“信息”。
5.5用户友好化的进一步提高
未来科技的发展都要以人为本,网络信息检索也不例外,用户友好化是一个重要的发展趋势。它主要包括两个方面的内容,一是用户界面友好化,使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求。由于因特网是一个开放的网络,网络上的信息检索工具也越过了传统的检索中介而面向所有终端用户。在这种情况下,用户界面的易用性成为评价检索工具性能的极其重要的指标,一个友好的用户界面应该能够支持用户多种语言、多种逻辑方式、多种角度进行提问检索,尽可能使用户付出最小的努力就能掌握检索工具的使用。另一方面是为更好的检索结果提供方式,使用户方便地进行浏览、选择和利用。
6、大多数网站在信息资源的分类组织上比较混乱。主要表现在类目划分标准不合理,对信息资源在同一层次的划分标准不统一,出现同时用两个或两个以上标准划分的现象。
答:应该明确事物的外延和内涵,在信息分类时做到概念清晰,检索结果力求达到检准率和检全率的恰当的结合。