图书情报学核心期刊论文标题计量分析研究

图书情报学核心期刊论文标题计量分析研
情报
第26卷第3期391
ISSNl0o0一Ol35
398,2007年6月JOURNALOFTHECHINASOCIETYFORSCIENTIFIC
ANDTECHNICALINF0RMATIONISSN1000—0135
V o1.26No.3.391—398June2007
图书情报学核心期刊论文标题计量分析研究
化柏林
(中国科学技术信息研究所,北京100038)
摘要从中文科技期刊数据库(重庆维普)选取了1989年到2005年的l7种图书情报学核心期刊(2004版)的所
有论文,滤掉会议通知,征稿简则,年度索引等非正式论文后,利用VBA对42989篇文献的标题进行统计分析.统
计结果表明,标题长度符合正态分布,标题的句型相对比较集中.大多数作者会从标题中抽出一至三个关键词.
标题中的停用词与动词分布相对集中,而题首词,题尾词以及题含关键词分布相对分散一些.对标题的规律性分
析有利于进一步指导标题的拟定,计量分析的结果为后续的摘要分析以及正文内容分析提供了一些基础数据.
关键词图书情报学核心期刊标题计量分析内容分析TitleStatisticalAnalysisofPapersfromCoreJournalonLibraryandInformatics HuaBolin
(InstituteofScieut缸andTechnicalInformationofChina,Beiying100038)
AbstractBasedOilallpaperspublishedinlibraryandinformaticscorejourllalsfrom1989to2 005accordingtoChina
JournalFull—textDatabase,42989titlesareanalyzedbyusingVBAafterfilteringconferencenotice,callfo rpapersandannual
index.Theresultshowsthefollowingthreeconclusions.First,lengthoftitleisinaccordwithn ormaldistribution,andsentence
patternsoftitleaferelativecentralized.Second,mostofauthorsextractonetothreekeywordsf romcorrespondingtitle.Last,stop- wordandverbintitlearerelativelycentralized,butfirstword,lastwordandkeywordsintitlear erelativelyscattered.Analysing disciplinesoftitleareconvenienttoguidesketchingtitle.Furthermore,analyticalresultimply basicdataforfollowingabstractdpp
analysisandtextcontentanalysis.?
Keywordslibraryandinformatics,corejournal,title,bibliometrics,contentanalysis
目前,计量分析的研究主要集中在作者,作者机
构,地区,关键词,分类号,参考文献等方面,对于标
题,摘要,正文等更能反映文章内容的计量分析却很
少.本文从中文科技期刊数据库(重庆维普)选取了
1989~2005年的17种图书情报学核心期刊(2004
版)的所有论文,利用VBA过滤掉会议通知,征稿简
则,年度索引等非正式论文后,得到42989篇文章,
然后对文章标题长度,题首与题尾词,高频动词,高
频停用词,标题常用句型以及题含关键词数量进行
了统计分析.
1标题长度统计
42989篇文章的标题一共695076个字符,平均
每篇文章标题为16个字符.标题最长的为88个字
符,最短的为2个字符.最长的为英文标题,所以字
符数很长,但如果用单词计数,那么又变得太短.对
于英文字符的处理有以下几种方式:一种是把英文
翻译成中文进行计数,一种是按英文与中文的对应
统计规律进行换算(包括一个英文单词平均对应几
个中文字符或几个英文字符对应一个中文字符).
对于英文单词,译成中文后的字符数会变少,如
收稿Et期:2006年7月20Et
作者简介:化伯林,男,1977年生,硕士,主要研究方向为自然语言处理.
情报第26卷第3期2007年6月
Intemet翻译成因特网后会由8个字符变成3个字
符;对于英文缩写,译成中文后的字符数会变多,如
XML翻译成可扩展标记语言后会由3个字符变成7
个字符.所以总体上来讲英文单词与英文缩略语的
弹性长度以及出现频率对标题长度统计的影响基本
持平,可以忽略不计.文章标题长度端点值如表1
所示.
表1中所列第三条是非正式论文,但由于数据
库加工商提供了作者,关键词等,所以没能过滤掉.
标题长度10个字符以下的为3341篇,40个字符以
上的为163篇,不到千分之四,50个字符以上的有
28篇,仅为万分之六,说明长标题数量很少.其中
文章标题长度为9~22个字符的文章数量都超过
1000篇,共36209篇,占84%.介于8~24个字符的
文章数量达到38644篇,占90%.介于5~36个字
符的文章数量达到42560,占99%.也就是说,绝大
多数文章标题的长度为5~36个字符.其中15个
字符的最多,为3909篇,总体上符合正态分布,标题机械研究与应用
长度与数量分布如图1所示.
较长的标题一般含有标点符号,包括带有破折
号的讲话,带有书名号的书评,带有引号,冒号,顿号
等标点符号.不含英文字符及日期的最长标题为
65个字符,此标题含有两个破折号和一个冒号.不
带标点符号和英文字符的最长标题为35个字符"基
表1文章标题长度示意表
文章标题长度
IntegrationofaResource??OrientedV ocabularywithKnowledge-?OrientedV ocabularySy stems88
ElectronicJournalsintheDistalEnvironment:IssuesandFutureTrends7lmtg
图书馆论坛》又被确定为"图书馆学,情报学类的核心期刊"(20o4年版),并被选定为2003年"中文社会科学
70引文索引"(CSSCI)来源期刊
ChemVillage,CAonCD,ChemistryServer和Beilstein/GmelinCrossFile的比较分析67 深化改革,抓紧机遇,开拓图书信息工作的新格局——在全国"市场经济与图书馆建设"馆长研讨班开幕式上
1978年12月发生了什么大事
65
的讲话(摘要)1993年9月14Et
新世纪新视点三人谈之继承与创新,信息资源建设在新世纪面临的新课题——张勇:剪不断,理还乱的馆藏情
65结——
文献资源建设思想的反思与探索
适应市场经济的新形势深化图书馆事业的改革——在全国"市场经济与图书馆建设"馆长研讨班开幕式上的
64
讲话(摘要)1993年9月14日
以"三个代表"重要思想为指导,大力推进我国图书馆现代化建设一在中国图书馆学会第六次全国会员代表大
63
会暨2001年学术年会上的讲话
两种情报观:Information还是Intelligence?——在情报学和情报工作中引入Intelligence的思考61
图书馆个性化服务平台开发工具——0mcle9iApplicationServerPortal与uPortal的比较6l
论邮购3
复分论3
论文献3
论馆风3
论丛书3
论别集3
论浏览3
学苑追艳录
导读论3
评析2
回归2
新议2
图书情报学核心期刊论文标题计量分析研究
A__/\
/\
/\
.
在烈日和暴雨下/........■—....
16111621263136
标题长度
图1标题长度与文章数量关系分布图
于多层次概念语义网络结构的中文医学信息语义标

本文发布于:2024-09-21 17:25:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/211145.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:标题   长度   图书馆
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议