洛特卡定律及其應用

| 邵婉卿

【文 / 編譯發展中心助理研究員 邵婉卿】

洛特卡定律(Lotka's Law)主要是探討作者人數與其出版文獻數量之間的關係。洛特卡(Alfred James Lotka, 1880-1949)是一位統計學家、數學家與物理化學家,為了證明不同才能的科學家和學者,對科學進步所作出的貢獻亦不相同,以對數坐標表現出作者的出現頻率和發表論文數量之間的關係,發現科學著作作者著述能力的規律。他隨即提出著名的科學生產力倒平方律(Inverse Square Law of Scientific Productivity):發表X篇論文著作數約等於X篇論文數的倒平方數,按此比例,所有寫過一篇論文的作者比例大約占作者總數的60.79%:發表n篇論文的作者總數,是發表1篇論文作者總數的n平方分之一,如寫2篇論文的作者數量約為寫1篇論文作者數量的1/4;寫3篇論文作者數量約為寫一篇論文作者數量的1/9;寫n篇論文的作者數量約為寫一篇論文作者數量的;另外,只發表一篇論文的作者總數,約占全部作者總數的60.79%。洛特卡定律因此多用來假設在學術活動中,不同研究能力的人,其著述數量肯定不同,而且在同樣的一段抽樣時間內,不同學術工作者的論著數量分布有其規律。

最早盧梭(Jean-Jacques Roussean, 1712-1778)即曾提出「任何產品集合N中,品質優良的產品數量,約等於全部產品N的平方根,即。」1963年普萊斯(Derek de Solla Price, 1922-1983)則提出科學家的總人數,大致是按傑出科學家人數的平方增長的普萊斯定律(Price Law),即科學家總人數的平方根,是撰寫所有科學論文的50%,優秀科學家中最低產量的那位所發表的論文數,等於最高產量科學家所發表論文數的平方根的0.749倍。現代許多有關學術生產率的計算都是以洛特卡和普萊斯的研究成果為基礎,這和義大利經濟學家帕雷托(Vilfredo Pareto)提出的80/20法則(Pareto Principle)類似,例如職場上20%的人承擔了80%的工作量,大多數作者一生只發表12篇文章,只有少數作者一生著作等身。

研究學者的著述特徵以及研究文獻按作者分布的規律時,研究結論大致都符合洛特卡定律的分布特徵,顯示學術人員的著述狀況和發表論文的數量,可以進而揭示學者生產文獻的能力。國內外的研究都發現:發表文獻數與作者人數呈反比現象;筆者檢視近二十年針對洛特卡定律所進行調查的研究結果後,得出之平均值為:發表1篇期刊論文或出版1本圖書的著作者,占所有作者數的65.32%,發表2篇期刊論文或圖書著作者,占所有作者數的15.41%,發表3篇期刊論文或圖書著作者,占所有作者數的6.39%,以上大致符合洛特卡的發現;有趣的是,發表1-2篇期刊論文或圖書著作的作者數共占所有作者數的80.73%,也大致符合普來斯定律和80/20法則,根據201112月一份博士論文的最新研究結果,維基百科中科學條目的貢獻者,也符合這項定律。

可見,高生產率與高影響力的作者群,是由較少數的學者專家所組成。洛特卡定律探討學術論文著者的不平衡分布規律,可以推論出在宏觀的學術著述活動中,只有少數作者寫出了大量的文章;反之,大多數人的著述是不多的,可見學者及其論著間的數量關係有很重要的現實意義。

然而,洛特卡定律只能作數量上的分析,無法肯定文獻的品質和作者的權威。文獻資料是出自人為的產物,必然伴隨著極大的變數,無法絕對客觀或保證無誤。但是這種「馬太效應」的分布狀況和影響的描述,在現實世界中,卻是恆常不變的真理。


【參考文獻】

Ballon-Moreno,R., Jurado-Alameda,E., Ruiz-Banos, R. & Courtial, J. P.2005. Bibliometric laws: Empirical flaws of fit. Scientometrics, 632,209-229.

Chen, Ye-Sho & Leimkuhler, Ferdinand F.1986. A Relationship Between Lotka’s Law, Bradford’s Law, and Zipf’s Law. Journal of the American Society for Information Science, 75, 307-314.

Hutchinson, J. P. 2011. A Theoretical Approach To Legitimizing Collaboratively Constructed Knowledge: A Content Analysis of Wikipedia Science Articles Based on Accidental Collaboration. University of Northern Colorado, College of Education and Behavioral Sciences Department of Educational Technology. Doctor of Philosophy dissertation.

Paisley, William1989. Bibliometrics, scholarly communication, and communication research. Communication Research, 165, 701-717.

Petek, Marija2008. Personal name headings in COBIB: Testing Lotka’s Law. Scientometrics, 751, 175-188.