汪亮,郑智文,吴向臣,桑百惠,张洁芮,陶先平
南京大学计算机科学与技术系,计算机软件新技术全国重点实验室 开源指南针(OSS Compass)
摘要
本研究聚焦于开源软件(OSS)平台上的项目副本,围绕衡量和理解开源软件项目中副本多样性展开。本文通过构造基于 Rao 二次熵的新型副本熵,并基于项目文件的修改来衡量这种多样性。实证研究表明,开源项目的副本熵与不同的主效应之间存在显著相关性,其中包括项目的外部生产力(由外部贡献者的提交数量度量)、外部贡献者 pull-request 的接受率以及已报告的 bug 数量。此外,我们还观察到副本熵与其他因素(如副本数量)之间存在显著的交互作用。这些结果表明,副本熵作为一个有效指标,不仅丰富了当前关于开源软件项目副本的可用度量,还进一步加深了基于副本仓库开源软件发展过程的认识,并且有望支持进一步的研究和应用。