Skip to main content

12 月 13 日上午,OSS Compass(以下简称“Compass”)社区董事会 2023 第四季度会议在北京大学顺利召开。本次会议共有 10 位董事参会,其中北京大学周明辉、南京大学陶先平、南京大学汪亮、开源中国红薯、百度马红伟、华为高琨、华为王晔晖、星策社区谭中意、奇科厚德龙文选这 9 位董事冒雪现场参会,开源中国张盛翔线上参会。另有 3 位董事因故未能参会。

在之前的两篇文章《开源生态评估与度量的思考(一)——演进与趋势》和 《开源生态评估与度量的思考(二)——评估体系的多维空间》中, 我总结了开源社区评估与度量的三个主流方向:开源软件、开源项目和开源生态。以及评估体系的三维空间(图一),在“开源生态”与“协作”两个维度交织空间中,介绍了四个评估模型协作开发指数模型、社区服务与支撑模型、组织活跃度模型和社区活跃度模型(已在 OSS-Copass 部署), 并使用 Pytorch vs Tensorflow 实例来展示几个模型间的逻辑关系。

在这篇文章中,我们将主要介绍“开源生态”与“人”之间的交织产生了两个重要的评估模型:贡献者画像模型和贡献者旅程模型。这两个模型是与南京大学汪亮老师及其团队共同研究的成果,在此衷心感谢汪亮老师和他的团队为此付出的努力。

近年来,我一直从事与开源生态评估相关的工作。本系列文章旨在总结我的工作经验,并整理出接下来的工作思路,同时期待与大家的交流。

在我之前的文章《开源生态评估与度量的思考(一)——演进与趋势》中,我总结了开源社区评估与度量的三个主流方向:开源软件、开源项目和开源生态。然而,对于技术洞察工作而言,这只是迈出万里长征的第一步。

作为一名工程师,我更希望看到一个实际可行的评估体系的出现,它应具备以下几个特点:能够帮助开源社区发现具体问题,帮助人们发现有价值的开源社区,以及预测产业趋势等。

总之,这个评估体系应该是实践导向的,能够提供实际价值,而不仅仅是一种虚无缥缈的理念。

近年来,我一直从事与开源生态评估相关的工作。本系列文章旨在总结我的工作经验,并整理出接下来的工作思路,同时期待与大家的交流。

通过对过去三十多年学术界和开源产业的观察,我们可以发现开源社区评估与度量主要集中在三个主流方向:开源软件、开源项目和开源生态。这些方向的产生与时代背景密切相关,并且随着开源的发展,它们的边界逐渐模糊,相互之间也呈现出相互包含的趋势。同时由于不同市场和用户关注的重点不同,导致它们在某种程度上独立发展。

张洁芮,李颖,汪亮,陶先平,南京大学计算机科学与技术系,计算机软件新技术全国重点实验室 开源指南针(OSS Compass)

摘要:

本研究针对开源开发者社交网络中的演化行为认知这一主题,为克服传统社区演化行为分析技术偏重定性而非定量这一局限性,提出了一组基于信息熵的社区分裂、缩减、合并和扩大指数来度量开源开发者社交网络中的社区演化行为。实证研究表明,该组指数能够有效刻画开源社区的演化,通过简单的规则变化能够取得和现有定性工作相一致的结论,准确率达到 94.1%。同时,进一步的研究表明,所提出的社区演化指数与开源项目以 commit 数量为代表的生产力之间存在显著的关联关系。本研究所提出的基于信息熵的度量指数为我们定量认知和分析开源社区的演化行为提供了支持。

刘政,祖小岚,罗星宇,王子杭,张洁芮,王晔晖,汪亮, 陶先平 南京大学计算机科学与技术系,软件新技术全国重点实验室 华为技术有限公司 开源指南针(OSS Compass)

摘要

本方法基于 OSS Compass 指标预测开源项目的未来活跃状态。该方法采用了基于特征的时间序列分类预测方法,通过提取 OSS Compass 指标序列中的统计特征,训练并运用机器学习智能分类模型对项目未来的活跃/不活跃状态进行预测,同时给出近似概率估计。在近 600 个项目数据集上的交叉验证结果显示,该方法的准确率接近 90%。在泛化能力方面,本方法在超过一万个仓库的数据集上仍能够达到 80%的准确率,初步具备现实可用性。分析结果能够部分反映开源项目的未来健康状态,进而展示了 OSS Compass 指标体系在度量开源软件健康度上的有效性。该方法有望为开源软件的用户、开发者、投资者和管理者提供有价值的参考信息。

汪亮1,2^{1,2},郑智文1,2^{1,2},吴向臣1,2^{1,2},桑百惠1,2^{1,2},张洁芮1,2^{1,2},陶先平1,2^{1,2}

1^1南京大学计算机科学与技术系,计算机软件新技术全国重点实验室 2^2开源指南针(OSS Compass)

摘要

本研究聚焦于开源软件(OSS)平台上的项目副本,围绕衡量和理解开源软件项目中副本多样性展开。本文通过构造基于 Rao 二次熵的新型副本熵,并基于项目文件的修改来衡量这种多样性。实证研究表明,开源项目的副本熵与不同的主效应之间存在显著相关性,其中包括项目的外部生产力(由外部贡献者的提交数量度量)、外部贡献者 pull-request 的接受率以及已报告的 bug 数量。此外,我们还观察到副本熵与其他因素(如副本数量)之间存在显著的交互作用。这些结果表明,副本熵作为一个有效指标,不仅丰富了当前关于开源软件项目副本的可用度量,还进一步加深了基于副本仓库开源软件发展过程的认识,并且有望支持进一步的研究和应用。

深圳,2023 年 10 月 24 日 - 今天上午,国家工业信息安全发展研究中心联合南京大学、华为、开源中国、百度等单位在“2023 深圳•中国 1024 程序员节”上隆重启动了“开源社区发展行动”,旨在推动开源社区的健康发展。此次行动将依托 OSS Compass 社区的研究成果,发布国内首个综合性开源社区发展评价指数,同时构建不同技术领域的开源社区生态发展评估体系。

在活动现场,国家工业信息安全发展研究中心总工程师周平、华为开源管理中心主任柯猛,以及 OSS Compass 社区的两位董事——南京大学汪亮副教授和开源中国 CTO 红薯等嘉宾齐聚一堂,共同出席了启动仪式,见证了这一重要行动的正式开始。

近年来,数字经济已成为全球经济的新引擎和新动能,而开源在数字技术的快速升级和融合中扮演着至关重要的角色。开源协作持续引领数字技术标准的创新发展,不断推动传统产业格局和商业模式的变革,逐渐成为支撑数字经济快速发展和数字化转型的关键支撑。通过促进开源创新生态的建设,我们将能够加速数字技术的变革和应用,为经济的发展提供更为强劲的内在动力,为经济社会数字化转型和模式的转变带来新的机遇。

在如今开源应用和参与的日益重要性下,如何评估开源生态、如何促进开源社区和开源项目的健康和可持续发展已经成为政府、企业以及个人开发者的共同关切。OSS Compass 的诞生正是为了给政府部门、开源社区、企业和开发者等各界提供有价值的数据洞察和趋势分析,从而助力我国开源生态的健康和可持续发展。现在,“开源社区发展行动”的正式启动将有助于进一步推动开源社区的发展,促进数字技术的创新,并为我国经济的数字化转型提供更多支持和动力。

社区大事件

  • 9 月 21 日参加 OSS EU 2023 并发表演讲,进一步扩大了 OSS Compass 在欧洲乃至全球的影响力,会后收到欧美知名开源项目的合作邀请。

  • Compass 成为 CHAOSS 的合作伙伴,CHAOSS 正在推进与 Compass 的深度合作。

  • Compass 支持南大学术研究,为 CCF-A 类会议论文提供数据支持。

  • Compass 助力《2023 中国基础软件开源产业研究白皮书》发布。

  • 8 月 23 日组织 2023 年度首次社区 Board 会议。

  • 8 月 23 日组织 Compass 实验室发布直播活动,触达受众上万人。

Copyright © 2022 开源指南针。保留所有权利。