Skip to main content

近年来,我一直从事与开源生态评估相关的工作。本系列文章旨在总结我的工作经验,并整理出接下来的工作思路,同时期待与大家的交流。

在我之前的文章《开源生态评估与度量的思考(一)——演进与趋势》中,我总结了开源社区评估与度量的三个主流方向:开源软件、开源项目和开源生态。然而,对于技术洞察工作而言,这只是迈出万里长征的第一步。

作为一名工程师,我更希望看到一个实际可行的评估体系的出现,它应具备以下几个特点:能够帮助开源社区发现具体问题,帮助人们发现有价值的开源社区,以及预测产业趋势等。

总之,这个评估体系应该是实践导向的,能够提供实际价值,而不仅仅是一种虚无缥缈的理念。

近年来,我一直从事与开源生态评估相关的工作。本系列文章旨在总结我的工作经验,并整理出接下来的工作思路,同时期待与大家的交流。

通过对过去三十多年学术界和开源产业的观察,我们可以发现开源社区评估与度量主要集中在三个主流方向:开源软件、开源项目和开源生态。这些方向的产生与时代背景密切相关,并且随着开源的发展,它们的边界逐渐模糊,相互之间也呈现出相互包含的趋势。同时由于不同市场和用户关注的重点不同,导致它们在某种程度上独立发展。

张洁芮,李颖,汪亮,陶先平,南京大学计算机科学与技术系,计算机软件新技术全国重点实验室 开源指南针(OSS Compass)

摘要:

本研究针对开源开发者社交网络中的演化行为认知这一主题,为克服传统社区演化行为分析技术偏重定性而非定量这一局限性,提出了一组基于信息熵的社区分裂、缩减、合并和扩大指数来度量开源开发者社交网络中的社区演化行为。实证研究表明,该组指数能够有效刻画开源社区的演化,通过简单的规则变化能够取得和现有定性工作相一致的结论,准确率达到 94.1%。同时,进一步的研究表明,所提出的社区演化指数与开源项目以 commit 数量为代表的生产力之间存在显著的关联关系。本研究所提出的基于信息熵的度量指数为我们定量认知和分析开源社区的演化行为提供了支持。

刘政,祖小岚,罗星宇,王子杭,张洁芮,王晔晖,汪亮, 陶先平 南京大学计算机科学与技术系,软件新技术全国重点实验室 华为技术有限公司 开源指南针(OSS Compass)

摘要

本方法基于 OSS Compass 指标预测开源项目的未来活跃状态。该方法采用了基于特征的时间序列分类预测方法,通过提取 OSS Compass 指标序列中的统计特征,训练并运用机器学习智能分类模型对项目未来的活跃/不活跃状态进行预测,同时给出近似概率估计。在近 600 个项目数据集上的交叉验证结果显示,该方法的准确率接近 90%。在泛化能力方面,本方法在超过一万个仓库的数据集上仍能够达到 80%的准确率,初步具备现实可用性。分析结果能够部分反映开源项目的未来健康状态,进而展示了 OSS Compass 指标体系在度量开源软件健康度上的有效性。该方法有望为开源软件的用户、开发者、投资者和管理者提供有价值的参考信息。

汪亮1,2^{1,2},郑智文1,2^{1,2},吴向臣1,2^{1,2},桑百惠1,2^{1,2},张洁芮1,2^{1,2},陶先平1,2^{1,2}

1^1南京大学计算机科学与技术系,计算机软件新技术全国重点实验室 2^2开源指南针(OSS Compass)

摘要

本研究聚焦于开源软件(OSS)平台上的项目副本,围绕衡量和理解开源软件项目中副本多样性展开。本文通过构造基于 Rao 二次熵的新型副本熵,并基于项目文件的修改来衡量这种多样性。实证研究表明,开源项目的副本熵与不同的主效应之间存在显著相关性,其中包括项目的外部生产力(由外部贡献者的提交数量度量)、外部贡献者 pull-request 的接受率以及已报告的 bug 数量。此外,我们还观察到副本熵与其他因素(如副本数量)之间存在显著的交互作用。这些结果表明,副本熵作为一个有效指标,不仅丰富了当前关于开源软件项目副本的可用度量,还进一步加深了基于副本仓库开源软件发展过程的认识,并且有望支持进一步的研究和应用。

社区大事件

  • 9 月 21 日参加 OSS EU 2023 并发表演讲,进一步扩大了 OSS Compass 在欧洲乃至全球的影响力,会后收到欧美知名开源项目的合作邀请。

  • Compass 成为 CHAOSS 的合作伙伴,CHAOSS 正在推进与 Compass 的深度合作。

  • Compass 支持南大学术研究,为 CCF-A 类会议论文提供数据支持。

  • Compass 助力《2023 中国基础软件开源产业研究白皮书》发布。

  • 8 月 23 日组织 2023 年度首次社区 Board 会议。

  • 8 月 23 日组织 Compass 实验室发布直播活动,触达受众上万人。

Part1。社区价值

用户增长

从 7 月到 9 月,官网总用户数 9300+,新增用户 3300+。

1.png

大部分用户来自中国内地,同时来自欧美、日本、新加坡、台湾、香港等国家和地区的用户超过 30%。

2.png

战略合作

9 月 21 日,王晔晖代表 Compass 和 CHAOSS 参加 OSS EU 2023 并发表演讲,进一步扩大了 OSS Compass 在欧洲乃至全球的影响力,会后收到欧美知名开源项目的合作邀请。

1.png

OSS Compass 超前预见 PyTorch 超越 TensorFlow

与 CHAOSS 达成合作伙伴关系,CHAOSS 正在推动与 Compass 的深度合作。

2.png

Compass 支持北京大学、南京大学等高校的学术研究,为南大汪亮老师团队的 CCF-A 类会议论文提供数据支持。

1.png

开源 Fork 熵度量,Compass 支持 CCF-A 类会议论文研究

Compass 为 9 月 21 日华为全联接大会上发布的《2023 中国基础软件开源产业研究白皮书》提供数据支持,该报告由艾瑞咨询发布。

1.png

OSS Compass 助力《2023 年中国基础软件开源产业研究白皮书》发布

Part2。技术进展

自从 2023 年 2 月 21 日正式对外发布以来,OSS Compass 一直在技术层面不断加速迭代和优化,以提供更出色的指标模型和 SaaS 服务。同时也在不断扩充数据集。

数据集

从 7 月份到 9 月份,Compass 评估数据集新增 3 万+项目,收录的开源项目数量由 2 万+增加至 5 万,为用户提供更广泛的选择。同时优化了项目的技术分类,新增 200+二级分类,总分类数量由 100+增加至 300+。

类别7 月初数量9 月初数量新增
开源项目数量20000+50000+30000+
技术分类100+300+200+

开源生态评估体系

对原有 30+评估指标和 4 个评估模型进行优化,完善活跃度模型的“更新于”指标,在评估指标中排除已存档仓库。原子化“协作开发指数”、“社区服务与支撑”、“活跃度”、“组织活跃度”这 4 个模型的全部指标,包括代码、Issue、PR、仓库、贡献者 5 种类型,总共拆分 45 个指标。

SaaS 服务

从 7 月到 9 月,Compass 新增 SaaS 服务——Compass 实验室,同时新增项目看板的 Compass 徽章、图表 Y 轴缩放、图表一分制切换百分制、一键跳转至仓库等功能。

探秘 Compass 实验室,带你轻松玩转开源 LLMs 项目评估模型!

OSS Compass 功能更新:Compass 徽章

Oh,my god!用不用 Y 轴缩放曲线差别这么大……

OSS Compass 分制切换 | 看算法变身魔法!

访问 Compass 官网,查看 270+项目分类,一键跳转至仓库,为你省时省力!

Part3。社区治理

社区例会

7-9 月,组织技术例会 19 次,仓库更新会议纪要中英文各 17 次。

https://github.com/oss-compass/community-zh/blob/main/meeting minutes/meeting-minutes_Zh-CN.md

8 月 23 日组织 2023 年度首次社区 Board 会议,仓库更新 Board 会议纪要 1 次。

https://github.com/oss-compass/community-zh/blob/main/meeting minutes/board-meeting-minutes.md

1.png

OSS Compass 社区董事会 2023 年首次会议顺利召开,奇科厚德正式加入 Compass 社区

官网维护

在官网所有项目头像中添加了 Gitee 或 Github 仓库标识,并为仓库添加了技术分类标识,以提供更清晰的信息。

1.png

官网首页优化了热门领域的内容,将其改为热门项目与热门分类两个部分,其中热门项目展示了近来非常热门的开源 LLM、深度学习框架相关的项目,热门分类则随机显示不同技术分类下的项目。

1.png

官网增加了动态一栏,更新了社区的技术更新与活动新闻等内容,并在首页展示了最近动态。

1.png

1.png

Part4。社区运营

社区活动

8 月 23 日组织 Compass 实验室发布直播活动一次,6 个平台同时转播,触达受众上万人。

1.png

直播上半部分:OSS Compass 社区探讨“开源大模型是不是真开源”话题,万众瞩目!

1.png

直播下半部分:开源的未来:Compass Lab 引领 LLMs 时代的新征程

9 月 21 日,王晔晖代表 Compass 和 CHAOSS,在 OSS EU 2023 发表演讲。

1.png

OSS Compass 超前预见 PyTorch 超越 TensorFlow

营销传播

微信公众号 7 至 9 月群发 15 篇文章, 其中 5 篇功能更新, 6 篇活动预告及回顾, 1 篇社区成员介绍,2 篇社区合作新闻,1 篇社区董事会会议新闻。累计关注人数 230 多人,累计阅读量近 3000 人次。

Twitter 更新 10 次, 累计阅读量近 300 次。 微信视频号更新 3 个视频, 包括 8 月 23 号直播活动的 2 个视频 以及 9 月 21 号 OSS EU 2023 演讲, 累计播放量近 700 次。 官方微信群新增 90 多人。

Part 5: 结语

OSS Compass 一直致力于不断改进和扩展, 以满足用户不断变化的需求, 提供更全面、灵活和高效的 开源项目评估服务。 我们将继续努力, 为广大开源用户提供 更多开源评估度量领域创新和 有价值的功能。

Copyright © 2022 开源指南针。保留所有权利。