代碼當量

簡介

與代碼行數、提交數等淺層工作量指標相比，代碼當量（開發當量）的優勢體現在兩個方面：不易受到編程習慣或特定代碼行為的干擾（如換行、空行、注釋、括弧等），且能更好地反映代碼開發所涉及的邏輯量。

CTO殷和政與任晶磊合撰的技術原型論文《關於量化代碼貢獻的開發價值》針對程式分析和機器學習的模組進行研究，在國際軟體工程會議FSE (International Symposium on the Foundations of Software Engineering) 2018上發表

2018年12月，思碼逸CTO在伯克利發表《Quantifying the Development Value of CodeContribution》

功能特點

代碼行數是簡單且常用的衡量代碼工作量的指標。但是它的缺點很明顯，例如：容易受到代碼風格、換行習慣、注釋、格式化操作等的干擾；無法識別出對代碼的實際修改，簡單的複製貼上、移動代碼塊等會產生大量的行數增刪變化。

代碼當量很好地解決了這些問題。它將原始碼解析成抽象語法樹這種更能體現代碼語法結構、代碼本質的形式，通過比較代碼修改前後抽象語法樹之間的變化，來計算一次修改行為的工作量。

首先，代碼被解析為抽象語法樹後，消除了代碼書寫風格、注釋格式等與代碼邏輯無關因素的干擾。其次，基於樹結構的比較，能很好地識別移動代碼（Move）、更新代碼（Update）等操作，為它們賦予更合理的工作量。同時，在抽象語法樹的基礎上，代碼當量能通過簡單的語義分析，區分代碼中的“數據”和“邏輯”，弱化非關鍵的“數據”修改，強化“邏輯”修改。更進一步地，代碼當量還有很多智慧型調節機制來處理實際開發中常見的場景，例如對重複代碼的調節、排除由開發工具自動生成的代碼、排除第三方庫的代碼、平衡不同程式語言之間的差異等。