ラージギャップなクローンを検出できるCCAlignerの論文.

大量に文の挿入,削除があったとしてもタイプ3クローンを検出できることをウリにしているらしい. これもブロック単位での検出を行う. 最初にブロック単位のコード片に対してコードの正規化と文の整形を行う. ギャップを含むクローンを検出するための手法としてスライディングウィンドウという手法を用いている. この手法では,比較したいコード片に対してまずウィンドウサイズを決める. 次に,比較したい2つのコード片のうち,決定したウィンドウサイズの行数分のコードを比較し,閾値以上一致しているか確認する. 最後にこのウィンドウを滑らし比較を繰り返し行なっていくことで,クローンを検出する.

実験結果から,他のクローン検出器と比べて,単一の結果(精度,再現率,実行時間,etc.)では一位になれなくても,総合的な結果からもっとも優れていることを示した(筆者談).