タイプ3とタイプ4の間にあるような(ラージギャップ?)クローンを検出するツールOreoの論文.
クローンサイズ,意味,メトリクスの類似度からクローンを検出する. タイプ4寄りのクローンを検出する際にクローンサイズを比較するのはあまり良くない気がした(タイプ4は意味が類似したクローンなので). 意味の類似度では使われているメソッドを見ているらしい. これに加えてタイプ3,4の検出には機械学習を用いるらしい.
BigCloneBenchでの実験の結果,中程度のタイプ3のrecallが比較対象の検出器と比べるともっとも高く,検出を目標としていたクローンをそれなりに検出できていることをアピールしている.