下仲, "機械学習を利用した構文情報に基づく自動生成ファイルの特定 -パーサジェネレータ生成ファイルへの適用-," , 2016年2月.
ID 436
分類 学位論文
タグ generated file machine learning techniques source code analysis software maintenance
表題 (title) 機械学習を利用した構文情報に基づく自動生成ファイルの特定 -パーサジェネレータ生成ファイルへの適用-
表題 (英文) Identifying Auto-Generated Files by Using Machine Learning Techniques Based on Syntactic Information -Applying to Files Generated by Parser Generator-
著者名 (author) 下仲 健斗
英文著者名 (author) Kento Shimonaka
キー (key) Kento Shimonaka
刊行月 (month) 2
出版年 (year) 2016
刊行形式 (howpublished)
URL
付加情報 (note) 特別研究報告
注釈 (annote)
内容梗概 (abstract) 近年,ソースコード解析に関する研究が盛んに行われている.解析対象のソースファイルの中にはしばしば自動生成ファイルが含まれており,多くの場合自動生成ファイルは解析の対象にはならず除外される.自動生成ファイルを除外する方法として,自動生成ファイル内に存在する特有のコメント文を文字列検索することにより特定するという方法がある.しかしこの方法では,自動生成ファイル特有のコメント文が消された場合に,自動的に自動生成ファイルを特定することができない.また,ソースファイルが自動生成ファイルであるかどうか,目視で判定するのは時間的コストが大きい.そこで本研究では,機械学習を用いて任意の自動生成ファイルを自動的に特定する手法を提案する.提案手法では,ソースファイルの構文情報を学習することで自動生成ファイルであるかどうかを判定する.また,提案手法を評価するために,4つの自動生成プログラムから生成された自動生成ファイル群を対象に実験を行った.その結果,90%以上の高い精度で自動生成ファイルを特定できることを確認した.また,自動生成ファイル特有のコメント文が消されていても自動生成ファイルを特定できることを確認した.
論文電子ファイル s-kento_graduation-thesis_ver6.pdf (application/pdf) [一般閲覧可]
BiBTeXエントリ
@misc{id436,
         title = {機械学習を利用した構文情報に基づく自動生成ファイルの特定 -パーサジェネレータ生成ファイルへの適用-},
        author = {下仲 健斗},
         month = {2},
          year = {2016},
          note = {特別研究報告},
}