江川, "ソフトウェア開発ドキュメント匿名化ツールの試作とその評価," , 2014年2月.
ID 358
分類 学位論文
タグ Anonymization Morphological Analysis Software Development Documents
表題 (title) ソフトウェア開発ドキュメント匿名化ツールの試作とその評価
表題 (英文) Development of Anonymizing Tool for Software Development Documents and Its Evaluation
著者名 (author) 江川 翔太
英文著者名 (author) Shota Egawa
キー (key) Shota Egawa
刊行月 (month) 2
出版年 (year) 2014
刊行形式 (howpublished)
URL
付加情報 (note) 特別研究報告
注釈 (annote)
内容梗概 (abstract) ソフトウェア工学研究では,実際のプロジェクトで開発されたドキュメント,
ソースコード等のソフトウェア開発ドキュメントの調査や,
得られた研究成果を実際のプロジェクトに適用・評価することが重要である.
一方,ソフトウェア開発ドキュメントの多くは著作権や機密保持の点で公開することは難しい.
さらに,個別の共同研究においても,企業から大学へ成果物の提供を行う際に機密情報の匿名化を行う必要がある.
しかし,複数のドキュメントを人手で匿名化しなければならず,その作業にかかる人的コストが研究での実プロジェクトソフトウェア開発ドキュメントの利用を困難にしている.
本研究では,匿名化にかかるコストを削減しソフトウェア開発ドキュメントの研究利用の
促進を目的として,ソフトウェア開発ドキュメントの匿名化を支援するツールを開発する.
ツールでは対象ドキュメントに対する形態素解析・類語認識や利用者との
インタラクティブなやりとりを通じて,固有表現やコンテキスト情報
(固有表現以外に間接的に固有表現を特定できるもの)の匿名化を支援する.
匿名化ツールを実装し,実プロジェクトの成果物を対象に匿名化がどの程度効果的に行えるかどうかを評価した.
その結果,ツールが自動で行う匿名化の場合,適合率が0.827,再現率が0.788 となった.
また,ユーザによる短時間の補正で,完全な匿名化を実現できた.
論文電子ファイル graduation-thesis.pdf (application/pdf) [一般閲覧可]
BiBTeXエントリ
@misc{id358,
         title = {ソフトウェア開発ドキュメント匿名化ツールの試作とその評価},
        author = {江川 翔太},
         month = {2},
          year = {2014},
          note = {特別研究報告},
}