Tweet | |
三原公平, "OverlayFSを用いた効率的なGitチェックアウトの提案 -リポジトリマイニングの高速化を目的として-," 修士学位論文, 大阪大学, 2025年. | |
ID | 847 |
分類 | 学位論文 |
タグ | |
表題 (title) |
OverlayFSを用いた効率的なGitチェックアウトの提案 -リポジトリマイニングの高速化を目的として- |
表題 (英文) |
|
著者名 (author) |
三原公平 |
英文著者名 (author) |
Kouhei Mihara |
キー (key) |
Kouhei Mihara |
学校名 (school) |
大阪大学 |
出版社住所 (address) |
|
刊行月 (month) |
2 |
出版年 (year) |
2025 |
URL |
|
付加情報 (note) |
|
注釈 (annote) |
|
内容梗概 (abstract) |
Git はバージョン管理システムのデファクトスタンダードである.現在では開発者の 9 割以上がバージョン管理システムとして Git を使用しており,Git リポジトリのホスティングサービスも盛んに使用されている.データの豊富さから,ソフトウェアリポジトリを対象としたマイニング(Mining Software Repositories,MSR)が多数行われている.MSR における Git の課題の 1 つとして,チェックアウト処理の速度が遅い点が挙げられる.MSR ではプロジェクトの多数のリビジョンを参照するため,チェックアウト処理が頻繁に行われる.しかし,MSR で対象にされる大規模なリポジトリでは Git のチェックアウト処理は遅く,MSR の作業効率を低下させている.チェックアウト処理の時間的コストが大きい原因は Git 独自のファイルシステムにある.Git ではすべてのデータを blob(binary large object)と呼ばれる形式に変換して保存しており,データアクセス時には blob ファイルを作業ディレクトリに
展開する処理が行われる.この展開処理に大きなコストがかかっている.本研究では,OverlayFS を用いた Git リポジトリ用ファイルシステムを提案する.提案ツールは時間的コストの大きい展開処理を不要にし,Git のチェックアウト処理を高速化する.具体的には,前処理として blob ファイルの展開を行っておき,チェックアウト時には展開したファイル群の必要部分を統合するだけで 1 つのリビジョンを表現する.本研究では提案手法の実行時間について評価実験を行った.実験の結果,提案手法は平均で Git の 3~5 倍高速なチェックアウトを実現できていた.提案手法のより実践的な評価として,マイニング作業を模したスクリプトを実行する実験を行った.この実験では,提案手法が Git より 1.03 倍程度長い実行時間を要する結果となった. |
論文電子ファイル | draft.pdf (application/pdf) [一般閲覧可] |
BiBTeXエントリ |
@masterthesis{id847, title = {OverlayFSを用いた効率的なGitチェックアウトの提案 -リポジトリマイニングの高速化を目的として-}, author = {三原公平}, school = {大阪大学}, month = {2}, year = {2025}, } |