Tweet | |
市川直人, 柗本真佑, 楠本真二, "フォーラムを教師データとしたアプリレビュー分類モデル," 電子情報通信学会論文誌 D, J105-D(11), pp. 669-678, 2022年11月. | |
ID | 767 |
分類 | 論文誌 |
タグ | |
表題 (title) |
フォーラムを教師データとしたアプリレビュー分類モデル |
表題 (英文) |
|
著者名 (author) |
市川直人,柗本真佑,楠本真二 |
英文著者名 (author) |
Naoto Ichikawa,Shinsuke Matsumoto,Shinji Kusumoto |
キー (key) |
Naoto Ichikawa,Shinsuke Matsumoto,Shinji Kusumoto |
定期刊行物名 (journal) |
電子情報通信学会論文誌 D |
定期刊行物名 (英文) |
|
巻数 (volume) |
J105-D |
号数 (number) |
11 |
ページ範囲 (pages) |
669-678 |
刊行月 (month) |
11 |
出版年 (year) |
2022 |
Impact Factor (JCR) |
|
URL |
https://doi.org/10.14923/transinfj.2022JDP7014 |
付加情報 (note) |
|
注釈 (annote) |
|
内容梗概 (abstract) |
ソフトウェア開発において,アプリケーションレビューは開発者にとって豊富な情報源である.しかし,レビューは膨大な数が投稿されており,無意味なレビューも多い.これらの情報を開発者が効率良く取得するために,自然言語処理と機械学習を用いてレビューを自動分類する手法が数多く報告されている.これらの手法では主に教師あり学習を用いるため,大量のレビューを目視で確認し,バグ報告や機能要求といったラベルを付与することで教師データを生成する必要がある.またレビューとは別に,エンドユーザが情報を共有する場としてフォーラムがある.特にゲームの分野で盛んな文化で,フォーラムに投稿される各トピックはバグ報告や機能要求などのカテゴリーに分類されている.本研究では,既にカテゴライズされたフォーラムのトピックを教師データとして用いることで,教師データを用意するコストを削減したレビューの分類手法を提案する.実験では,デジタルゲーム配信プラットフォームであるSteam上のレビューを対象に,レビューをバグ報告,機能要求,その他の3種類に分類した.既存手法では教師データの用意に50時間以上費やしたが,提案手法では2時間程度で多くの教師データを収集でき,教師データを用意するコストが大幅に削減できた.また,分類精度は既存手法には劣るものの,提案手法はAUC 0.8以上の精度でレビューを分類できることを示した. |
論文電子ファイル | j105-d_11_669 (application/pdf) [一般閲覧可] |
BiBTeXエントリ |
@article{id767, title = {フォーラムを教師データとしたアプリレビュー分類モデル}, author = {市川直人 and 柗本真佑 and 楠本真二}, journal = {電子情報通信学会論文誌 D}, volume = {J105-D}, number = {11}, pages = {669-678}, month = {11}, year = {2022}, } |