第16回WI2研究会報告

2020年11月27日(金)・28日(土)に,オンラインにて第16回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告,招待パネル合わせて26件の発表がありました.また,特別企画「情報系のオンライン演習・講義における工夫:Like duck’s webbed feet in underwater」を開催しました.

地理情報,分散表現,テキスト処理,機械学習と推薦システム,Social Networking Service (SNS),学術情報,人物情報に関するセッションがありました.参加者は79人でした.

→プログラム →表彰 →副座長報告 →運営委員会

日時・会場

日時: 2020年11月27日(金)10:00~18:05
2020年11月28日(土)9:00~17:25
会場: zoomによるオンライン開催

プログラム

■11月27日(金) (9:40~受付)
10:00-10:10 オープニング
10:10-11:40 セッション1: 地理情報
座長: 高間 康史(東京都立大),副座長:関 喜史(Gunosy)
(ロング発表)
1. 運転者の視線を考慮した運転難易度評価の検討と特定地域の分析☆
福島 秀敏(東京都立大学),荒木 徹也(群馬大学),石川 博(東京都立大学)
(ショート発表)
2. SNSを利用した観光情報の特徴量化と地域間の類似性の分析☆
劉 瀚聡(東京都立大学),荒木 徹也(群馬大学),遠藤 雅樹(職業能力開発総合大学校),石川 博(東京都立大学)
3. 大規模ソーシャルデータを用いた寄り道ルート推薦手法☆
夏 思浩,井嶋 蒼,横山 昌平(東京都立大学)
4. 散策時の発見性向上のための訪問経験に基づく動的散策マップシステムの検討☆
 塩崎 イサム,奥 健太(龍谷大学)
13:10-14:40 セッション2: 分散表現
座長:村上 晴美(大阪市立大学),副座長:林 亜紀(NTT)
(ロング発表)
5. Unsupervised Summarization of Arguments toward Key Point Generation with Sentence-BERT-based Method☆
 白藤 大幹,Rafal Rzepka,荒木 健治(北海道大学)
6. 市民意見分析のための複数の属性の定式化と検証☆
 石田 哲也,関 洋平(筑波大学)
7. Mapping Arguments to Key Point: Match Scoring of Arguments using Sentence Embedding and MoverScore without Labelled Data☆
 白藤 大幹,Rafal Rzepka,荒木 健治(北海道大学)
15:00-16:30 招待パネル
「情報系のオンライン演習・講義における工夫:Like duck’s webbed feet in underwater」
パネリスト:
 伊藤 貴之 (お茶の水女子大学)
 中村 聡史 (明治大学)
 松田 昌史 (NTTコミュニケーション科学基礎研究所)
 村上 綾菜 (お茶の水女子大学 伊藤研究室)
司会:杉原 太郎 (東京工業大学)
16:50-17:05 技術報告セッション
座長:大向 一輝(東京大学)
– 株式会社LIFULL
17:05-18:05 セッション3: テキスト処理
座長:大向 一輝(東京大学),副座長:松村 敦(筑波大学)
(ショート発表)
8. LexRank を用いた小説文章からの自動要約手法の検討☆
 安武 凌(東京電機大学),野中 健一(立教大学),岩井 将行(東京電機大学)
9. 応対履歴におけるQA関連付け手法の考察☆
 蔦ヶ谷 文月,土田 正士,石川 博(東京都立大学)
10. 人間の情動理解のための感情生成モデルの構築手法検討および生成自動化手法の模索☆
 茂島 祐太,當間 愛晃(琉球大学)
■11月28日(土) (8:40~受付)
9:00-10:30 セッション4: 機械学習と推薦システム
座長:濱崎 雅弘(産総研),副座長:柴田 祐樹(東京都立大学)
(ロング発表)
11. 推薦システムにおける推薦者のアイテム受容に与える影響に関する基礎調査☆
 松嶋 理香子,土方 嘉徳,Shlomo Berkovsky(関西学院大学)
(ショート発表)
12. アイテム分散表現の階層化・集約演算に基づくセッションベース推薦システム☆
 梛木 佑真,岡本 一志(電気通信大学)
13. 決定係数を用いたアイテム推薦理由の説明文の生成手法の検証☆
 佐藤 匠(琉球大学),當間 愛晃(琉球大学)
14. 深層学習による少数学習データでの2次元データの高品質化手法の提案☆
 石原 正敏(東京都立大学),荒木 徹也(群馬大学),石川 博(東京都立大学)
10:50-12:20 セッション5: SNS
座長:岡本 一志(電気通信大学),副座長:北山 大輔(工学院大学)
(ロング発表)
15. SNSを用いたトレンドスポットの検出の検討☆
 中田 朋寛,三浦 拓也,宮坂 和希(東京都立大学),荒木 徹也(群馬大学),遠藤 雅樹(職業能力開発総合学校),土田 正士,山根 康男(東京都立大学),平手 守浩,眞浦 雅夫(アイシン・エィ・ダブリュ株式会社),石川 博(東京都立大学)
16. SNSを用いた短期間イベント分析☆
 宮坂 和希,中田 朋寛,三浦 拓也(東京都立大学),荒木 徹也(群馬大学),土田 正士,山根 康男(東京都立大学),平手 守浩,眞浦 雅夫(アイシン・エィ・ダブリュ株式会社),石川 博(東京都立大学)
17. Instagram におけるアーカイブ投稿を引き起こす写真に関する基礎調査☆
 中本 優希,比嘉 彗太,土方 嘉徳(関西学院大学)
13:50-15:30 セッション6: 学術情報
座長:笹嶋 宗彦(兵庫県立大学),副座長:山本 岳洋(兵庫県立大学)
(ロング発表)
18. バーストを用いた論文の特性分析☆
 小林 和央,風間 一洋(和歌山大学),吉田 光男(豊橋技術科学大学),大向 一輝(東京大学),佐藤 翔,桂井 麻里衣(同志社大学)
19. Twitter上のarXivプレプリントに関する学術情報流通のキーパーソンの特性分析☆
 嶋田 恭助,風間 一洋(和歌山大学),吉田 光男(豊橋技術科学大学),大向 一輝(東京大学),佐藤 翔,桂井 麻里衣(同志社大学)
(ショート発表)
20. Twitter での学術情報流通におけるネットワーク作成法とユーザ重要度の関係☆
 豊島 秀典,吉田 光男,梅村 恭司(豊橋技術科学大学)
21. Random Walk with Restartとコサイン類似度に基づく研究者推薦モデル☆
 中村 幹太,岡本 一志(電気通信大学)
15:50-17:00 セッション7: 人物情報
座長:河合 由起子(京都産業大学),副座長:吉田 光男(豊橋技術科学大学)
(ロング発表)
22. 性格要素と外見要素の加減算による類似キャラクタの検索☆
 小林 達哉,松下 光範(関西大学)
(ショート発表)
23. コミックの登場人物についての説明文からの性格タグ推定☆
 樋口 亮太,山西 良典,松下 光範(関西大学)
24. Web人名検索結果の要約と可視化を目指して -2010年代の進捗-
 村上 晴美(大阪市立大学)
17:10-17:25 表彰式・クロージング

招待パネル:「情報系のオンライン演習・講義における工夫:Like duck’s webbed feet in underwater」

司会: 杉原 太郎 (東京工業大学)
パネリスト: 伊藤 貴之 (お茶の水女子大学),中村 聡史 (明治大学),松田 昌史 (NTTコミュニケーション科学基礎研究所),村上 綾菜 (お茶の水女子大学 伊藤研究室)

表彰

WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.また,ポスター発表において,一般参加者の皆様にも投票に加わっていただきました.今回,各賞を受賞された研究は以下のようになります.

優秀研究賞
市民意見分析のための複数の属性の定式化と検証
石田 哲也,関 洋平(筑波大学)

萌芽研究賞
Mapping Arguments to Key Point: Match Scoring of Arguments using Sentence Embedding and MoverScore without Labelled Data
白藤 大幹,Rafal Rzepka,荒木 健治(北海道大学)

Unsupervised Summarization of Arguments toward Key Point Generation with Sentence-BERT-based Method
白藤 大幹,Rafal Rzepka,荒木 健治(北海道大学)

推薦システムにおける推薦者のアイテム受容に与える影響に関する基礎調査
松嶋 理香子,土方 嘉徳,Shlomo Berkovsky(関西学院大学)

Twitter上のarXivプレプリントに関する学術情報流通のキーパーソンの特性分析
嶋田 恭助,風間 一洋(和歌山大学),吉田 光男(豊橋技術科学大学),大向 一輝(東京大学),佐藤 翔,桂井 麻里衣(同志社大学)

学生奨励賞
運転者の視線を考慮した運転難易度評価の検討と特定地域の分析
福島 秀敏(東京都立大学),荒木 徹也(群馬大学),石川 博(東京都立大学)

Random Walk with Restartとコサイン類似度に基づく研究者推薦モデル
中村 幹太,岡本 一志(電気通信大学)

性格要素と外見要素の加減算による類似キャラクタの検索
小林 達哉,松下 光範(関西大学)

副座長報告

セッション1:地理情報
副座長: 関 喜史(株式会社Gunosy)

1件目にはGoogle StreetViewの画像からその道の運転の難易度を推定する試みについて発表された.運転は認知・判断・操作の3つの工程を繰り返すことが知られており,その中で認知を要因とした事故が最も多いとされるという.そこで認知の部分に絞るために,人間の視覚の知覚モデルである顕著性マップを用いて難易度を評価する.具体的にはCOCADOOという道路の画像とユーザのアンケートデータによるデータセットを用いて,相関のある指標を発見しようという試みである.著者らはその中でより人間が着目すると考える画像の中央部をトリミングして顕著性マップを適用することを提案し,画像の全体を用いる際より相関の強い指標を発見することに成功し,東京と京都の実際の道路画像によって定性的な評価を行い,実際の有効性について議論を行っていた.質疑ではCOCADOOが海外のデータセットであることを踏まえて東京・京都に適用する際の課題に関する議論や,より具体的な難易度に関わりそうなポイントを特徴に導入してはどうかという指摘があった.

2件目では,観光地感の類似度をSNSから得られる情報をもとに行う試みについて発表された.データはFlickrから収集し,ジオタグを逆ジオコーディングすることで住所に変換し,観光地の住所と結びつけることで利用している.利用したのはタグと写真で,それぞれを用いた特徴量化と類似性測定を行っている.タグを利用する場合にはタグをWord2Vecでベクトル化しTF-IDFで重み付けして,観光地間の類似性を計算できるようにしている.画像を利用する場合にはVGG16の出力を用いて画像のベクトル化を行い,観光地間の類似性を図っている.実験では上野公園と井の頭公園の類似性の高い画像を検出する試みと全国のタワーの中から東京タワーに類似するタワーを探す試みが行われていた.質疑ではWord2Vecの用い方としてタグに利用するのが適切なのかという指摘,そして観光地の類似性はどのような利用のされ方を想定するかによって異なるので,利用シーンを定める必要性についてのし的があった.

3件目では,SNSの情報を用いて2点間に存在するスポットを推薦する寄り道ルート推薦の試みが発表された.Flickerから取得した情報をもとにユーザの移動の重み付き有向グラフを作成する.この重みはスポット間を移動したユーザの数の逆数とする.これにより,最短経路探索を行うことで,多くのユーザが移動した経路を得ることができる.実験では上野駅から浅草駅の間の経路の推薦を行った.5つの経路を推薦し,その経路上のスポットに含まれる飲食店と小売店の数を比較し,ルートの定性的な評価を行い,飲食店を多く含むルートを美食ルート,小売店を多く含むルートをお買い物ルートとして推薦することを提案していた.議論では,実際にこのルートが実用的なのか,このようなルートをどのように評価すべきかと言う議論が行われた.

4件目では,地図ベースの観光情報推薦システムにおけるインタフェースとして,動的な探索マップを検討する試みが発表された.ユーザの探索的な体験を支援するために,ユーザの過去の訪問経験や選択に応じてマップを隠蔽・開放するインタフェースを提供することを目的に,その実装のためのアルゴリズムの設計について報告されている.議論の中ではどのような目的でどのような点をユーザインタビューで計測するのか,どのように評価するのかという点について意見が交わされた.

セッション2:分散表現
副座長: 林 亜紀(NTT)

セッション2では分散表現に関する3件のロング発表が行われた.

1件目のロング発表ではUnsupervised Summarization of Arguments toward Key Point Generation with Sentence-BERT-based Methodというタイトルで,オンラインディベートデータに大量の存在する「意見(Argument)」部分を把握し,14種類ほどのKeypointを教師無し学習で生成する方法が紹介された.質疑では,本セッション3件目の同著者による発表との関係,IBMによるkeypoint analysisの研究との関係,分散表現の平均を取ることに問題がないか,Scoreの計算方法が和となっている理由に関する質問が出た.

2件目のロング発表では,市民意見分析のための複数の属性の定式化と検証というタイトルで,Twitter等のつぶやきに意見タイプ,地域依存性,極性などの属性を付与して,指定した属性値とつぶやき時期から市民意見を抽出する手法が紹介された.質疑では,学習方法を属性ごとに独立にした理由,他地域で汎用利用する際のアノテーションの難しさ,抽出がうまくいかない保育園の意見タイプについて考えられる対処方法,横浜市からのコメント内容に関する質問が出た.

3件目のロング発表では,Mapping Arguments to Key Point: Match Scoring of Arguments using Sentence Embedding and MoverScore without Labelled Dataというタイトルでオンラインディベートデータ内のargumentsをkeypointにマッチさせる際に重要な単語を重みづける方法と文間の単語同士の距離を考慮する手法(MoverScore)が紹介された.質疑ではエラー分析の内容と将来的な対応方法に関する議論,発表内で例示する話題を子供に関する議論にした理由やデータセットの選定理由,今回の手法がうまく作用した場合の具体例に関する議論が行われた.

セッション3:テキスト処理
副座長:松村 敦(筑波大)

1件目の発表は,読書離れを解決するために小説の自動要約システムの開発を目指すもので,その手始めとしてLexRankを利用した自動要約手法の可能性について検討したものであった.対象を青空文庫に掲載された江戸川乱歩の三作品とし,自動要約の実例をもとに分析を行った.その結果,人物情報などの意味を十分に扱えていない,隣接文の整合性が不十分であるなどの問題点が明らかになった.質疑応答では,LexRankの特性と求めている要約の整合性についての質問があり,tf-idfに基づく頻出語をベースとした要約の重要性について議論があった.次に,読書促進という目的に対する要約のあり方についての質問があり,回答として参考にした実際の要約文から時代背景や登場人物の詳細が重要であるとの見方が示された.これに対して,ユーザ実験によって評価を実施するのが良いとのアドバイスがあった.その後,共著者から,江戸川乱歩邸全体のデジタル化プロジェクトの背景の補足説明があった.また,読書離れがどんな問題を起こすかについて質問があり,論文などの構造化された文書を書くスキルが落ちてしまうと回答があった.

2件目の発表は,コールセンターの対応履歴から,質問と回答の適切な組み合わせを自動的に抽出することを目指し,独自のQAスコアを提案し,その有効性について検討したものであった.QAスコアはtf-idfをベースとし,共通の名詞をもつ質問文と回答文を結び付ける手法である.評価の結果,上位30位で半数程度の正解を得られた.さらにエラー分析の結果,上位30件と中央値付近30件で原因が異なることが分かったことが報告された.具体的には,上位30件では,主に質問回答の本質に無関係な共通語(urlなど)の存在が影響しており,中央値付近30件では,主に指示代名詞などの存在により共通語による対応のみではペアを作成できないといった問題があった.質疑応答では,対象の文書の構造について確認する質問があり,質問と応答の区別のない文書であるとの回答があった.また,質問でも回答でもない文に対する扱いについて質問があり,これには「その他」ラベルを付与したという回答があった上で,「その他」の中にも質問回答として重要な内容が含まれていた可能性があると補足があった.最後に,現実的な対応の中では,いくつかの処理を多段階に実施する必要があるとのコメントがあった.

3件目の発表は,ブラックボックスである心を情報工学的なアプローチから解明していくことを目指した研究であった.その手始めとして感情に着目し,心理学で提唱されている中枢起源説と抹消起源説の2つをモデルとして計算機上に実装し,実際の人間の感情生起と比較することで,モデルの有効性を議論したものである.実際の人間の感情生起データセットは,ユーザアンケートによって感情とその状況・行動の対応を収集することで作成した.結果は,わずかに抹消起源説モデルが良かったが,データセットの規模が小さいことや単語選択の恣意性という課題があることが示された.質疑応答では,まず評価に利用したデータ作成方法についての確認が行われた.その後,人のやってることと似たような実装が計算機上でできたら,それが人の感情を表すモデルとして正しいとして良いのかとの質問があった.これに対して,100%ロジカルであるとは思っていないとの前提が述べられた上で,大量のデータでモデルが矛盾を出さなくなれば,それを正しいと考えて良いのではないかとの回答があった.さらに矛盾,間違いなどがあればそれらを修正していくという研究の方向性が示された.また,この研究のアプローチは,中枢起源説(トップダウン)と抹消起源説(ボトムアップ)の一方だけを採択する方針のようだが,両方が存在し状況によって使い分けている可能性もあるのではないか,今回のアプローチでは両方の説がありうるということが導けるような設計になっているのか,という質問があった.これに対しては,一方だけを採択することで矛盾が現れた場合には,全く別の説,あるいは2つの説を複合的に組みわせた説を提唱するという方向性を考えているとの回答があった.

セッション4:機械学習と推薦システム
副座長:柴田 祐樹(東京都立大)

1件目の発表では推薦システムにおける推薦者のアイテム受容に与える影響に関する基礎調査結果が報告された.ユーザは口コミを参考にする時,友人や専門家の評価により強い影響を与えられることが知られており,このことについて本発表ではとくに推薦者を単純に提示しただけでも,提示しない場合や異なる推薦者を提示した場合においてユーザのアイテムへの評価に有意な差が有るかどうかが報告された.評価実験ではロボット,著名人,友人が推薦者として表示されていた.これに対し質疑応答では,実験計画の妥当性に関して議論があった.具体的には長期的にシステムを使った場合には推薦者の信頼度よりも推薦システムの性能自体がユーザの満足度に影響を及ぼすのではないか,また,実験の意図がユーザに知れているため,その前提認識が実験結果に影響を及ぼしているのではないか,などといった指摘があった.

2件目めの発表では,セッションデータに対してItem2Vecによるアイテム分散表現とセッションデータに特化したユーザ分散表現を利用した推薦手法が提案された.また,提案手法はリアルタイムに変化するユーザ分散表現を扱うために,既存手法に対し少ない学習時間でモデルを構築可能な手法としていると説明があった.本手法は比較手法と同等な精度を保ちながら少ない学習時間でモデルを構築可能なことが評価実験により示された.しかしながら,推論時にはメモリベース法を用いることによりモデルベース手法に比べ計算負荷が高く,将来的にこの点を改善するべきであることが述べられた.この発表に対し質疑応答では,データセットにより傾向が大きく変わるため,今後より多様なデータセットでの検証をすべきであるなどの指摘があった.また,近傍アイテムを直接探すのではなく近傍ユーザを経由することの妥当性に関し議論があった.

3件目めの発表では,推論モデルに対して推薦理由を生成するためにLocal Interpretabl Model-agnostic Explanations(LIME)を用いた際に単純な線形回帰近似による望まない出力結果が得られる場合について決定係数を用い行った考察が報告された.これに関し,特定の具体例に対しては適切な結果が得られることが報告された.この発表に対し質疑応答では,説明性の定義に関して議論があり,とくに説明性を扱った研究であるならば,自然言語による説明生成を扱った関連研究を調査し,それらとの関連性を述べることで研究の立ち位置を明確化するべきであるなどの指摘があった.その他全体的に良い着眼点であるとの感想が複数寄せられた.

4件目の発表では,超解像とガウシアンノイズ除去の2つの観点からデータを高品質化する手法の提案がなされた.提案手法では,入力から出力へ直通の迂回路を設置することで過剰適応の抑制と精度維持の両立を目指すモデルを用いると説明された.評価実験では劣化された画像の復元能力をPeak Signal-to-Noise Ratio(PSNR)と Structural SIMilarity Index(SSIM)により評価を行い,その結果より提案手法の有効が示された.この発表に対し質疑応答では,手法の適用範囲の明確化をしなければならないとの指摘があった.どのような分野の問題も解くことができるモデルを構築することは困難であるため,対象分野ごとに求められる質の定義をもう一度確認して研究を行うべきであるとの指摘がなされた.

セッション5:SNS
副座長:北山 大輔(工学院大学)

1件目の中田 朋寛(東京都立大学),他によるロング発表「SNSを用いたトレンドスポットの検出の検討」では,バーストしているハッシュタグをトレンドとみなして,トレンドの起きているスポット・地域を特定する手法を提案している.提案法においては,トレンドとなったハッシュタグと共起するスポットを表すハッシュタグを抽出することで,トレンドスポットを検出している.本発表に対して,主として,検出粒度に関する議論があり,「粒度によっては誤検出といえないのではないか」,「アプリケーションによっては必ずしも地点を示すハッシュタグではなく,ジオタグでエリアを示すなどでもよいのではないか」,などの質疑応答が行われた.

2件目の宮坂 和希(東京都立大学),他によるロング発表「SNSを用いた短期間イベント分析」では,感情辞書をwordnetやword2vecで拡張を行うことで,plutchikの感情モデルの8軸の感情により,ツイートを分析する手法を提案している.花火やブルーインパルスの飛行という1日未満の短いイベントに関して,分析結果である感情の時系列的な変化が示された.本発表に対して,「信頼の軸に関して動きが見られないのは,実験の結果として適切なのか,それとも感情辞書の改善が必要なのか」,「plutchikのモデルは感情を連続的に扱えるところに特徴があると思うが,onehotで離散的に扱っていることに問題はないのか」,「ノイズが多く含まれるイベントなど,この手法が適応できるイベントの限界はどこにあるのか」,などの質疑応答が行われた.

3件目の中本 優希(関西学院大学),他によるロング発表「Instagramにおけるアーカイブ投稿を引き起こす写真に関する基礎調査」では,Instagramにおけるアーカイブ投稿に関して,人,特別感,コミュニティ,趣味,対象物によるアーカイブ投稿が起こる因子になるかを調査した結果が報告された.結果として,写真に映る人の人数が少ないほどアーカイブ投稿を引き起こしやすく,コミュニティでの出来事の写真もアーカイブ投稿となりやすいことが示唆された.本発表に対して,「5つのリサーチクエスチョンの独立性はどのように考えているのか.例えば趣味のコミュニティなど複合的なものもあり得るのではないか」,「パーソナリティ依存なところが大きいのではないか」,「実験デザインとして,アーカイブ投稿をした人に直接の聞き取りを行った結果から分析することも考えられる」,「Instagramをクロールし,実際にアーカイブ投稿となった写真の特徴を分析する方法もあり得る」などの質疑応答が行われた.

セッション6:学術情報
副座長: 山本 岳洋(兵庫県立大学)

セッション6では,学術情報に関する発表(ロング発表2件,ショート発表2件)があった.

1件目の発表では,論文のソーシャルメディア上での言及回数やCiNii Articles上での閲覧回数などのバーストに着目した論文分析手法の提案がなされた.言及回数や閲覧回数に関するバーストが発生する論文の分析や,それらのバースト間の時系列的分析などを行っている.ソーシャルメディア上の言及回数は作為的に数値をコントロールできてしまうのではないか,従来の論文評価尺度の1つである被引用数と比較した際に,研究としてどのような価値を測定していることになるのか,といった議論がなされた.

2件目の発表では,ソーシャルメディア上の学術情報流通の発信源として重要な役目を果たしているアカウントの発見・分析の提案がなされた.具体的には,arXiv論文の拡散に関するTwitter上のネットワークに対してHITSアルゴリズムを適用しオーソリティ値,ハブ値を求めることで重要なアカウントを発見している.また,コミュニティの言語分析の結果,研究成果を日本語コミュニティへの橋渡しをするアカウントの存在などが報告された.質問としては,2部グラフの構築方法や,arXiv以外のプレプリントサーバへの適用可能性などがなされた.

3件目の発表では,学術情報流通分析のためのネットワーク構築手法の調査に関する報告がなされた.arXiv論文に関するTwitter上のデータに対して,いいねやリツイートなどの反応に基づいたネットワーク構築手法,フォロワ関係を用いたネットワーク構築手法という異なる手法で構築されたネットワークに対してHITSを適用する.そして,ネットワーク構築手法の違いによって,オーソリティ値の高いユーザやその特性に差異があるかどうかという検証がなされた.ネットワーク構築手法だけでなく,コミュニティ分析手法まで焦点を当て,手法ごとの特性を分析してはどうかという提案が参加者からなされた.

4件目の発表では,研究者推薦のための推薦アルゴリズムの提案がなされた.具体的には,研究者同士の共同研究関係から研究者グラフを構築する.そして,構築したグラフに対するRandom Walk with Restartアルゴリズムや研究内容に基づくコサイン類似度を組み合わせた研究者推薦手法を提案している.参加者からは,推薦アルゴリズムが有効に働いてしまうことが研究グループの多様性を損なってしまうのではないか,推薦アルゴリズムの計算量は実用的であるのか,といった質問がなされた.

セッション7:人物情報
副座長:吉田 光男(豊橋技術科学大)

セッション7では,人物情報に関する発表(ロング発表1件,ショート発表2件)があった.
1件目の発表では,ユーザの好みのキャラクタが登場するコミックを検索する技術の実現を目的とし,キャラクタを表現する性格要素や外見要素をクエリとして利用する検索手法
が提案された.ユーザ実験より,「キャラクタ+要素」の加減算は出力されたキャラクタを想定できることが示唆され,性格と外見要素の加減算の有効性を確認できたと報告された.質疑応答では,評価実験が限定的であり,当初の目的と乖離が大きいのではないかとの指摘や,ベクトルの次元が少ないが故に,要素間で直行している可能性がないかなどの指摘があった.

2件目の発表では,ストーリに基づいたコミックの検索を目指し,ストーリの構成要素のひとつであるキャラクタの性格に着目した報告があった.具体的には,キャラクタの説明文とキャラクタの性格タグをウェブ上の異なる複数の情報リソースから収集し,それらを組み合わせることによってコミックのコンテンツであるキャラクタの性格を推定していた.質疑応答では,キャラクタの性格は物語とともに変化することも多く,そのような変化が捉えられると面白いとのコメントや,コミックに対してどのように検索したいのかなどの質問があった.

3件目の発表では,発表者が取り組んでいるWeb人物検索における要約と可視化の研究について,2010年代の研究の進捗概要について報告があった.内容は,NDC人物ディレクトリ,同姓同名人物の分離,履歴書と地図の表示,Wikipediaのような概要文の作成,件名の付与である.質疑応答では,本発表を行うことになったモチベーションについての意見交換がなされ,研究構想やこれまでの研究を紹介する発表をまとめたセッションを作るのがよいのではないかなどの提案があった.

運営委員会

実行統括担当:奥 健太 (龍谷大学),大塚 真吾 (神奈川工科大学)
プログラム担当:北山 大輔 (工学院大学)
Web 担当:柴田 祐樹(東京都立大学)