第14回WI2研究会報告

2019年7月15日

2019年6月28日(金)・29日(土)に,兵庫県立大学神戸商科キャンパス(兵庫県)にて第14回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,ポスターのみの発表,技術報告合わせて17件の発表がありました.さらに,森岡澄夫氏(インターステラテクノロジズ株式会社)に「民間宇宙ロケットMOMOに使われている情報処理技術」という題目でご講演いただきました.

情報推薦,テキスト処理,データ分析,可視化・時系列データ処理に関するセッションがありました.ポスターレセプションでは,口頭発表との重複11件を含め,計14件の発表がありました.参加者は69人でした.

→プログラム →招待講演 →表彰 →副座長報告 →学生参加報告 →運営委員会

日時・会場

日時: 2019年6月28日(金)12:30~18:15
2019年6月29日(土)10:30~16:00
会場: 兵庫県立大学神戸商科キャンパス
(〒651-2197 兵庫県神戸市西区学園西町8丁目2-1)

https://www.u-hyogo.ac.jp/campuslife/access/campus01.html

アルバム

1日目の会場

2日目の会場
一般発表の様子

質疑応答の様子
質疑応答の様子
森岡澄夫氏による招待講演の様子
技術報告セッションの様子
ポスターレセプションの様子
ポスターレセプションの様子
受賞して一言
受賞して一言

受賞して一言
受賞して一言
受賞して一言
受賞して一言
受賞して一言

プログラム

■6月28日(金) (12:00~受付)
12:30-12:45 オープニング
12:45-14:15 セッション1:情報推薦
座長:鳥海 不二夫(東京大学),副座長:河合 由起子(京都産業大学)
(ロング発表)
1. ABCPRec:ユーザの消費者としての役割と創作者としての役割の適応的対応付けによるユーザ生成コンテンツ推薦◎
佃 洸摂,深山 覚,後藤 真孝(産業技術総合研究所)
(ショート発表)
2. 観光経路推薦問題におけるスポットの価値推定法の提案◎
柴田 祐樹,高間 康史(首都大学東京)
3. 空間演算に基づく遭遇率を考慮したスポット推薦システムの提案☆◎
吉村 晴夏(京都産業大学),Panote Siriaraya(京都工芸繊維大学),王 元元(山口大学),河合 由起子(京都産業大学/大阪大学)
4. 時空間演算を用いた動的オブジェクトを含むスポット検索手法☆◎
上坂 佳(京都産業大学),Panote Siriaraya(京都工芸繊維大学),王 元元(山口大学),河合 由起子(京都産業大学/大阪大学)
14:30-15:30 招待講演
司会:笹嶋 宗彦(兵庫県立大学)
「民間宇宙ロケットMOMOに使われている情報処理技術」
森岡 澄夫 氏(インターステラテクノロジズ株式会社)
15:45-16:00 技術報告セッション
司会:杉原 太郎(東京工業大学)
– 株式会社LIFULL
16:15-18:15 ポスターレセプション
(ポスターのみの発表)
P1. Web不動産データを用いた空物件が入居されるまで期間の確率モデリング ―物件の特性からどこまで入居の予測が可能か?―
渡邊 隼史(金沢大学/統計数理研究所),一藤 裕(長崎大学),鈴木 雅人,山下 智志(UDアセットバリュエーション)
P2. An Exploratory Proposal for a newer Integrated Model Theory of Economy and Society, encompassing steady-state economy & growth anticipative behavioral economics (indifferent to its actors and systems granularity)
Takeshi Fujiwara (DAYPLA Corporation)
P3. 実践的データサイエンス人材育成の試み
笹嶋 宗彦(兵庫県立大学)
■6月29日(土) (10:00~受付)
10:30-11:30 セッション2:テキスト処理
座長:湯本 高行(兵庫県立大学),副座長:岡本 一志(電気通信大学)
(ショート発表)
5. レストランレビューにおける料理特有の評価表現の抽出と分析☆◎
鈴木 稜也,山西 良典,西原 陽子(立命館大学)
6. Twitterを用いたサッカー選手採点のための感情値辞書構築に向けて☆◎
若狭 孟,横山 昌平(首都大学東京)
7. 重複レシピの検出における単語の分散表現と文字N-gramの分散表現の比較☆◎
小邦 将輝,関 洋平(筑波大学),平手勇宇(楽天株式会社)
13:00-14:10 セッション3:データ分析
座長:櫻井 茂明(東芝デジタルソリューションズ株式会社),副座長:西原 陽子(立命館大学)
(ロング発表)
8. ワクワクとネタバレの違い ―映像コンテンツにおける予告と本編で用いられるシーン時系列の比較分析―☆◎
金田 大地,山西 良典(立命館大学),森 晴菜(株式会社NTTドコモ),西原 陽子(立命館大学)
(ショート発表)
9. Webにおけるマーケティングキャンペーンの基礎調査☆◎
上田 龍汰,松原 奈波,浦 雅治,段ノ上 愛子,土方 嘉徳(関西学院大学)
10. ソーシャルグラフにおけるユーザの中心性と居住地推定の難しさとの関係☆◎
廣中 詩織,吉田 光男,梅村 恭司(豊橋技術科学大学)
14:25-15:35 セッション4:可視化・時系列データ処理
座長:大塚 真吾(神奈川工科大学),副座長:熊本 忠彦(千葉工業大学)
(ロング発表)
11. ウェブページの構造と顕著性マップの組み合わせによる重要領域の視覚化手法☆
稲垣 有哉(早稲田大学),岩田 一(神奈川工科大学),白銀 純子(東京女子大学),深澤 良彰(早稲田大学)
(ショート発表)
12. 多次元時系列データに対する評価指標形成のための視覚的分析フレームワークの提案☆◎
高見 玲,高間 康史(首都大学東京)
13. Hawkes過程とトピックモデルによる検索数の予測☆
岩田 晟(神戸大学),江口 浩二(広島大学),藤田 澄男(Yahoo! Japan研究所)
15:45-16:00 表彰式・クロージング

招待講演:「民間宇宙ロケットMOMOに使われている情報処理技術」

司会: 司会:笹嶋 宗彦(兵庫県立大学)
講演者: 森岡 澄夫 氏(インターステラテクノロジズ株式会社)
講演概要: ロケットはエンジンなどの推進系だけでは成立せず,センサ・システム,誘導制御計算機,機内データ伝送系,無線通信系など電子情報技術が総合的に利用されている.
設計時にも,シミュレーション,モデルベース開発,ソフトウェア設計手法などが必須であり,今後は遠隔管制や顧客ニーズ分析などの重要性も増すと考えられる.
宇宙開発における情報処理技術利用につき紹介する.

表彰

WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.また,ポスター発表において,一般参加者の皆様にも投票に加わっていただきました.今回,各賞を受賞された研究は以下のようになります.

優秀研究賞
ABCPRec:ユーザの消費者としての役割と創作者としての役割の適応的対応付けによるユーザ生成コンテンツ推薦
佃 洸摂,深山 覚,後藤 真孝(産業技術総合研究所)

萌芽研究賞
ワクワクとネタバレの違い ―映像コンテンツにおける予告と本編で用いられるシーン時系列の比較分析―
金田 大地,山西 良典(立命館大学),森 晴菜(株式会社NTTドコモ),西原 陽子(立命館大学)

学生奨励賞
重複レシピの検出における単語の分散表現と文字N-gramの分散表現の比較
小邦 将輝,関 洋平(筑波大学),平手勇宇(楽天株式会社)

優秀ポスター発表賞
ABCPRec:ユーザの消費者としての役割と創作者としての役割の適応的対応付けによるユーザ生成コンテンツ推薦
佃 洸摂,深山 覚,後藤 真孝(産業技術総合研究所)

学生優秀ポスター発表賞
重複レシピの検出における単語の分散表現と文字N-gramの分散表現の比較
小邦 将輝,関 洋平(筑波大学),平手勇宇(楽天株式会社)

多次元時系列データに対する評価指標形成のための視覚的分析フレームワークの提案
高見 玲,高間 康史(首都大学東京)

特別賞

LIFULL賞
Web不動産データを用いた空物件が入居されるまで期間の確率モデリング ―物件の特性からどこまで入居の予測が可能か?―
渡邊 隼史(金沢大学/統計数理研究所),一藤 裕(長崎大学),鈴木 雅人,山下 智志(UDアセットバリュエーション)

DAYPLA賞
実践的データサイエンス人材育成の試み
笹嶋 宗彦(兵庫県立大学)

スタートアップ賞
Web不動産データを用いた空物件が入居されるまで期間の確率モデリング ―物件の特性からどこまで入居の予測が可能か?―
渡邊 隼史(金沢大学/統計数理研究所),一藤 裕(長崎大学),鈴木 雅人,山下 智志(UDアセットバリュエーション)

ソーシャルグラフにおけるユーザの中心性と居住地推定の難しさとの関係
廣中 詩織,吉田 光男,梅村 恭司(豊橋技術科学大学)

副座長報告

セッション1:情報推薦
副座長:河合 由起子(京都産業大学)

セッション1では,情報推薦に関する発表(ロング発表1件,ショート発表3件)があった.

1件目の発表では,ユーザの消費者としての役割と創作者としての役割の適応的対応付けによる推薦の研究発表であった.既存研究のCPRec手法のコアベクトルを用いずに消費者と創作者のベクトルを生成する提案手法とCPRecとの比較実験に関して報告があった.質疑応答では,先行研究のCPRecのコアベクトルに関する質問があり,CPRecでは消費者と創作者の両方の性質は明確に表されてないことを説明された.またベクトルの次元削減に関する質問と非線形性に関する質問があった.さらにFlickrを創作者を中心にすると何故うまくいくのか,Flickrの創作者特性を反映できているのかという質問があった.関連して,Flickr等の創作者が多い場合で創作者の影響がない(値が小さい)場合の妥当性や,ユーザAとBに分けた理由の質問があった.

2件目の発表では,観光経路推薦問題におけるスポットの価値推定法について提案された.行列分解ベースの協調フィルタリングと経路としての制約による価値関数の説明などがなされた.質疑応答では,観光の際には交通公共機関やタクシーを使うと思うが,どのようなことを想定しているのかといった質問があり,街の散歩などに使うと説明があった.価値が高いところは長く滞在する仮定以外の対応は可能かといった質問や,エッジに価値を持たせてるが粒度はどのように変えることができるのかといった質問があった.

3件目の発表では,空間演算に基づく遭遇率を考慮したスポット推薦システムが提案された.発表では,スポットに対してCFに基づき算出した各ユーザの訪問率を算出する手法とその評価検証について説明された.質疑応答では,会いたくない人を何故属性でまとめたのかといった質問や,属性設定の粒度に関する質問があった.また,会いたくない場所は少なくなってしまうと収束してしまうのではないかといった質問があった.コメントとして,空間的な距離を考慮するとか避けたい場合は人の多くない場所を探すと良いのでは,一旦大学で絞ってから特定の大学に絞るのも良いのでは,といったものがあった.

4件目の発表では,時空間演算を用いた動的オブジェクトを含むスポット検索手法を提案された.発表では,人物や事象に対するスポット検索手法の説明があった.質疑応答では,時間的変化する動的オブジェクトの検索の仕様に関する質問や,事象に関してはどのように利用するのかといった質問があった.先行研究の空間演算は距離だけで時間演算はできるのかといった演算に関する質問もあった.

セッション2:テキスト処理
副座長:岡本 一志(電気通信大学)

セッション2では,テキスト処理に関する発表(ショート発表3件)があった.

1件目の発表では,レストラン検索サイトのレビューを収集し,レビュー中の料理名周辺にある単語の重要度をTF-IDF法により分析した研究が報告された.料理名毎のシズルワードのTF-IDF値の分析結果について説明された.質疑応答では,係り受け解析の精度に関する確認や,研究目的であるレビューの記述支援が多くの似通ったレビューを生成することになってしまうのでは?などの質問があった.

2件目の発表では,サッカーの試合に関するツイートから出場選手の採点を行う研究について報告された.著者らのこれまでの研究では1ツイート毎に感情分析を適用していたが,今回の研究では,選手名を含む1文毎に感情分析を行うように改良したとのこと.18-19シーズンのプレミアリーグの1試合を対象に,提案法の採点性能を検証しており,その結果について説明された.質疑応答では,NLTKのSentiment Analysisが出力する総合値の解釈や,出力されたスコアの客観性,選手毎にツイート数が異なることの影響などの質問があった.

3件目の発表では,重複レシピの検出を行う研究について報告された.著者らのこれまでの研究では文字3-gramの単純な比較による手法を提案していたが,レシピ中の誤字や脱字に対して頑健ではなかったため,今回の研究では,Word Mover’s Distanceを応用した手法を提案した.質疑応答では,重複レシピが投稿される背景や検出することのねらい,料理オントロジーとの関係などについて質問があった.

セッション3:データ分析
副座長:西原 陽子(立命館大学)

セッション3では,データ分析に関する発表(ロング1件,ショート2件)があった。

1件目の発表では,ストーリーを持つ映像コンテンツの予告と本編のシーンの時系列を,比較分析した結果が報告された。アニメ,映画,ドラマについて分析したところ,映画とドラマの予告編では本編とは異なる時系列でシーンが並べられ,アニメは同じ時系列で並べられていることが多かった。音声についても同様の分析を行ったところ,シーンと同様の傾向が得られた。時系列を変えて予告編を作ることにより,ワクワクの創出を行なっていると考察がなされていた。発表後には,時系列順番の不一致のみでネタバレやワクワクを発見できるのか,ミスリードにより視聴を促進する効果はあるが,見終わった後の評価が下がる可能性についてどう考えるか,などの質問があった。

2件目の発表では,Web,ソーシャルメディアでのマーケティングキャンペーンの特徴について調査した内容が報告された.3つの研究課題を設定し,(1)キャンペーンを特徴付ける属性は何か,(2)属性の分類,(3)属性の相関について調査がなされた.調査の結果,商品のカテゴリによりマーケティングの目的が異なることが明らかになった.例えば,食品を景品としたキャンペーンでは,宣伝と販売促進を目的とすることが多く,化粧品を景品としたキャンペーンでは,ユーザ情報とユーザによる商品に対する評価情報取得を目的とすることが多いとわかった.発表後には,目的が不明なキャンペーンはなかったか,成功した・そうでなかったキャンペーンの違いや要因についてどう考えるか,などの質問があった.

3件目の発表では,ソーシャルグラフを用いたユーザの居住地推定を行うために,様々な中心性の値とユーザが友人と同じ居住地を持つかの間の関連について分析結果が報告された.中心性指標としては,入・出次数中心性,PageRank,HITSのAuthorityとHubを用いた.分析を行ったところ,PageRankとHITSのAuthority,Hubの値が大きいユーザは,居住地の推定が困難なことがわかった.発表後には,フォローされていないユーザや,位置情報を明らかにしていないユーザからの影響についてどう考えるか,居住地推定の粒度はどの程度かなどの質問,PageRankの値が大きいと,推定が困難になるというのは面白い結果であるなどのコメントがあった.

セッション4 :可視化・時系列データ処理
副座長:熊本 忠彦(千葉工業大学)

セッション4では,ロング発表1件,ショート発表2件があった.

1件目のロング発表では,Webページのタグ構造に基づいて特定される要素ごとに顕著性マップ(顕著領域マップ)を生成する手法と顕著度が高い要素のWebページ上の領域を集約して1つの図(タイル状の画像)にする手法が提案された.会場からは,顕著性マップ生成時に行われている要素のサイズと位置による顕著度の重み付けにどのような根拠があるのかという質問とタグの分類の仕方が古いのではという質問があったが,いずれも今後の課題とするという回答であった.また,この他にも,評価実験における設定の妥当性に関する質問やアイトラッカーの利用の是非に関する質問などがあった.

2件目のショート発表では,N個のM次元ベクトルで構成され,時点τ毎に記録された多次元時系列データを,τ毎に次元削減した上で散布図(2次元平面)として可視化するためのフレームワークが示され,散布図上のオブジェクトの直接操作により,時点毎に異なる指標の形成を可能とする視覚的分析インタフェースが提案された.会場からの,時点毎にPCA(主成分分析)を行っているということかという質問に対しては,そのとおりという回答であった.また,PCAの軸の意味が時点毎に変わってよいのかという質問に対しては,周期性のあるデータを前提としているという回答であった.また,座長からの,提案インタフェースをどういうところに使うと便利かという質問に対しては,Webログデータを用いてマーケティング分析するなど探索的な用途に向いているという回答であった.

3件目のショート発表では,LDA-Hawkesモデルを用いてクエリの潜在的なトピック(非明示的なカテゴリ)を推定するとともに,Hawkes過程の枝因子を用いて検索数を予測する手法が提案された.会場からの,Hawkes過程のカーネル関数が指数カーネルの場合とべき則カーネルの場合とで結果が違うのはなぜかという質問に対しては,単語の出現頻度がべき則に従っているので,べき則カーネルの方が安定している.加えて,べき則カーネルではパラメータが2つあり,表現力が大きいという回答であった.また,評価実験に関連して,何と何の順位相関なのかという質問に対しては,2種類あり,1つは予測結果と14時以降のデータとの順位相関,もう1つは予測結果とYahoo!Japan社内サービスにおける検索ランキングデータとの順位相関という回答であった.

学生参加報告

(旅費支援対象者による参加報告)


報告者:小邦 将輝(筑波大学)

2019 年 6月28日,29日に兵庫県立大学神戶商科キャンパスにおいて,ARG WI2 研究会が開催された.

今回の研究会では,口頭発表として情報推薦,テキスト処理,データ分析,可視化・時系列データ処理の 4 セッションが行われ,ロング発表 3 件,ショート発表 10 件,ポスター発表として 14 件(うち口頭発表との重複発表 11 件を含む) の発表が行われた.加えて, ⺠間宇宙ロケットと知られる MOMOの情報処理技術に携わる森岡氏による招待講演,清田氏による LIFULL 社における AI 技術の応用に関する技術報告セッションも開催された.両日とも参加者によって活気ある意見交換がなされていた.本報告では筆者が興味を持った発表について紹介する.

1 件目に佃氏らによる「ABCPRec:ユーザの消費者としての役割と創作者としての役割の適応的対応付けによるユーザ生成コンテンツ推薦」が挙げられる.佃氏らはユーザの消費コンテンツのみならず,創作コンテンツも用いたコンテンツ推薦手法として提案された CPRec の「モデルの柔軟性に欠ける」という課題の解決に取り組んでおり,比較実験において提案手法である ABCPRec が CPRec を始めとした比較手法に比べて,推薦精度が高いことを示した.この研究は情報検索分野のトップカンファレンスである SIGIR に採択されており,研究として非常に完成度が高かった.また,発表スライドについても細部まで手間を惜しまず作成されたのが伝わってくるものとなっていたことに加え,分野外の聴講者についても発表を理解できるよう工夫がなされていたことは,自らの発表資料を今後作成する上で重要な指針となった.

2 件目に若狭氏らによる「Twitter を用いたサッカー選手採点のための感情値辞書構築に向けて」が挙げられる.この研究ではツイートを基にして選手のプレーの採点を行うという試みがなされていた.視聴者が参加して選手の採点を行うという試みについて大変興味深く感じた.現状はサッカーを対象としているが,他のスポーツにも応用が可能だと考えられ,スポーツ観戦をさらに面白くさせる可能性を孕んだ研究であると考える.

3 件目に金田氏らよる「ワクワクとネタバレの違い」が挙げられる.ユニークな発想の研究が行われており,発表についても効果的に動画を取り入れるなど,聴者を引き込むようなプレゼンテーションが行われていた.萌芽研究賞の受賞に現れているように,今後の発展が期待される研究だと考える.

1日目の最後のプログラムとして行われたポスターレセプションでは,参加者が一同に介して議論を行った.WI2 研究会の特色として,幅広い分野の研究発表を受け入れていることが挙げられる.そのため,異なる領域の研究者と議論を交わせる貴重な場となった.また,参加者同士,研究とは関係ない話でも盛り上がることができ,議論の場としてだけでなく,研究者の交流の場としても,大きな働きを持っていたと考える.この 2日間を通して,筆者が普段持たない視点での議論を交わすことができた.今回の WI2 研究会への参加は自らの研究を発展させていく上で,非常に有益な場となった.最後に,本研究会において,筆者は「学生奨励賞」 「優秀学生ポスター発表賞」を受賞した.議論に加わってくれた方々,審査をして頂いた運営委員の方々に謝意を表する.今回の受賞に恥じぬよう今後も心を引き締め研究活動に取り組む所存である.


報告者:廣中 詩織(豊橋技術科学大学)

1日目の最初に開催された情報推薦のセッションでは,「ABCPRec:ユーザの消費者としての役割と創作者としての役割の適応的対応付けによるユーザ生成コンテンツ推薦」が発表された.この研究は,ユーザが何を消費したかとユーザが何を創作したかとの両方の情報を用いてユーザにコンテンツを推薦するモデルCPRecを改良したABCPRecを提案した.改良したモデルでは,ユーザは消費者としての好みと創作者としての好みを別々に持つことができ,より妥当な情報を使って推薦がおこなえる.とてもわかりやすい発表だった.

1日目の招待講演では,インターステラテクノロジズ株式会社の方による,「民間宇宙ロケットMOMOに使われている情報処理技術」のお話があった.MOMOにはRaspberry Piほどのサイズのコンピュータが搭載されていることや,約3000行のC言語で書かれたプログラムが動いていることなどを,興味深く聞いた.コンピュータはロケットの打ち上げに欠かせないものであるが,プログラムのバグひとつで打ち上げが失敗することもあるため,バグがひとつもないという状態を目指していると聞いたときは,とても大変だと思った.他にも,打ち上げ前に様々なテストをして信頼性を高めるが,テストを多くするとコストかかさむため,実際に打ち上げをテストとしておこなうこともあると聞き,コストに対する考え方もおもしろかった.

2日目の「ワクワクとネタバレの違い ―映像コンテンツにおける予告と本編で用いられるシーン時系列の比較分析―」も興味深く聞いた.この研究は,予告編の作成支援を目指して,アニメ・映画・ドラマの予告編の構成要素・シーンの時系列の調査をした研究である.予告編は,ネタバレ(本編への興味の喪失)を回避しながら,ワクワク(本編への興味)を引き出す必要があるとされている.今回はアニメ,映画,ドラマの3種類のメディアに対して分析がなされ,メディアによって予告編に違いがあることが示された.また,ネタバレを防ぎながらワクワクを引き出す方法として,シーンの時系列を本編と予告編とでわざと入れ替えたり,短いシーンを組み合わせたりするなど,予告編作成のテクニックがあることが示唆された.さらなる分析に興味を持った.

その他にもおもしろい発表がたくさんあった.また,自分の発表に対しても様々なコメントをいただいた.今後の研究に生かしていきたいと思う.


運営委員会

実行統括担当:笹嶋 宗彦(兵庫県立大学)
プログラム担当:吉田 光男(豊橋技術科学大学)
アルバイト担当:山本 岳洋(兵庫県立大学)
現地担当: 湯本 高行(兵庫県立大学),大島 裕明(兵庫県立大学)