2014年11月22日(土)・23日(日)に,リクルート本社(東京都千代田)にて第5回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表合わせて25件の発表がありました.
内容は,Webと機械学習,オピニオンマイニング,トピックモデル,情報推薦,オノマトペ,Twitter,情報検索,オープンデータ,プライバシー,Webと地理情報,動画コンテンツなどでした.また,招待講演では,「Deep Learningの実装」をテーマに取り上げ,中山 浩太郎氏(東京大学知の構造化センター)にご講演いただきました.参加者数は114人でした.懇親会は,本格的なネパール料理店で行いました.
→プログラム →特別講演 →表彰 →副座長報告 →学生参加報告 →運営委員会
日時・会場
日時: | 2014年11月22日(土)9:50~18:30 2014年11月23日(日)9:40~18:00 |
|
会場: | 株式会社リクルートホールディングス 本社 グラントウキョウサウスタワー41F アカデミーホール (〒100-6640 東京都千代田区丸の内1-9-2) http://www.recruit.jp/company/office.html |
アルバム
プログラム
発表時間: ロング 30分,ショート 18分
■11月22日(土)(受付 9:20~) | |
9:50-10:00 | 開会の挨拶 |
10:00-12:00 | セッション1: Webと機械学習 座長: 荒木 健治 (北海道大学) 副座長: 熊本 忠彦 (千葉工業大学) (ロング発表) 1.コミュニティQAにおける文章の表層的特徴に基づく回答文の分析 ○朱 成敏,武田 英明(国立情報学研究所) 2.SNS動画像投稿記事のトピック抽出とそのカテゴリー化によるプライバシー侵害理由の推定方式 ○尾崎 敏司,輪島 幸治,隅岡 隆之,村上 陽子,邓 超頴,嶋田 茂(産業技術大学院大学) (ショート発表) 3.レビュー閲覧履歴からの価値観モデリングのための動的レビュー提示手法の提案 ○清水 涼人,服部 俊一,高間 康史(首都大学東京) 4.同行者および自宅からの距離を考慮したトピックモデル ○深澤 佑介,太田 順(東京大学) 5.Twitterにおける被検索ユーザの分類によるワードスコープの同定に関する基礎検討 ○山西 良典,奥 健太(立命館大学) |
12:00-13:30 | 昼休憩 |
13:30-14:30 | 招待講演「Deep Learningの実装」 司会:土方 嘉徳(大阪大学) 6.Deep Learningの実装 ○中山 浩太郎(東京大学知の構造化センター) |
14:30-14:50 | 昼休憩 |
14:50-16:20 | セッション2: 推薦システム1 座長: 高間 康史 (首都大学東京) 副座長: 大塚 真吾 (神奈川工科大学) (ロング発表) 7.地球科学データに対するキーワード推薦手法 ○石田 陽一,清水 敏之,吉川 正俊(京都大学) 8.ユーザ参加型主観的情報分析システムを利用した観光情報推薦システムの提案 ○橘 一聖,市村 匠(県立広島大学) 9.実時間と動画時間から面白い動画コメントを抽出する手法とその適用事例 ○早川 卓弥,土方 嘉徳,西田 正吾(大阪大学) |
16:20-16:40 | 休憩 |
16:40-17:40 | セッション3: 推薦システム2 座長: 深澤 佑介 (東京大学) 副座長: 井口 誠 (KII) (ショート発表) 10.否定的評価を考慮した推薦システムの提案 ○林 慶,山口 智浩(奈良工業高等専門学校) 11.時間の影響度を考慮したPoint of interest推薦の提案 ○小島 直己,高木 友博(明治大学) 12.検索結果の絞り込みのため語集合の整数線形計画ソルバを使用した特定 ○手島 亮太,岡部 正幸,梅村 恭司(豊橋技術科学大学) |
17:40-17:50 | 休憩 |
17:50-18:30 | 技術報告セッション 座長:土方嘉徳(大阪大学) 「変わったUIを持つ”へやくる!”について」 株式会社ネクスト 大坪 五郎 「スマートフォンアプリを通じた住まい探しユーザーの理解と支援」 株式会社ネクスト 清田 陽司 |
19:00-22:00 | 懇親会 |
■11/23(日) (9:10~受付) | |
9:40-11:30 | セッション4: 自然言語処理 座長: 土方 嘉徳 (大阪大学) 副座長: 村上 晴美 (大阪市立大学) (ロング発表) 13.特定状況下における実世界行動ネットワーク構築 ○片岡 泰之,中辻 真,戸田 浩之,小池 義昌(日本電信電話株式会社),松尾 豊(東京大学) 14.オノマトペの多義性解消における名詞の有効性 ○福島 弘識(北海道大学), 内田 ゆず(北海学園大学), 荒木 健治(北海道大学) 15.地域の認知と評価の集合知としてのSALoTマップ -場所の特徴的イメージを表す単語や文章の自動抽出- ○大森 宏(東京大学),羽生 和紀(日本大学),山下 雅子(東京有明医療大学) (ショート発表) 16.評価文の意味的類似度を用いたテキストマイニングシステムSTMの評判分析機能の精度向上 ○外山 敏彦,原田 実,松村 冬子(青山学院大学) |
11:30-13:00 | 昼休憩 |
13:00-15:10 | セッション5: Webデータ分析 座長: 大向 一輝 (国立情報学研究所)副座長: 西山 莉紗 (日本IBM) (ロング発表) 17.ヒット現象の数理モデルによるAKB選抜総選挙の解析2010ー2014 ○太田 奨,石井 晃(鳥取大学) 18.ヒット現象の数理モデルを活用したメディア別・地域別の広告効果の分析 ○川畑 泰子,源田 悦夫(九州大学),石井 晃(鳥取大学) 19.検索の前後における利用者のコンセプトマップの分析: 検索の有無による比較 ○齋藤 ひとみ(愛知教育大学),江草 由佳(国立教育政策研究所),高久 雅生(筑波大学) (ショート発表) 20.地方議会会議録を利用した自治体間引用関係抽出における被引用数・引用数の分析 ○葦原 史敏(北海道大学), 木村 泰知(小樽商科大学),荒木 健治(北海道大学) 21.大学生によるオープンデータの取り組み ○高野 敦子(兵庫大学) |
15:10-15:30 | 休憩 |
15:30-17:40 | セッション6: Webシステム・可視化 座長: 山本 岳洋 (京都大学) 副座長: 櫻井 茂明 (東芝ソリューション) (ロング発表) 22.SNSの投稿内容に含まれる興味に着目したアカウント到達可能性算出モデルの検討 ○吉國 綺乃(お茶の水女子大学),渡辺 知恵美(筑波大学),小林 一郎(お茶の水女子大学) 23.一般ユーザ目線でのTwitterからの人物関係の可視化 ○西村 章宏,土方 嘉徳,三輪 祥太郎,西田 正吾(大阪大学) 24.ポータルサイト向け情報検索エンジン ○阿部 真也(産業技術研究センター) (ショート発表) 25.オンライン議論の質的向上のための支援手法 ○朱 成敏,武田 英明(国立情報学研究所) 26.誰でも楽しめるタンジブルUIを使った物件探索マップ ○大坪 五郎(ネクスト) |
17:40-18:00 | 表彰式・クロージング |
招待講演:「Deep Learningの実装」
司会: | 土方嘉徳(大阪大学) |
講演者: | 中山 浩太郎(東京大学知の構造化センター) |
講演概要: | 最近様々な分野でディープラーニングが利用され,その有効性が証明されている.本講演では,ディープラーニングの実装として代表的なツールの一つ「Pylearn2」とその利用方法を紹介する. Pylearn2はPythonで実装されたオープンソースのディープラーニングツールであり,MaxoutやSdAなど各種のアルゴリズムが実装されているのが特徴である.また,講演者らが開発しているディープラーニングライブラリ「GeSdA」とそのアプリケーションについても紹介する. |
表彰
WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のようになります.
優秀研究賞
特定状況下における実世界行動ネットワーク構築
片岡 泰之,中辻 真,戸田 浩之,小池 義昌(日本電信電話株式会社),松尾 豊(東京大学)
萌芽研究賞
実時間と動画時間から面白い動画コメントを抽出する手法とその適用事例
早川 卓弥,土方 嘉徳,西田 正吾(大阪大学)
誰でも楽しめるタンジブルUIを使った物件探索マップ
大坪 五郎(ネクスト)
学生奨励賞
オノマトペの多義性解消における名詞の有効性
福島 弘識(北海道大学), 内田 ゆず(北海学園大学), 荒木 健治(北海道大学)
副座長報告
セッション1:Webと機械学習
副座長: 熊本 忠彦 (千葉工業大学)
セッション1「Webと機械学習」では、5件の発表があり、最初の2件がロング発表、後の3件がショート発表であった。1件目は、コミュニティQAサイト「Yahoo!知恵袋」における回答文の表層的特徴を「恋愛相談、人間関係の悩み」や「Windows全般」といったいくつかのカテゴリ毎に分析することで、質問のタイプに応じたベストアンサーを推定する手法を提案している。
2件目は、動画投稿サイトである「YouTube」に投稿された記事を分析することで、被撮影者の動画像が無断でSNSに投稿されるというプライバシー侵害を検出するだけでなく、その侵害理由を推定する方式を検討している。3件目は、ユーザのレビューに対する評価履歴からそのユーザの価値観を表すユーザモデルを構築しようとするとき、ユーザに提示するレビューを動的に決定することで、より少ない負荷でのユーザモデル構築を可能にする手法を提案している。会場からは、レビューを動的に提示するために必要な知識をシステムは事前に持っているのか、といった質問があった。
4件目は、モバイルユーザの屋外における行動支援を目的としており、Twitter上の情報を分析することで、同行者(誰と)、場所(どこに)、トピック(何をする)の3つの要素間の相関関係を明らかにしている。会場からは、実名の人は同行者としてのタイプ(父や母、子など)が同定できないので、本手法の対象外になる、3要素の組み合わせ方によっては出現頻度が低頻度となり、信頼性が乏しくなる、といった疑問が呈された。5件目は、Twitterを対象に言語的意味概念のグランディングに取り組んでいる。すなわち、ツイートの中の単語が実世界上で指し示しているものを同定するための手法について基礎的な検討を行っている。
セッション2:推薦システム1
副座長:大塚 真吾(神奈川工科大学)
セッション2 (ロング発表3件)では、地球科学データに対するキーワード推薦、観光情報推薦、面白い動画コメントを抽出する手法に関する発表があった。
1つ目の発表では、様々な地球科学データを統合的に利用するために、特徴的なキーワードを推薦する手法の提案があり、その後、評価実験の説明があった。
質疑では、キーワードの定義に関する質問や、今回用いたキーワードセット以外にWikipediaのようなものを活用したら良いのではないかというコメントなど、活発な議論がなされた。
2つ目の発表では、ユーザ参加型観光サイトを用いた観光情報推薦に関する発表があった。
質疑では、ユーザが入力する観光情報に関するキーワードのゆらぎに関する質問や、感性情報の利用方法に関しての質問など、活発な議論がなされた。
3つ目の発表では、ニコニコ動画のような動画の再生と同期して動画コメントが流れるコンテンツから面白い動画コメントを抽出する手法の提案があり、その後、評価実験の説明があった。
質疑では、提案手法のもとになる実時間と動画時間に関する質問や、被験者間の一致率に関する質問など、活発な議論が行われた。
セッション3:推薦システム2
副座長:井口 誠(KII)
セッション3(発表件数:3)では、推薦システムに関する3件のショート発表があった。1件目の発表では、否定的な評価を推薦に活用する手法の提案がなされた。会場からは、本来排除するべきではない好意的な特徴まで除外される可能性があるのではないかとの質問があり、実際にこれらの選別は難しいケースもあるとの回答がなされた。この他、否定理由の共通項抽出に着目してみてはどうか等のコメントや、提案手法の適用に向いているフィールドに関する質問が寄せられた。
2件目の発表では、現時刻にマッチした POI (Point of Interest)を提案する手法が紹介された。会場からは、正規分布によるスムージングの副作用(e.g. 既にお店が閉店している時間帯に POI 推薦が行われてしまう可能性)について質問があり、発表者からは評価結果として良い推薦精度が出ているため特に問題視していないとの回答がなされた。この他、スポット滞在時間を考慮するべきなのではないか、時間以外のコンテキスト/属性に適用可能なのではないか等のコメントが寄せられた。
3件目の発表では、検索結果の絞り込みのための語集合を0-1整数計算問題に定式化して特定する手法が提案された。会場からは、提案手法の評価に使われている「被覆率」についていくつか質問が寄せられた。検索性能指標として広く使われている「再現率」との違いについての質問や、単純に「単語を含む」というだけではなく「正しい語」が絞り込まれたことを評価に含まないといけないのではないか(e.g. “Apple” という単語で、ブランドとしての “Apple” と果物としての “Apple” が被覆されたことを正解とみなしてよいのか)等のコメントが寄せられた。
セッション4:自然言語処理
副座長:村上晴美(大阪市立大学)
セッション4では、ロング発表3件とショート発表1件があった。1件目の発表では、センサでは推定できない実世界行動を予測するために、Social Mediaから実世界行動ネットワーク(知識ベース)を自動構築する手法が提案された。行動予測に関する実用的なアプリケーション化の見通しについて質問があり、この研究単体だけではなく、他の情報(ユーザの過去の履歴や別の履歴)も必要であると思われるという回答がなされた。F値ではなく応用を考えて適合率か再現率のどちらかをあげる方がよいのでは、という指摘がなされた。本発表は優秀研究賞に選ばれた。
2件目の発表では、擬音語と擬態語の二つの意味を持つオノマトペがどちらの意味で使われているかを判別するために、オノマトペの意味を決定する名詞を抽出して判別する手法が提案された。オノマトペが擬音語か擬態語か判別することが翻訳などのユースケースにおいてどの程度重要なのか、に関する質疑応答がなされた。擬音語と擬態語の判別よりもオノマトペの程度の方が重要なのでは、というコメントがあった。本発表は、学生奨励賞に選ばれた。
3件目の発表では、大学生による景観調査を行い、景観の集合知的なイメージの抽出を行うという発表がなされた。文書分類についてはもっと良い方法があるのではという指摘が会場からあった。よくデータがとれているがどのようにファシリテーションされたのかという質問があり、授業の課題としたという回答がなされた。観光地以外の適用可能性についての質問がなされた。
4件目の発表では、評価語だけではなく評価文を評価表現辞書に登録することにより、評価文と意見文との意味的類似度をもとに評価極性を決定するシステムが提案された。文脈によってGoodにもBadにも判定できる「頻度が減る」を事例として、評価文の入力方法や類似度の判定方法が具体的にどのようにされているのかを確認する質疑応答がなされた。本セッションは4件中2件が受賞(優秀研究賞と学生奨励賞)するなど、発表の質が高く、質疑応答が活発で盛り上がったセッションであった。
セッション5: Webデータ分析
副座長:西山 莉紗(日本IBM)
このセッションでは大きく分けてWeb上のデータを分析した結果に関する発表と(1、2、4件目)、Web利用者の知識構造の可視化に関する発表と(3件目)、Webを教育に利用する試みに関する発表(5件目)の3種類の発表がなされた。
1件目と2件目の発表では、ヒット現象に対する人々の興味や意欲を表す数理モデルを利用した、ソーシャルメディアデータの分析結果が紹介された。1件目の発表は、開催のたびにインターネット上でも大きな話題となるAKB選抜総選挙を対象とし、候補者であるAKBメンバーがテレビやネットニュースに出現した回数が、人々が候補者の名前をブログに書き込む回数、すなわち、人々の候補者に対する興味に与える影響を分析した結果について報告した。会場からは、今回利用した微分方程式モデルの、従来の回帰モデルとの違いを問う質問や、国政選挙への適用可能性についての質問がなされた。続く2件目の発表では、1件目と同じモデルを利用し、あるアーティストがローカルTVに出演した場合と、ネットTVに出演した場合との、人々の興味に与える影響の違いが報告された。1件目の発表ではソーシャルメディアユーザー間の間接コミュニケーションがユーザーの興味に大きな影響を与える、という結果であったのに対し、2件目の発表ではマスメディアの広告効果が与える影響が重要視される分析結果であったため、会場からは分析対象とするヒット現象の種類によって、興味に影響を与える要素が異なるのか、という質問がなされた。それに対し発表者からは、現在複数種類のヒット現象を対象として検証中である旨の回答があった。
3件目の発表は、検索行動によって検索者の知識が再構築されることを定量的に検証する、新規な試みを紹介するものだった。検証においては「コンセプトマップ」と呼ばれる、知識をグラフの形で表現したものを利用し、被験者に検索課題を与えた前後でコンセプトマップを描かせ、その構造変化をもって被験者の知識の変化を量った。会場からは実験方法に関する指摘や、コンセプトマップの構造変化の度合いを測る指標に関する質問などが活発に上げられた。
4件目の発表は、地方議会会議録中で、ある自治体が他の自治体の会議録中で言及されている回数(被引用数)と、ある自治体の会議録中で他の自治体に言及している回数(引用数)の相関を調査した結果を示すものであった。会場からは、「北区」など同じ名前を持つ異なった自治体の識別が必要となるのではないか、という指摘や、議会の政治活動における調査結果の利用シナリオについての質問がなされた。
5件目の発表は、Project-based Learning (PBL)と呼ばれる、グループ単位でのプロジェクト実践型の教育プログラムにおいて、オープンデータの整備を題材とすることの意義や、実施方法を紹介するものであった。この取り組みではオープンデータ作成プラットフォームとしてLinkData.orgを利用することを検討しており、プロジェクトの実践において役立つ、いくつかのLinkData.orgの機能が紹介された。会場からは教育プログラムの実施対象となる学生の種類や、評価方法についての質問がなされた。
セッション6:Webシステム・可視化
副座長: 櫻井 茂明 (東芝)
セッション6 (発表件数5件)では、3件のロング発表に引き続いて、2件のショート発表が行われた。1件目の発表では、複数サービスを利用するユーザのアカウントが結び付けられる可能性を示すアカウント到達可能性において、投稿内容に含まれる興味に着目した手法の検討結果が報告された。会場からは、人に知られたくない興味が結果に与える影響などに関する質疑や、場所などの情報と組み合わせての評価の必要性に関するコメントがなされた。
2件目の発表では、一般人のTwitterにおける有名人に対する発言内容を解析することにより、有名人間の関係を可視化する手法が提案された。会場からは、Twitterにおける140文字制限の与える影響などに関する質疑や、ユーザが作成しているリストを活用した定量評価の可能性に関するコメントがなされた。3件目の発表では、複数の公設試験研究機関に分散する実験設備情報の一括検索システムにおいて、その構築結果が報告された。会場からは、オブジェクトの特徴を表す数値などを利用した検索の可能性や、提案法と従来法の再現率の違いなどに関する質疑が行われた。
4件目の発表では、Wikipediaを題材として、オンライン上の議論を分析することにより、妥当な議論を支援するためのツールを試作した結果が報告された。会場からは、議論の参加者のプロファイル分析の実施や議論の内容とWikipedia本文との関係などに関する質疑が行われた。5件目の発表では、情報弱者に向けて、タンジブルUIを利用することにより、不動産情報を探索するシステムを試作した結果に関する報告がなされた。会場からは、OR検索の可能性、ユーザが迷っている原因に関する知見、情報弱者に対応することの必要性などに関する質疑が行われた。
運営委員会
実行統括担当:井口 誠 (KII)
プログラム担当:西山 莉紗(日本IBM)
受付担当:濱崎 雅弘(産業技術総合研究所)
ローカル担当:櫻井一貴(リクルートテクノロジーズ)
映像配信担当:山田 和明(東洋大学)
会計担当:井口 誠 (KII)