第21回WI2研究会報告

2025年11月2日(日)にオンライン,4日(火),5日(水)に現地で第21回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告合わせて24件の発表がありました.

意思決定,言語処理,SNS,情報推薦,LLM,データ解析,レビュー解析に関するセッションがありました.

→プログラム →表彰 →セッション報告 →運営委員会

学生による参加報告1

学生による参加報告2

日時・会場


2025年11月5日(水)08:30-12:55
日時: 2025年11月2日(日)13:00~16:20
2025年11月4日(火)11:30-16:40
会場: オンライン(11月2日)/アスティとくしま 1階 第2会議室(11月4,5日)

アルバム

会場の様子
会場の様子
質疑応答の様子
懇親会の様子
発表の様子
質疑応答の様子

プログラム

☆:学生発表
発表時間:ロング 30分,ショート 18分

■11月2日(日)*発表は全てオンライン
(Zoom開始予定:12:45)

13:00-13:10 オープニング
大塚 真吾(神奈川工科大学)

13:10-14:30 セッション1:情報推薦(1)
座長:柴田 祐樹(東京都立大学)
(ショート発表)
1. 世界設定を共通属性とするクロスドメイン推薦システムの提案☆
伊藤 陸来, 羽賀 友哉, 柳下 聖, 奥 健太(龍谷大学)

(ロング発表)
2. 空間型ユーザプロファイルに基づくMulti-Interest推薦システムの提案と評価
奥 健太(龍谷大学)

3. 他者への貢献に着目した情報推薦エコシステムの提案☆
土橋 昂輝, 柴田 祐樹, 高間 康史(東京都立大学)

14:30-14:50 休憩

14:50-16:20 セッション2: 情報推薦(2)・支援 
座長:岡本 一志(電気通信大学)
(ショート発表)
4. ゲーム要素分解に基づく部分的類似性に着目したゲーム推薦システムの提案☆
連 和輝, 藤井 理史, 奥 健太(龍谷大学)

5. テーゼ・アンチテーゼ・ジンテーゼに着目した物語要約に基づく映画推薦システムの提案☆
大西 皓, 佐々木 滝也, 奥 健太(龍谷大学)

6. 人形浄瑠璃の振りに着想を得た音声対話ロボットSotaの身体的ふるまいの設計と実装
中川 幸子(青山学院大学), 丸山 広(青山学院大学), 高間 康史(東京都立大学)

(ロング発表)
7. 外国語で教科を学ぶ学生を対象とした教育学習支援システムのためのJavaScript上で動作するエッジAIと複数指示追従問題
江原 遥(東京学芸大学)

■11月4日(火)*発表は全て現地
(Zoom開始予定:11:20)

11:30-13:50 セッション3: LLM応用(1)
座長:北山 大輔(工学院大学)
(ショート発表)
8. GPT-4oを用いた糖尿病患者における必要インスリン量を求めるシステム開発☆
増田 陸玖, 大塚 真吾(神奈川工科大学)

9. 知識グラフを用いた大規模言語モデル質問応答の精度改善  ☆
朝倉 夕稀, 亀井 清華, 森本 康彦(広島大学)

(ロング発表)
10. 外部知識を優先した出力生成のための類似度カーネル平滑化手法☆
森岡 葵子,吉丸 直希,木村 優介,波多野 賢治(同志社大学)

11. SLMを用いた同一ドメイン参照型チャットシステムのサーバレス実装
谷岡 広樹(徳島大学)

13:10-13:30 休憩

13:30-15:00 セッション4: SNS・クラウドソーシング
座長:風間 一洋(和歌山大学)
(ショート発表)
12. 【発表キャンセル】コロナワクチン関連トピックに対するTwitterコミュニティの感情反応☆
Wu Qianyun(東京科学大学)

(ロング発表)
13. ソーシャルネットワークにおける人口の偏りを考慮した地理的選好の測定☆
高柳 慶太郎, 廣中 詩織, 首藤 一幸(京都大学)

14. 問題解説文の空所補充問題化における空所の数と位置が読解に及ぼす影響☆
佐藤 寿樹, 北山 大輔(工学院大学)
 
15. 推薦システムの性能に対する知覚とその信頼に関連する心理尺度との相関分析☆
古澤 弘隆(関西学院大学), 東 沙帆(関西学院大学), 井野 泰輔(関西学院大学), 木村 有那(関西学院大学), 濱崎 雅弘(産業技術総合研究所), 後藤 真孝(産業技術総合研究所), 土方 嘉徳(兵庫県立大学)

15:00-15:20 休憩

15:20-16:40 セッション5: LLM応用(2)
座長:奥 健太(龍谷大学)
(ショート発表)
16. LLMを用いた介護スタッフの性格特性を考慮した作業負荷予測に関する研究
軽部 幸起, 岡本 一志 (電気通信大学)

(ロング発表)
17. SHAP 値を特徴量に組み込んだ学習手法による機械学習モデルの性能向上☆
林 悠太郎, 森本 康彦, 亀井 清華(広島大学)

18. LLMの社会的バイアス低減に向けたモデルマージ手法の有効性検証
白藤 大幹(三菱電機株式会社), 斉藤 辰彦(三菱電機株式会社), 木村 泰知(小樽商科大学)


19:00-21:00 懇親会
 場所:居酒屋とくさん(https://tokusan.owst.jp/)(徳島駅から徒歩2分)


■11月5日(水)*発表は全て現地
(Zoom開始予定:8:20)

08:30-10:30 セッション6: 情報抽出・レシピ
座長:廣中 詩織(京都大学)
(ロング発表)
19. メルカリ出品者支援のための類似商品の平均売却価格系列を利用した商品の価格と売却期間の推定☆
森 優太郎, 上野 史, 太田 学(岡山大学)

20. 表構造解析手法のトークン抽出処理の改良とFinTabNetを用いた評価☆
田上 歩夢, 金澤 輝一, 上野 史, 太田 学(岡山大学)

21. 季節性を考慮した代替食材推薦システムの開発☆
田中 大亮, 亀井 清華, 森本 康彦(広島大学)

22. BERTを用いた料理のアレンジの多クラス分類手法☆
吉田 紘陽, 風間 一洋(和歌山大学)

10:30-10:50 休憩

10:50-12:20 セッション7: 情報推薦(3)
座長:吉田 光男(筑波大学)
(ロング発表)
23. 正確性と多様性を両立する傾向スコア導入線形オートエンコーダ☆
大西 雄真(北海道大学), 林 克彦(東京大学), 上垣外 英剛(奈良先端科学技術大学院大学)

24. 推薦エンジンの切り替え機能の有無を組み込んだ信頼モデルに関する基礎分析☆
山田 真(兵庫県立大学), 天井 里咲(関西学院大学), 徳山 陽祐(関西学院大学), 佃 洸摂(産業技術総合研究所), 濱崎 雅弘(産業技術総合研究所), 後藤 真孝(産業技術総合研究所), 土方 嘉徳(兵庫県立大学)
 
25.多目的最適化と大規模言語モデルを利用した観光ルート推薦の一手法☆
李 令宇, 上野 史, 太田 学(岡山大学)

12:20-12:35 休憩

12:35-12:55 表彰式・クロージング

表彰

WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のとおりです.

優秀研究賞(5件)
「外部知識を優先した出力生成のための類似度カーネル平滑化手法」
同志社大学 森岡  葵子 殿
同志社大学 吉丸  直希 殿
同志社大学 木村  優介 殿
同志社大学 波多野 賢治 殿

「LLMの社会的バイアス低減に向けたモデルマージ手法の有効性検証」
三菱電機株式会社 白藤 大幹 殿
三菱電機株式会社 斉藤 辰彦 殿
小樽商科大学   木村 泰知 殿

「正確性と多様性を両立する傾向スコア導入線形オートエンコーダ」
北海道大学         大西  雄真 殿
東京大学          林   克彦 殿
奈良先端科学技術大学院大学 上垣外 英剛 殿

「他者への貢献に着目した情報推薦エコシステムの提案」
東京都立大学 土橋 昂輝 殿
東京都立大学 柴田 祐樹 殿
東京都立大学 高間 康史 殿

「空間型ユーザプロファイルに基づくMulti-Interest推薦システムの提案と評価」
龍谷大学 奥 健太 殿

学生奨励賞(5件) 
「世界設定を共通属性とするクロスドメイン推薦システムの提案」
龍谷大学 伊藤 陸来 殿
龍谷大学 羽賀 友哉 殿
龍谷大学 柳下  聖 殿
龍谷大学 奥  健太 殿

「季節性を考慮した代替食材推薦システムの開発」
広島大学 田中 大亮 殿
広島大学 亀井 清華 殿
広島大学 森本 康彦 殿

「ソーシャルネットワークにおける人口の偏りを考慮した地理的選好の測定」
京都大学 高柳 慶太郎 殿
京都大学 廣中  詩織 殿
京都大学 首藤  一幸 殿

「推薦システムの性能に対する知覚とその信頼に関連する心理尺度との相関分析」
関西学院大学 古澤 弘隆 殿
関西学院大学 東  沙帆 殿
関西学院大学 井野 泰輔 殿
関西学院大学 木村 有那 殿
産業技術総合研究所 濱崎 雅弘 殿
産業技術総合研究所 後藤 真孝 殿
関西学院大学/兵庫県立大学 土方 嘉徳 殿

「推薦エンジンの切り替え機能の有無を組み込んだ信頼モデルに関する基礎分析」
兵庫県立大学 山田  真 殿
関西学院大学 天井 里咲 殿
関西学院大学 徳山 陽祐 殿
産業技術総合研究所 佃  洸摂 殿
産業技術総合研究所 濱崎 雅弘 殿
産業技術総合研究所 後藤 真孝 殿
兵庫県立大学 土方 嘉徳 殿

セッション概要

録音した音声を「Whisper」を用いてテキスト化し、ChatGPTを用いて500字程度に要約したものを微修正したものです。

セッション1:情報推薦(1)(*発表はすべてオンライン)

1. 世界設定を共通属性とするクロスドメイン推薦システムの提案

質疑は大きく2点に集中した。1点目は推薦評価方法についてである。被験者は映画から推薦されたゲームやアニメを実際にプレイするわけではなく、提示されたタイトルとドメイン情報(ゲーム/アニメ等)のみを基に、推薦リスト内のアイテムに対して「元々知っていて興味がある」か「知らなかったが興味を持った」かを自己判断する方式で評価を行っている。興味獲得の判断基準となる追加情報提示や視聴・プレイ体験はなく、判断は被験者の主観に委ねられているため、評価統制の明確化が課題として示唆された。2点目は「世界設定」を研究焦点に置いた理由である。グラフ上、世界設定より重要度の高い要素が存在するにもかかわらず選択した理由として、研究側は少しでも需要がある領域へアプローチする方針を挙げた。さらに、ストーリー情報は媒体によって形式や長さが大きく異なり、固有名詞依存も強いためクロスドメイン推薦には扱いづらい一方、世界設定は抽象度が高く媒体間を橋渡し可能な共通概念となり得るため採用したと説明した。ただし、世界設定とストーリーとの関係性や選択根拠の明確化が不十分との指摘もあり、整理が必要であると締めくくられた。

2. 空間型ユーザプロファイルに基づくMulti-Interest推薦システムの提案と評価

本質的な論点は①興味評価の判断基準、②空間型ユーザプロファイル採用理由、③推薦提示ロジックとセレンディピティ拡張可能性の3点に整理される。まず、提示作品に「初めて興味を持った」かどうかの判断は被験者に完全に委ねられ、映画タイトル、ポスター、IMDBリンクといった基本情報のみが提供され、あらすじやレビューを見るかどうかも含め統制は行っていない点が確認された。次に、作品配置を2次元空間型で表現した理由について、従来のリスト方式との差別化、視覚的直感性や整理のしやすさを根拠としたと説明され、配置空間上の関係表現が特徴抽出に有効になり得るとのコメントが寄せられた。さらに推薦対象選択はクラスター単位で行われ、内部では最初に見つかったアイテムが提示される単純方式であることが明かされ、将来的にはカテゴリー内多様性や意外性を高める仕組みへの発展可能性が指摘された。また研究側としても、本来セレンディピティ評価を目的に発展的に活用したい意図が述べられたが、現段階では自動属性抽出や意外性制御は未実装である。最後に、世界観や興味整理手法が自己認識促進には有効な一方、本人が気づかない嗜好発見には追加的仕組みが必要となる点が整理された。

3. 他者への貢献に着目した情報推薦エコシステムの提案

質疑は主に3点に集中した。①貢献度算出ロジックについて、推薦制度貢献度は評価入力後に算出され、入力時点ではユーザー自身が得点を予測できない点が指摘された。具体的には、評価が他者の推薦精度にどれほど寄与したかに応じて貢献度が増減するため、正直に評価しても期待より低い貢献度となる可能性がある。研究側はカバレッジ貢献度は事前提示可能だが、推薦制度貢献度は事前推定手法が検討段階にあり、複数貢献度指標の統合が必要と認めた。②悪用・架空評価の可能性について、ポイント目的で未利用アイテムを評価するリスクが問われた。著者は対象を購入・視聴履歴が確定するサブスクや通販に限定する前提を示し、映画館や食べログ型環境には適用困難と整理した。③シミュレーション設計では、MovieLensの既存評価値に加え、未評価部分は予測値を入力済みと仮定し、評価入力に伴いユーザー×アイテム行列が時系列に埋まっていく設定であることが説明された。時刻ごとの推薦制度変動を考慮する点は評価されたが、評価行動と推薦精度の因果把握の厳密性が課題として示された。全体として、貢献度設計の透明性、悪用防止設計、時系列更新モデルの精緻化が今後の改善点として整理された。

セッション2:情報推薦(2)・支援(*発表はすべてオンライン)

4. ゲーム要素分解に基づく部分的類似性に着目したゲーム推薦システムの提案

質疑は主に①要素抽出精度の評価、②ランダム提示設計の妥当性、③マニアック作品推薦の可能性の3点に集中した。まず、ゲーム要素抽出について、失敗例が示されていたが抽出精度そのものの評価は未実施であり、現在は提示された要素が実際のゲーム内容と合致しているかを発表者の主観で確認している段階で、今後体系的検証が必要とされた。次に、推薦要素をランダム生成する設計理由について質問があり、新規発見性を重視しているためと回答されたが、ランダムでは偶然性に左右され、同一条件でも結果が安定せず、また単純ランダム推薦との差異が不明確となるリスクが指摘された。そのため、ランダムを対照群としたABテストや、提示候補リストからユーザーが要素選択する方式などの比較検証が有効と提案された。最後に、提示結果がメジャー作品中心である点が問われ、発表者はデモ性質上メジャータイトルを表示したと説明し、実際にはマニアック作品も出るものの、要素認識や説明理解が届くかは課題と認めた。加えて、作品概要閲覧を組み合わせた興味判断支援の導入も提案された。

5. テーゼ・アンチテーゼ・ジンテーゼに着目した物語要約に基づく映画推薦システムの提案

本質疑では、映画からテーゼ(テーゼ/アンチテーゼ/ジンテーゼ)を抽出する研究手法の妥当性と、抽出精度評価の不足が主に議論された。まず、「全ての映画に三段構成が存在する前提を置いてよいのか」「三幕構成に従わない作品はどう扱うのか」と問われた。発表者は、今回は全作品にテーゼが存在する前提で特徴抽出を行っており、その前提自体への検討は未実施と回答した。また、LLM(OpenAI)によるテーゼ抽出結果について、正式な評価実験は行っていないが、主要作品では期待通りの抽出が得られたため採用したと述べた。続いて、タイトルだけを入力した場合、マイナー作品でも正しく抽出できているのか、客観的妥当性の検証方法が不十分である点が指摘された。発表者は、今回は既知・有名作品での確認結果を基に手法を適用しており、未視聴作品やマイナー作品に対する精度検証は今後の課題と認めた。また、プロンプト内に映画IDを含めていた点について、IDが抽出結果に影響している可能性自体は未検討であることを述べた。全体として、テーゼ抽出の一般化可能性と、客観的評価指標の導入が今後の重要課題として整理された。

6. 人形浄瑠璃の振りに着想を得た音声対話ロボットSotaの身体的ふるまいの設計と実装

質疑は主に①想定オーディエンス、②ジェンダー設定、③専門家評価の3点に集中した。まず、ロボットによる文化施設向けジェスチャー提示において対象者の範囲が問われ、発表者は市町村レベルの文化施設を中心とし、海外観光客よりもまず幅広い年齢層の日本人を対象に設計していると回答した。ただし多言語対応は音声後付け翻訳により技術的に可能であり、将来的拡張を否定しない姿勢が示された。次にジェンダー設定について、人形浄瑠璃の女方を中心に設計した理由が問われた。発表者は、女方は上半身表現が主体であり、足運びを多用する男方よりロボット身体構造と適合するため採用したと説明した。続いて、動きの妥当性を専門家が評価しているかが問われ、発表者は実際に演じ手本人(今回参照映像の演者)による評価経験があり、プロ視点では厳しい評価が出たと報告した。また、対象者が背景理解を有するか否かで受容が変化しうる点も認識しており、模倣再現のみを最終目的とせず、評価者層を広げた検証が必要とされた。

7. 外国語で教科を学ぶ学生を対象とした教育学習支援システムのためのJavaScript上で動作するエッジAIと複数指示追従問題

質疑は主に「複数指示追従(数学問題+語注付与)を一度に処理させることの困難性」と「提案方式の利点」に集中した。まず、両課題を独立に処理し結果を統合すればよいのではないかとの質問があり、発表者は①APIを分離するとコスト・応答時間調整が増大する、②7000語規模の語彙リストを毎回LLMへ提示する運用は現実的でない、③単語照合はLLMが得意ではなく負荷が高いと説明した。そのため、数学問題のみLLMに集中させ、難単語への語注付与はクライアント側(JavaScript)で処理する構成が提案であると整理した。さらに、英語問題→解答→語注付与の順次処理やアプリ方式でも実現可能だが、利用者がインストール不要でWebアクセスのみで完結する利便性を優先したと述べた。追加質問として、実験結果の読み解きが問われ、単一プロンプトで両課題を同時に指示した場合は全体的に精度低下し、「問題集中」方式(提案)の優位性が示されたと説明された。また、日本語文へのルビ付与応用についても質問があり、既発表研究で同様の傾向(同時計算時の性能低下)が得られていると回答した。Overallとして、複数タスク同時要求はLLM性能を阻害し、役割分離設計が有効である点が確認された。

セッション3:LLM応用(1)(*発表はすべて現地発表)

8. GPT-4oを用いた糖尿病患者における必要インスリン量を求めるシステム開発

質疑は主に、GPTによる食事画像からの炭水化物(糖質)推定結果の解釈、安全性、評価観点に集中した。まず「画像推定値とGPT推定値の差が出た場合、どちらが望ましい判断か」が問われ、発表者は自身が1型糖尿病である経験も踏まえ、過少推定による低血糖リスクの方が危険であるため、高め(安全側)推定=過少投与回避が望ましいと説明した。次に、失敗例のラーメン画像にタバコ箱比較情報(サイズ基準)を与えても推定値が変動しなかった点について質問があり、GPTがタバコに全く注意を向けず、結局「料理そのもののサイズ・見た目」に基づく推定をしている可能性が指摘された。発表者は、現状ではGPT内部の注意領域を分析することは困難だが、サイズ情報を付与しても活用されなかった可能性が高いと回答した。また、新しいGPTモデル(例:GPT-4系)など別モデル比較や精度改善提案が示され、発表者は未検証モデルの今後の検討を述べた。さらに、糖質計算で本来考慮される「摂取時間帯や個人差」要素についても質問があり、現段階では計算方式(カーボカウント)上考慮していないが、可能なら改善を検討したいとまとめられた。

9. 知識グラフを用いた大規模言語モデル質問応答の精度改善

質疑は主に、提案手法がARCデータセットにおいて低精度だった理由、知識活用の困難性、評価指標、処理時間、既存手法との差異に集中した。まず、ARCでは問題に関連する知識が適切に抽出・活用されず正答率が伸びなかった点が指摘され、発表者は「知識が問に結びつかず、活かし切れなかったことが原因」と回答した。また、精度指標としては、説明可能性よりも明確な比較が可能なAccuracyを優先したと述べた。次に、知識を逐次追加しながら必要・不要判定を繰り返す手法の安定性が問われ、「シード依存によるばらつきが大きく、難問ほど必要不要判定が揺らぐ可能性が高い」と認めた。さらに、LMへの複数回投げ直しが必要なため、処理時間は膨大になるとの懸念が示され、発表者も改善余地を認めた。既存類似手法(KG-Rank、MMR等)との違いについては、MMRが「多様性確保を目的に類似度調整しながら情報選択」するのに対し、提案法は1項目ずつ知識を段階的に追加し、問題解答に寄与する知識を拡張する点が異なると説明された。最後に、追加知識のまとめ提示→再判定など反復縮減策の提案もあり、今後の改善余地が示された。

10. 外部知識を優先した出力生成のための類似度カーネル平滑化手法

質疑応答では、外部知識を活用した言語モデルの性能や制御方法が中心に議論された。まず、ラムダ値の調整により外部知識の影響度を制御でき、適切な値を選ぶことで出力精度が向上する一方、過剰にすると生成文の質が低下する可能性があると説明された。ラムダ値はタスクやデータセット依存であり、信頼性の高い外部知識に沿った回答を生成する場合に有効である。次に、JSDを用いた内部知識と外部知識の結合評価は、性能低下を避ける目的で用いられるもので、衝突発生度と直接的に比例するわけではないと指摘された。さらに、要約タスクでは外部知識の正確な反映が重要で、内部知識混入による誤要約のリスクがあることが議論された。また、知識が特定の回答にどの程度影響しているかの検証は未解決であり、推論を伴うQAタスクで外部知識を適切に活用できるかは今後の課題とされた。最後に、行政情報や医療情報など、信頼性の高い外部知識の活用例も提示され、今後の応用可能性が示された。

11. SLMを用いた同一ドメイン参照型チャットシステムのサーバレス実装

質疑応答では、AIの応答精度や実装環境に関する議論が行われた。まず、用意していない質問への対応では、AIが勝手に調べて答える可能性があるため、無関係な生成(ハルシネーション)を抑える工夫として、スコアやコンテンツ類似度に基づくフィルタリング処理を一部導入しているが、まだ試験段階であることが示された。次に、応答速度や処理時間はCPUやストレージ、メモリ量などハードウェア性能に依存する点が指摘され、最新のタブレットやGPU活用で改善可能であるとの見解が示された。また、Webブラウザ上でのGPU利用やフロントAPI対応の状況についても議論され、特定環境で性能向上が期待されることが確認された。さらに、連続的なコンテクスト処理や知識の選択的活用についても課題として挙げられ、UIや制度設計による制御の重要性が強調された。全体として、ハルシネーション抑制、処理速度改善、コンテクスト管理が今後の研究・実装での重要課題とされた。

セッション4:SNS・クラウドソーシング(*発表はすべて現地発表)

12. 商品ジャンルを利用した意外性のあるプレゼント推薦システム
発表キャンセル

13. ソーシャルネットワークにおける人口の偏りを考慮した地理的選好の測定

質疑応答では、ソーシャルメディアにおけるユーザー間の地理的近接性とネットワーク構造の分析結果について議論された。補正後の指標は、人口密度などのバイアスを除外した上で、都市部のユーザーほど近隣の人とつながりやすい傾向を示しており、これは都市に人口が集中しているだけの結果ではないと説明された。ただし、この現象が具体的に何から生じているか、直接的原因(面識や共通の職業・活動)と間接的原因(引用ツイートやネットワーク構造)を分離することはまだ不十分である。また、分析対象は相互フォローに限定されており、一方的フォローや他のネットワーク要素も含めると異なる結果が出る可能性があることが示された。さらに、国や言語設定によるネットワークの差異も考慮する必要がある。全体として、補正によってバイアスを取り除いた指標から得られる現象を正しく解釈し、都市部・地方・国別の特性を理解することが今後の課題として強調された。

14. 問題解説文の空所補充問題化における空所の数と位置が読解に及ぼす影響

質疑応答では、学習者が解説を読まない理由と教育効果について議論された。実験結果からは、問題を解けない学習者ほど解説を読まない傾向があり、理解していないまま解説を読まないことが問題であると指摘された。目的は単に解説を記憶させることではなく、問題を解けるようになることであり、そのために解説を読む重要性を高める工夫が必要とされた。また、穴あき問題(空床)の設計についても議論があり、どの箇所を空床にするかは、試験で問われる重要箇所かどうかと、LLMによる自動分割や補完を踏まえて決められている。穴あき文が連続すると学習効果に影響する可能性があるが、注意喚起の観点からは過度に考えなくても一定の効果は得られるとの説明があった。全体として、解説の読解と問題演習を通じて学習効果を最大化するための設計と工夫が中心に議論された。

15. 推薦システムの性能に対する知覚とその信頼に関連する心理尺度との相関分析

質疑では、実験対象となったYouTubeとTikTokにおけるユーザーの推薦機能利用と継続利用意図について議論された。被験者には、ショート動画やランキング表示を示し、それぞれの満足度や推薦機能の理解度、継続利用意図についてアンケートを実施した。結果として、満足度が高いほど継続利用意図も高まる傾向が確認されたが、YouTubeとTikTokで制御感の評価や推薦システムの影響に差異が見られ、予想とは異なる結果もあった。YouTubeでは画面上の表示数が少なく制御感が低くなる傾向、TikTokでは制御感が増加する傾向が指摘された。また、推薦システムの特性やアルゴリズムの違いがユーザーの制御感に影響する可能性があり、今後はこれらの指標を組み合わせて分析を進めることが課題とされた。全体として、ユーザー体験と継続利用意図を結びつけるモデルの検証と、システム特性の理解が中心の議論となった。

セッション5:LLM応用(2)(*発表はすべて現地発表)

16. LLMを用いた介護スタッフの性格特性を考慮した作業負荷予測に関する研究

質疑では、タスク設計と作業量・価値の関係、人間の作業予測に関する議論が行われた。質問者は、作業時間の長短がタスクの価値や実施感にどのように影響するかを問うた。発表者は、今回のタスクでは本体作業時間を基準とし、時間の変動に応じて価値の感覚が変わる可能性を指摘した。また、対象施設やメンバー構成によって結果が異なる可能性があることも示した。さらに、LM(言語モデル)を用いてパークナリティを考慮した作業予測を行うことで、人間の作業を模擬する試みが紹介された。今後は、実際の作業者にアンケートや観察を行い、性格特性や作業構成の差異を反映させることで、より現実に近い予測を目指す意向が示された。最後に、生成モデルを用いた擬似人格の設定や多軸的属性の活用が研究の方向性として示され、今後の研究の発展に期待が寄せられた。

17. SHAP 値を特徴量に組み込んだ学習手法による機械学習モデルの性能向上

質疑では、社会福祉関連の特徴量をモデルに組み込む際の影響やデータの取り扱いについて議論された。質問者は、元の特徴量と社会福祉の特徴量を横に並べることで関係性が失われる可能性を指摘したが、発表者は横並びは特徴量数の増加による情報量の拡張と捉え、予測精度向上に寄与すると説明した。また、S1やS3など特徴量の組み合わせや縦ベクトル化の扱いについても議論され、元データの値と追加特徴量は必ずしも比例せず、別々の特徴量として扱う方針が示された。さらに、データの偏りやベースラインの性能、複雑モデルの影響、SHAP値を用いた特徴量重要度の理論的意義についても確認され、SHAP値によって元データ以上の情報を持つ重要度指標を得られることが明らかになった。全体として、特徴量の拡張や組み合わせが精度向上に寄与する一方、経済的影響や実装上の課題も考慮すべき点として指摘された。

18. LLMの社会的バイアス低減に向けたモデルマージ手法の有効性検証

質疑では、バイアス低減の手法やデータセットの扱いについて議論された。発表者は、特定の職種や属性に偏らないように文章生成を調整することでバイアスを低減していると説明したが、バイアスの定義は文脈や対象国によって異なるため、今回は既存研究で「バイアス」とされる英語データに基づき実施したことを強調した。日本語への適用については、コーパスが少ないため未検証であり、今後英語と日本語の比較分析を行いたいと述べた。また、データセットのオーバーラップや使用方法についても確認され、今回の研究では異なるデータセットを用いており、プロンプトベースやQAベースの手法を組み合わせて分析したことが説明された。全体として、バイアス低減は対象データや文脈依存である一方、手法の有効性と適用範囲を慎重に評価する必要がある点が指摘された。

セッション6:情報抽出・レシピ(*発表はすべて現地発表)

19. メルカリ出品者支援のための類似商品の平均売却価格系列を利用した商品の価格と売却期間の推定

質疑では、テキスト処理やモデル性能に関する議論が行われた。参加者からは、クリックデータやパートメーションを用いたテキスト入力が結果に影響する可能性や、それを検証することの重要性が指摘された。また、入力モデルとしてFastTextを使用しているが、データ量を増やしたり別のモデルを試すことで性能向上が見込めるのかという質問があり、別モデルも試したが大きな改善は確認できなかったと報告された。全体として、データの扱いやモデル選択が予測精度に影響する可能性があることが議論され、さらなる検証や最適化の必要性が示された。時間の関係で議論は終了した。

20. 表構造解析手法のトークン抽出処理の改良とFinTabNetを用いた評価

質疑では、表構造の情報抽出に関する提案手法の精度や既存手法との比較が議論された。研究目的は、表の構造を保ったままテキストを正確に抽出することにあり、STEPPSやTEPPSなど既存手法との比較では、構造解析精度はほぼ同等でもテキスト抽出精度で約6ポイントの差があったことが示された。提案手法は表画像ではなくテキストを直接用いることで、PDF文書からも精度高く解析可能であると説明された。また、100%精度は現実的でないものの、フィンター・ネットでは99%近い精度が達成される場合もあると報告された。構造解析がうまくいかない例はアノテーション誤りやセルの複雑な構造によるもので、PDFアウトやテセラクトのトークン統合処理では位置ずれや座標扱いの違いにより、トークン抽出制度と構造解析精度に矛盾が生じる場合があることが指摘された。今後は位置統一や統合処理の改善により精度向上が期待される。

21. 季節性を考慮した代替食材推薦システムの開発

質疑では、レシピ推薦システムにおける季節情報の扱いが議論された。ユーザーが「夏にすき焼きを作りたい」と入力した場合、システムは季節に合った食材を提案する仕組みであり、メニュー自体に季節ラベルがなくても機能することが確認された。レシピに季節を付与するのは、システムの学習や判定精度向上のためであるが、全ての料理に明確な季節性があるわけではなく、実際の調理では食材の可用性や味の整合性に影響する可能性も指摘された。また、季節を制御変数として用いることで、食材の入手困難や価格変動に対応した擬似的な代替提案も可能であると説明された。一方で、具体的な学習データや精度への寄与については詳細説明が未完で、今後の検討課題とされた。研究の目的は、ユーザーの入力条件に応じた適切なレシピ推薦を実現することであり、季節情報はその補助的手段として位置付けられる。

22. BERTを用いた料理のアレンジの多クラス分類手法

質疑応答では、レシピのアレンジ表現と推薦システムの仕組みが議論された。研究の目的は、基本レシピ(アレンジ元)とそのバリエーション(アレンジ表現)を特定し、ユーザーの好みや条件に応じた提案を行うことにある。アレンジ表現には「ヘルシー」「簡単」など複数重複できるラベルもあり、単純な排他的ラベルだけでなく多面的な分類を検討している。現状のモデルはタイトル・概要・材料を入力として使用しており、精度は改善の余地があるものの、学習データの増加や具材情報の扱いを工夫することで向上可能とされた。また、アレンジ元の特定や和風化など、ユーザーの意図に応じた変化の評価方法についても議論され、元の料理の文化的背景を考慮した提案が今後の課題として挙げられた。評価は基本的に研究者が定めた正解に基づいて行われるが、相対的なアレンジの正当性についても今後検討する必要がある。

セッション7:情報推薦(3)(*発表はすべて現地発表)

23. 正確性と多様性を両立する傾向スコア導入線形オートエンコーダ

質疑応答では、欠損値が多い推薦システムにおける行列分解手法の有効性や潜在因子の次元について議論された。潜在因子を低次元で用いると情報の損失が生じ、特定アイテムの多様性が表現しきれないため、高次元の利用や入力スコアの補正が重要とされた。また、ハイパーパラメータの調整やグリッドサーチによる探索方法についても触れられ、カバレッジや精度のバランスを考慮する必要性が指摘された。さらに、時間経過に伴うユーザー行動分布の変化を考慮せずにパラメータ探索を行う問題や、現行モデルの限界、LLMによる推薦リスト生成の今後の可能性も議論された。最終的に、ユーザーの好みや評価情報の収集を通じて推薦精度の向上を図る必要があることが示された。

24. 推薦エンジンの切り替え機能の有無を組み込んだ信頼モデルに関する基礎分析

質疑では、ユーザーが機能の切り替えによって自分で制御している感覚と、実際の結果の透明性や効果との関係が議論された。追加機能により制御感は得られるものの、期待通りに結果が変わらない場合、透明性の評価は低くなる可能性があると指摘された。また、評価データの収集方法として1回目と2回目の利用で結果の差異が生じる理由や、初回使用時はユーザーが機能を十分理解していないため差が出にくいことも説明された。さらに、評価の精度向上には複数回の利用や繰り返し実験が有効であり、順序や回数による影響を考慮する必要があることが示された。最終的に、機能制御の感覚と実際の透明性や適合度の関係を正しく評価するためには、繰り返しの実験設計が重要であるとの結論に至った。

25. 観点を利用したショッピングサイトのレビュー推薦システムの提案

質疑では、観光ルート推薦システムにおけるユーザー体験やルート生成の課題が議論された。まず、推薦ルートでは昼食や休憩が考慮されておらず、現実的な行動を反映できていない点が指摘された。対策として、必ず休憩や飲食を挟む制約条件をルート生成に組み込むことで改善可能とされた。また、ユーザーの興味関心に基づく絞り込みを行うと、狭い選択肢に偏り、重要なスポットがルートに含まれない可能性があるため、主要な観光地をあらかじめリストに入れて補完する手法が提案された。さらに、多目的最適化にはNSGA2を使用しており、長さ可変の観光スポットリストに対応できることが理由として挙げられた。ユーザーの個別の思考スコア(L)と一般的な人気スコア(P)がほぼ連動している点も指摘され、ユーザー独自の嗜好をより正確に反映させる工夫の必要性が示された。総じて、現実的な行動や主要スポットを組み込みつつ、多目的最適化でルート生成の精度を高めることが重要であるとの結論となった。

運営委員会

実行統括担当/プログラム担当:大塚 真吾(神奈川工科大学)
Web担当:柴田 祐樹(東京都立大学)