見出し画像

TOPPANデジタルがPWS Cup 2024において、総合第2位を受賞しました。

 TOPPANデジタル株式会社の参加チームが、第10回プライバシーワークショップで行われた「匿名化技術コンテスト」PWS Cup 2024にて『総合 第2位』を受賞しました。本記事では、PWS Cupの概要や参加理由、実施内容を報告していきます。


PWS Cupとは

 PWS Cupは『今年で10年目を迎える、情報処理学会 コンピュータセキュリティ研究会 PWS組織委員会が主催する国内唯一の匿名化技術コンテスト』です。群馬大学の千田先生をはじめとする有識者の方々によって開催されており、昨年から国際コンテストも主催しています。

PWS Cup の意義

 昨今、国内外でビッグデータの利活用に対する関心が高まっており、利活用に際してプライバシー保護を担保するための技術や基準の整備が強く求められています。

 一方、匿名化されたデータが外部のデータと突き合わされ、個人を特定されたりプライバシーが侵害されたりした事例があります。このような問題が発生すると、データの利活用に対する信頼性が低下し、データ提供者や利用者の協力を得ることが難しくなります。また、プライバシー侵害による法的リスクや社会的批判が生じる可能性があり、企業や組織にとっては大きな損失を引き起こしかねません。こうしたリスクを未然に防ぐために、プライバシー保護技術の重要性が再認識されています。
 PWS Cupではこうした問題に配慮しつつ、データの有用性と匿名性の両立が可能かどうか探る取り組みとして、対戦型コンテストを開催しています。これにより、匿名性を確保しつつデータを活用するための技術的な解決策が導き出されることが期待されます。

TOPPANデジタルがPWS Cupに挑戦した理由 

 TOPPANデジタルでは、以前よりプライバシー保護に注目し、匿名加工や秘密計算などのプライバシー強化技術(PETs)の獲得や、プライバシー保護基盤の構築による技術の提供・検証に取り組んできました。しかし、TOPPANデジタルでのプライバシー保護基盤の利用は内製化されたままであり、専門家による的確なニーズ評価やPETsのレビューが行われていませんでした。そこで、我々はPWS Cupに目を付け、これらの課題解決に役立つと考え、参加を決めました。
 また、昨年度、PWS Cup 2023を聴講しました。そこでは、学生や他企業など多くの参加者と直接話す機会があり、参加者の方々の熱意、創意工夫、技術力に触れ、自分自身の挑戦や技術力向上につなげたいと思ったことも、PWS Cupへの参加を決めた理由のひとつです。

PWS Cup 2024のルールと流れ

#1 概要

 PWS Cupでは、すべての参加者は加工者と攻撃者双方の立場となって、データ加工技術と加工されたデータへの攻撃技術を競います。
 PWS Cupは「加工フェーズ」と「攻撃フェーズ」の2つのフェーズで構成され、参加チームは有用性と匿名性の両方を最大限高める匿名化手法の実現を目指します。

  • 加工フェーズ:出題者から配布された(架空の)個人データを匿名化データに変換(匿名化データの有用性を採点)

  • 攻撃フェーズ:出題者から受領した攻撃用ファイルと他チームの匿名化データを用いてデータを復元(匿名化データの匿名性を採点)

#2 配布データ

 出題者から以下のような10,000人のデータが配布されます。なお、基本属性は全て離散値です。

  • 性別(2種):Male, Female

  • 年齢(7種):1(Under 18), 18(18~24), 25(25~34), … , 56(Over 56)

  • 職種(21種):0(その他), 1(学者・教育者), … , 20(作家)

  • 住所(495種):米国住所(上位3桁)

  • 映画の評価x46(6種):0(未視聴), 1, 2, 3, 4, 5

#3 採点方法

 「加工フェーズ」では、配布データを加工して匿名化データを作成します。加工前後のデータについて、基本属性x映画の評価、映画の評価x映画の評価のクロス集計表を作成し、全パターンの「匿名化データにおける変更割合」を算出します。100から変更割合の最大値を引いた値が、匿名化データの「有用性」です。

 「攻撃フェーズ」では、出題者から受領した攻撃用ファイルと他チームの匿名化データを用いてデータの復元を試みます。100から他チームの攻撃成功数を引いた値が、匿名化データの「匿名性」です。

#4 表彰

  • 総合:有用性と匿名性の和が高いチーム(1~5位)

  • ベストアタック賞:総合1位~総合5位に対する攻撃成功数の和が最も高いチーム

  • ベストプレゼン賞:加工手法・攻撃手法の説明など、当日のプレゼンが最も優れていたチーム

  • ベストデータサイエンティスト賞:作成した匿名化データを使用し、有用な分析手法を提案したチーム

#5 スケジュール

 PWS Cup期間中に、「加工フェーズ」「攻撃フェーズ」「結果(匿名化データの評価)」の一連の流れを2回実施します。1回目を予備戦、2回目を本戦と呼び、予備選と本戦での評価を総合して、PWS Cupの勝者を決定します。

 本戦の「攻撃フェーズ」終了後にPWS Cupの最終結果と各チームの手法の発表を行います。

#6 参加のハードル

 なし(出題者からサンプルコードが提供されるため、特段知見がなくとも参加できます。)

最終結果報告会の様子と結果の報告

最終結果報告会の様子

 最終結果報告会の様子です。自チームの加工手法や攻撃手法、データ分析結果を7分で報告しました。聴講者である学生や大学教授、企業の専門家らが、100人程度来場しており、発表に耳を傾けながら各手法のユニークさや精度等の要点をメモしていました。およそ3年ぶりの対面発表ということもあり、冷や汗が止まりませんでしたが、発表は上手くいったのでしょうか、、、?

結果

  • 参加チーム数:21

    • 企業単独チーム、大学単独チームに加え、企業・大学合同チーム含む、約10社・約10大学が参加

  • 受賞:「総合 第2位」

    • 景品として兵庫県の伝統的工芸品「淡路鬼瓦」をいただきました!ありがとうございます。

学びと反省点

 今回、TOPPANデジタルとして初参加にも関わらず、匿名性を活かした取り組みを通じて「総合 第2位」を受賞することができました。この成績は、我々の技術力とアイデアが業界内でも評価された証と言えます。一方、ベストアタック賞やベストプレゼン賞など、その他の賞では振るわず、目に見える結果を得ることはできませんでした。これらの結果を受け、各表彰ごとに学びと反省点を整理します。

#1 総合順位に関して

 総合順位は2位と好成績を残したものの、総合優勝のチームとの差は0.2点であり、悔しい結果に終わっています。この差は、上位チームと我々の加工方針の違いによって生じたものであると考えています。

  • 加工方針(Good👍)

    • 有用性と匿名性はトレードオフの関係にあると判断

    • 個人情報の流出を防ぐため、有用性を犠牲にして匿名性を維持

    • 匿名化データの変更割合の最大値を28%と設定

  • 加工方針(Bad👎)

    • 匿名化データの変更割合の最小値が2%であり、変更割合の分布に開きが発生

    • 最大値の28%の選定理由が不明瞭

    • それにより、有用性と匿名性を最大化する理論が未構築

 我々のチームの加工方針は、配布データの処理難易度や量など、過去の経験則から導きました。チームの視座や実作業に着手するまでの迅速さが利点ですが、理論の確立を見落とすという欠点を抱えています。
 改善のためには、他チームのように理論を確立し、設定する値に明確な意味を持たせつつ、攻撃耐性を高める工夫が重要です。次回のCupでは、理論に磨きをかけ、納得のいく結果を目指します。

#2 ベストアタック賞に関して

 ベストアタック賞は、総合1〜5位に対する攻撃正解数の合計で決まります。我々のチームの攻撃点数は、ベストアタック賞と47点差の111点で7位でした。
 総合の得点を1チームあたりの点数に換算すると、その差は約10点です。この数値は微々たるものではなく非常に大きな数値であるため、単に技術・実装力だけではなく、攻撃のアイデア・発想力に差があると判断できます。
 攻撃手法は優勝チームと同じ(確率分布を利用した攻撃)であったにもかかわらず、残念な結果に終わりました。個人のスキルアップやAI部門などの専門家との連携強化により、チームの力をより引き出す必要があります。

#3 ベストプレゼン賞・ベストデータサイエンティスト賞に関して

 プレゼン資料に説得力がなく、「なぜ」の説明が不足していました。PWS Cup参加者(審査員)は、数値やアルゴリズムの選定に具体的な理由を求めており、プレゼン力以前の準備段階での基礎固めの重要性を再認識しました。
 匿名化データを使用したデータ分析結果を提示し、その良し悪しを判断するベストデータサイエンティスト賞では、他のデータとの突き合わせが重要視されました。説得力のある提案を目指すためにも、より実践的なデータ分析や他データとの関連性を考慮していきます。

今後の展望と学び

 TOPPANデジタルでは、これまで培ってきたプライバシー保護技術(PETs)の知見をさらに深めるとともに、PWS Cupで得た学びを活かし、実用性と安全性の両立を目指した技術開発に注力していきます。特に、PETsはその安全性の高さだけでなく、実際の運用における有用性が同様に重要であると認識しています。したがって、技術の精度向上だけでなく、幅広い分野で実際に活用されるための利便性や適応性を備えた基盤の構築に取り組んでいきます。

 また、プレゼン後に、様々な学生や企業の方々と交流しました。そこでの議論は非常に有益であり、上記のような「なぜ」が飛び交うため、内製化されたプライバシー保護基盤の至らぬ点が浮き彫りとなりました。新たな視点やアイデアを吸収し、自社内に閉じた技術開発ではなく、外部との協力やオープンな場での検証を進めることで、技術の幅を広げていきます。
 今後もPWS Cupのような場に積極的に参加し、学びの機会を継続的に確保します。また、総合第2位という結果はこの分野でリーダーシップを発揮できるという可能性を示しました。今後の事業展開や社会的信頼の向上に繋がる重要な成果と考え、技術力と実用性を兼ね備えたプライバシー保護基盤の提供を目指してまいります。

 次回は、AI部門とのシナジーを活かしたプログラムを構築し、総合優勝を目指します。

おわりに

 今回のPWS Cupで使用したポスター・発表資料を添付します。興味がありましたら是非ご確認ください!


PWS Cup 審査委員長の統括コメント

千田 浩司 先生
群馬大学 情報学部 准教授

 改正個人情報保護法の匿名加工情報制度が導入された2015年にPWS Cupが始まって以来、今年の第10回PWS Cupに至るまで、対戦型コンテストにより参加者全員が様々な角度から匿名化技術の向上に努めてきました。参加者は匿名化事業に従事する方、匿名化技術に係る研究者および学生等様々で、論文発表による学術貢献、匿名化事業へのフィードバックによる産業貢献、データプライバシーに係る人材育成等にPWS Cupは寄与しています。
 一方、この10年間でAIが飛躍的に進化し、匿名化や攻撃の技術も競うように進化しています。PWS Cupもシーズやニーズに合わせて毎回ルール設計を見直しています。社会課題の解決やサービスの向上等に資するパーソナルデータの利活用が益々期待される中、データプライバシーの継続的な研究開発や人材育成は特に重要です。
 第10回PWS Cupは過去最高の参加チーム数で、大変盛り上がりました。今後も趣向を凝らし、楽しみながら学び、社会に資する場を提供していきたいと思います。


■PWS Cup 2024参加メンバー


東 貴範
TOPPANデジタル株式会社
技術戦略センター
Trusted Web技術戦略部
林 智貴
TOPPANデジタル株式会社
技術戦略センター
Trusted Web技術戦略部
渡邉 龍太郎
TOPPANデジタル株式会社
技術戦略センター
Trusted Web技術戦略部