組織の垣根を超えた機密データの利活用を可能とする秘密計算
概要
秘密計算とは、データを暗号化したまま集計や分析などの計算処理を行う技術の総称です。従来、データの集計や分析を行う場合、データの保管や通信を行う過程は暗号化し保護していましたが、処理する過程においては一度暗号を解いて元の状態に戻さなければならず、処理中のセキュリティが脆弱になる恐れがありました。また、処理を第三者に委託する場合は、データの中身を開示する必要があり、情報漏洩やプライバシー侵害などの課題がありました。データ利活用への期待の高まりと同時に、データセキュリティやプライバシーに関する懸念も高まっている近年において、秘密計算はそのジレンマを解消する技術として注目されています。
秘密計算の実現方式には準同型暗号やMPC(Multi-Party Computation)、TEE(Trusted Execution Environment)などがありますが、ここでは特に準同型暗号とMPCを取り上げます。
準同型暗号
準同型暗号は、RSA暗号や格子暗号などの数学的構造を応用することでデータを暗号化したまま足し算や掛け算の処理を可能とする秘密計算です。足し算か掛け算のどちらか特定の処理しかできない方法やその両方(つまり任意の演算)ができる汎用的な方法など、表1. に示した通り、準同型暗号にはいくつか種類があります。
準同型暗号は1978年には構想が提案されており、いくつかの実現化手法が出てきたものの、30年間、足し算か掛け算か特定処理しかできないとされていました。しかし、2009年にブートストラップと呼ばれるノイズを除去する手法を用いて任意の演算を可能とする完全準同型暗号が提案されたことで、再度注目を集めるようになりました。
現在は、そのブートストラップ処理を効率的に行うための研究や準同型暗号の機械学習などへの応用、準同型暗号専用のハードウェア・ソフトウェア開発が活発に行われており、活用の幅が拡大しています。
準同型暗号のセキュリティ性を担保するためには使用した暗号鍵を安全に管理する必要があるなど、実用上の課題がいくつか残されていますが、国内外にスタートアップが誕生しており、今後の市場の拡大が見込まれています。
MPC(Multi-Party Computation)
MPCは秘密分散をベースにした秘密計算の一種です。秘密分散とは、データをそれ自体では意味を成さない複数の断片に分割する方法で、一部の断片だけを第三者に知られたとしても、元データの中身を知られることはありません。復元する際は、全ての断片を集める必要はなく、指定した個数以上の断片を集めることで元データを復元できます。秘密分散は以上の性質から、いかなる計算能力をもっても指定した個数以下の断片から元データの情報が漏れることはないという情報理論的安全性を保証します。
MPCは秘密分散することで無意味化したデータを複数サーバが分散保管し、サーバ間で通信しながら秘匿化された断片データの演算と交換を行うことで、秘匿化したままのデータ処理を実現します。また、MPCは足し算および掛け算の任意の演算が可能なことも特徴です。
MPCは複数サーバで通信を行いながら計算するため、通信回数や通信量が増えてしまいます。そのため、1台のサーバで計算するよりも計算速度が遅くなってしまうことや、通信経路を確立するためのアーキテクチャの設計などが課題として挙げられています。しかし、これらの課題は近年の研究開発の進展により、アルゴリズムの改良や適用条件の工夫で軽減できることが明らかになってきており、今後の市場拡大が見込まれます。
未来像
データが企業の競争力の源泉としての価値を増している一方で、データ利活用には情報漏洩やプライバシー侵害などのリスクもあります。万が一、データが漏洩した場合、企業は社会的信用を失う可能性があるとともに、プライバシー保護規制・越境規制などルールの厳格化もあり、罰金の支払いなどが発生する可能性もあります。また、サイバー攻撃の高度化、大規模自然災害の増加傾向、地政学的リスクの高まりなどもあり、データの漏洩や紛失のリスクも高まっています。
そのため、データ利活用は企業にとって重要であると同時にリスクもあると言え、慎重に検討しなければなりません。ましてや第三者への分析委託も含めた異なる組織間でのデータ共有は自社のコントロールが届きにくくなります。更に、自社が提供したデータは匿名加工してあっても、他社データと突合することで個人情報になる可能性もあり、ハードルが高いのが現状です。
しかし、秘密計算により複数組織間でのデータ利活用が可能になれば、企業にとっては多様かつ的確なサービス提供ができることが考えられます。生活者としても、安心して自らの情報を預けることができ、カスタマイズされた様々なサービスの便益を受けやすくなります。例として、ここではヘルスケア分野における秘密計算を用いた将来像を紹介します。
これまでは同じ病気と診断された患者さんには一律で同様の治療を行っており、ある患者さんには効果があっても、別の患者さんには効果が無いこともありました。しかし、秘密計算を用いることで、患者さん一人ひとりの病歴や処方歴、遺伝情報、日々のバイタルデータなどをプライバシーを保護したまま組織間で統合・分析できれば、各患者さんに合わせたより効果的な個別化治療を行うことができるようになります。これにより、患者さんは安全性・有効性の高い医療を受けることができます。更には、予防や早期発見にもつながることから医療費の削減にも繋がります。ヘルスケアサービスの提供者も科学的根拠に基づく治療法の決定が可能になり、サービス品質の向上や、医療業務の効率化、創薬精度の高度化が見込まれます。
ヘルスケア分野以外にもマーケティングやモビリティ、金融など様々な分野で、秘密計算を用いた異なる組織間でのデータ利活用による製品・サービスの付加価値向上、新たなイノベーションの創出や新市場の創造が期待されています。プライバシー侵害などへの懸念を解消し、各種リスクを低減しつつ、データから最大限の価値を引き出し、生活者の安全と信頼を確保できる秘密計算技術は今後の拡大が益々見込まれます。
活用事例
秘密計算を用いることで異なる組織間でのデータ利活用を円滑にし、価値創出を促進しているいくつかの例を、マーケティング・ヘルスケア・モビリティ・金融の4分野で紹介します。
マーケティング
複数のマーケティング企業が保有するユーザーの購買データなどを統合・分析することで消費傾向や嗜好を正確に把握することができ、より効果的なターゲティング広告ができるようになります。しかし、マーケティングデータをそのまま他社へ共有することはプライバシー侵害のリスクがあるため、ターゲティングやトラッキングを規制する動きもあり、慎重な検討が必要です。秘密計算を用いることで、企業間でマーケティングデータを暗号化したまま統合・分析が可能となり、ユーザーのプライバシーを侵害することなく最適な広告配信を行う取り組みがなされています。
ヘルスケア
医療や保険のデジタル化・パーソナライズ化の流れがある中で、更に細かく個人の単位で最適化するために機密性の高いヘルスケア関連データを用いる場合には、特に高度なプライバシー保護が求められます。しかし、秘密計算を用いて複数の医療機関やヘルスケア企業からの臨床データや処方履歴、ゲノムデータ等を収集・分析することで、疾患の診断時間短縮、適切な薬剤の選定、保険商品の開発などが可能になります。秘密計算によりヘルスケア関連データの利活用を促進し、誰もが質の高いヘルスケアサービスを享受できる社会の実現を目指す取り組みがなされています。
モビリティ
モビリティ業界はCASE(Connectivity、Autonomous、Sharing、Electricity)という構造変化の中にあり、車両データやパーソナルデータを利用してサービスの高度化が進められています。しかし、同時にプライバシー保護規制、越境規制への準拠、データのユーザー主権の保護などが求められており、モビリティ業界は対応が必要になります。そこで、秘密計算を用いて暗号化したまま様々なモビリティデータを横断的に分析可能とすることで、次世代モビリティ産業へのシフトを推し進める取り組みがなされています。
金融
金融機関が保有するデータは裏付けがあり、個人が積極的に提供する仕組みであるため、正確である代わりに機密性が非常に高いと言えます。そこで、秘密計算により複数の金融機関が持つ顧客データを互いに開示することなく、深層学習モデルを構築する際の教師データとして用いることで、不正送金の自動検知モデルの精度向上を目標とする取り組みや、リスクの高い顧客情報を収集できるシステムの開発などが行われています。金融分野では、秘密計算だけでなく連合学習という機械学習に特化したプライバシー保護技術の活用も進められています。
秘密計算の活用に向けては、法律、ITシステム、人材の観点から検討・対応が依然として必要な状況です。「暗号化された個人情報が個人情報であるか」など、その扱いに関しては、議論が続いており今後の方向性を見定める必要があります。
トッパンの取り組み
トッパンは情報コミュニケーション産業の一端を担う企業として、個人の権利を全うし、お客様の信頼に答えるため、個人情報保護は経営上の重要課題であると位置づけ、徹底した対応をとっています。しかし、秘密計算技術は黎明期であることから、現時点ではデータ利活用する場面において、秘密計算を用いて付加価値をつける取り組みはまだまだ数が少ないのが現状です。
トッパンでは、マーケティングやヘルスケア、モビリティ、金融を含めた様々な分野で事業を行っており、パーソナルデータも扱っています。例えば、顧客データをAIで分析し、優良顧客を自動抽出するデジタルマーケティングサービスや、生活習慣病リスクの低減を目的に、バイタルデータや受診データを分析し個々人に合わせた行動変容を促すヘルスケアサービス、自動運転車両内でXR技術を用いて遠隔地とリアルタイム対話を可能とする次世代モビリティ向けの移動体験サービス、金融機関向けにマネーロンダリングや対テロ資金供与対策として顧客情報を分析し、継続的に顧客管理を行うサービスなどがあります。
このような既存サービスへの秘密計算適用を検討するだけでなく、将来的には企業/組織の垣根を超えてデータを共有し、新たな価値創造や社会課題解決ができるよう、どのようなユースケースに適用できるのか実証実験を繰り返し、技術・法律の理解を進めながら人材育成を進めていきます。そうすることで、データを戦略的な資源と捉え、リスクに基づいた必要な保護対策を効果的に推進することができると考えています。
トッパン有識者コメント
世界的なプライバシー保護意識の高まりと規制強化が進み、データ利活用とプライバシー問題の両立はビジネスにおいて必要不可欠となっています。秘密計算はその両立を支える重要な技術であると認識しており、より深い顧客理解、より良い顧客体験の提供のためには、今から秘密計算を扱える体制を整え、既存サービスへの適用や新ビジネスへの活用を進めていく必要があると考え技術検証に取り組んでいます。
コンテンツの大容量化、IoTデバイスの普及、5Gの普及、新型コロナウイルス感染症を契機とするデジタル化の進展などを背景に今後はさらにデータ流通量は爆発的に増えていくことが予想され、それと同時にプライバシーリスクも拡大していくことが考えられます。そのため、特に組織間でのデータ共有はデータの主権をもつ消費者にとって納得感の得られる構造にする必要があり、秘密計算はそれを可能にする技術の1つであると認識しています。
当社が提供するメタバース関連サービスでも、パーソナルデータを扱っていますが、他企業とのデータ共有は慎重に検討する必要があります。しかし、秘密計算を用いることで共通課題の解決や業界全体のサービス品質向上を実現でき、消費者へより付加価値の高いサービスを提供できるようになると考えています。
秘密計算を利用しやすい環境や枠組みを整備し、データ利活用とプライバシー問題を両立することで、消費者がデジタルサービスの便益を安心して享受できる社会を作っていきたいと考えています。
■編集者