社会的インパクトのためのオープンデータフレームワーク

はじめに オープンデータの活用とデータ連携

バートン・デイヴィスからのメッセージ

マイクロソフトでは、今日世界が直面している重要な社会問題に対処するためには、データが不可欠であると考えています。世界的な大流行により、COVID-19によって生じた課題を理解し、評価し、解決するための行動を起こす上で、データが重要な役割を果たすことがわかりました。しかし、規模の大小を問わず、ほぼすべての組織が、データを自分たちの業務に関連させることにいまだに苦労しています。データが提供する価値にもかかわらず、多くの組織は成果を向上させるためにその力を活用できていないのです。

この苦闘の一部は、「データデバイド」、つまりイノベーションや問題解決に役立つデータに効果的にアクセスできる国や組織とそうでない国の間に存在する格差に起因しています。この格差を解消するため、マイクロソフトは2020年に「オープンデータキャンペーン」を立ち上げ、より多くのオープンデータとイノベーションを推進するデータ連携の約束を実現するための支援を行っています。

このキャンペーンや、パートナーであるオープンデータ研究所や ガブラボと行ってきた活動から学んだ重要な教訓の一つは、成果を向上させるためのデータへのアクセスと活用の能力は、技術的なツールやデータそのものよりもずっと多くのものを含んでいるということです。また、効果的なデータ連携や意思決定を促進する経験や実践を活用し、共有できることも重要です。これは、特に発展途上国が直面する重要な社会問題に取り組むために、データをオープンにして再利用しようとする政府、多国籍組織、非営利団体、研究機関などと協力する場合に特に当てはまります。

別の言い方をすれば、データやテクノロジーにアクセスできるだけでは、魔法のように価値を創造し、成果を向上させることはできません。オープンデータとデータコラボレーションを最大限に活用するためには、組織のリーダーシップがどのようにデータをミッションに役立てるかを考え、データを使って答えたい質問を定義し、データを使うためにチームが必要とするスキルを特定し、データからより多くの洞察と利益を引き出すために協力者とコミュニティ間の信頼を開発・確立する最善の方法を決定することが必要です。

Open Data for Social Impact Frameworkは、リーダーが最も重要な課題を解決するためにデータを活用するために使用できるツールです。すべてのデータが一般に公開できるわけではないことを認識した上で、より多くのオープンデータを推進することで、信頼できるデータ連携や真のオープンデータ公開など、多大な利益がもたらされると考えています。私たちは、「社会的インパクト」という言葉を、二酸化炭素排出量の削減、ブロードバンド格差の解消、雇用のためのスキル向上、アクセシビリティとインクルージョンの推進など、社会的問題への取り組みに向けた前向きな変化を意味するものとして使用しています。

私たちは、データを公開し、共有し、協力することで、新しい洞察を引き出し、より良い意思決定を行い、世界で最も差し迫った課題に取り組む際の効率を向上させることができる、無限の機会を信じています。

バートン・デイビス
マイクロソフト社副社長兼副法律顧問、知的財産権グループ

 

このサイトは法的なガイダンスを提供することを意図しておらず、そのようなものとして依拠するべきではありません。このフレームワークは、組織がオープンデータを推進し、ソーシャルグッドのためのデータコラボレーションに従事するためのリソースを提供します。データの共有はリスクがないわけではありません。独立した法的助言を得ることをお勧めします。このサイトには、サードパーティのリソースへのリンクが含まれています。マイクロソフトは、リンクの使用またはサードパーティが提供する資料への依存によって生じるいかなる損失、傷害または損害に対しても責任を負いかねます。

クイックスタートオープンデータへの道しるべ 始めるための簡単なロードマップ

ロードマップを見る

オープンデータの活用に関心のある組織は、その利点や特定のプロジェクトへの適用方法を理解していても、どのように最初の一歩を踏み出せばよいのかが不明確な場合があります。以下は、組織やコミュニティ、そしてより広い世界における課題に対処するために、オープンデータをより多く利用し始めるための簡単なロードマップです。このフレームワークの該当箇所をクリックすると、詳細が表示され、該当するセクションにジャンプします。

1.組織のインフラが整っているかどうかを判断する。

多くの組織にとって、オープンデータのアプローチを採用することは、文化的な転換を意味します。ステークホルダーからの賛同は得られていますか?データを活用するために必要な投資を評価しましたか?利害関係者間の信頼関係は確立されていますか?次のステップに進む前に、これらの回答が得られることを確認してください。

詳細はこちら リーダーシップ社会的成果を向上させるために、データを活用する準備はできていますか?

2.データで答えたい質問を理解する。

データ戦略では、まず、答えとなる質問を特定することから始める。これらの疑問が明らかになれば、どのデータセットが必要で、それらにアクセスできるかどうかを判断することができます。

詳しくは 機会です。データで答えたい質問は何ですか?

3.必要な人材を揃える。

適切な戦略と適切なデータセットが必要です。しかし、プロジェクトの過程で分析や洞察を提供するために、適切な人材も必要です。必要なデータスキルを評価し、プロジェクトの中心はコラボレーションであることをチームメンバー全員が理解していることを確認してください。

詳しくは 才能がある。データ分析に必要な人材はいますか?

4.地域社会との信頼関係を構築する。

データの機会とリスクの両方に対処できるよう、優れたガバナンスの枠組みを構築する。ガバナンス方針により、ステークホルダー間の透明性、コミュニティメンバーの包括性、およびイネーブルメントの育成を確保し、オープンデータの収集と利用が最善の利益となる理由を理解させるようにします。

詳しくは コミュニティ・ガバナンスデータ活用をめぐるコミュニティの信頼関係を構築していますか?

5.適切なデータリソースを確保する。

広範なデータセットと膨大な量のデータを扱う場合、分析およびデータ可視化ツールは不可欠です。同様に、プライバシーやセキュリティの必要性を考慮することも、責任あるオープンデータやデータ共有の共同作業には不可欠です。

詳しくは テクノロジーとデータ。インパクトの拡大を実現するために必要なソリューションとリソースは?

背景と事情 オープンデータの課題解説

なぜ、データへのアクセスが重要なのか?

人工知能(AI)は、現在世界が経験しているデジタルトランスフォーメーションのバックボーンとなっています。産業オペレーション、ビジネスプロセス、顧客管理などが機械学習によって変革され、より大きな実験、効率、スピードを実現する機会が生まれています。大量のデータの収集、保存、管理を合理化することで、組織が意思決定に利用できる、より信頼性の高いインサイトが生まれます。

大規模で多様なデータセットは、それらの洞察を強化したり、追加したりするのに役立ちます。オープンデータとは、誰もが無制限にアクセス、利用、共有できるように公開されたデータのことで、ユーザーがより速く、より大きな権限を持って問題を解決できるようになり、より早いブレークスルーにつながるほか、予測も可能なため、より正確な予測を生み出すことができるようになるのです。このような理由から、オープンデータが医療、科学、教育、環境などの分野で提供する価値は、社会の最大の課題の解決に貢献するものとして計り知れないものがあるのです。

しかし、データをオープンにすることで、その価値が失われることはないのでしょうか?

多くの場合、データそれ自体に価値があるわけではなく、そのデータを使って何をするかで価値が生まれます。この文脈では、データの経済的な側面にもいくつか注目することが重要です。データは非競合的であり、価値が枯渇することなく多くの人に何度も利用され、ネットワーク効果を発揮することができます。例えば、データが増えればより優れたAIが生まれ、それが利用を呼び込んでさらにデータを生成することができます。

データをオープン化したり、よりアクセスしやすくすることは、データをサイロ化しておくよりも多くの価値を生み出す可能性があり、膨大な公共的価値を解き放つことができる。データを他のデータセットと組み合わせたり、新しい文脈で扱ったりするユーザーは、本来の使い方では明らかにならなかった新しい洞察を発見することができるかもしれない。Open Data Policy Labが9Rs Frameworkで引用しているように、よりオープンなデータは再現性を可能にし、他の人が同一または関連する研究を行うことによって結果に対する信頼性を向上させることができる。

重要なのは、単にデータを他のユーザーに転送するのではなく、そのデータがどのように使用されているか、そしてその使用から得られる利益をどのようにコミュニティと共有できるかを、ユーザーと一緒に理解することです。データの価値は、それが新しい意味や解決策を促進するためにどのように使われるかに由来する。データをオープン化することで、データを閉じたままにしておくと、その利用方法を見逃してしまう、あるいはデータの価値を見逃してしまうことを避けることができる。これがオープンデータの協調精神です。その価値は無限大です。

データの価値について詳しくは、オープンデータ研究所のレポート「The Value of Data」をご覧ください。

データのオープン化に伴うプライバシーへの配慮はどうでしょうか。

データをオープンにすることで懸念されるのは、機密データを開示するリスクかもしれません。個人のプライバシー保護、機密情報や商業的な機密情報の保護は、法律で義務付けられていたり、契約で規定されていたりする場合があります。さらに、組織は機密データを共有することによる風評被害、倫理的リスク、商業的リスクも考慮する必要があります。

データ共有エコシステムの利害関係者を保護し、データ共有に対する信頼を醸成するためには、適切な法的、技術的、組織的手段によって機密データを保護することが重要である。しかし、この要件が、組織が効果的なデータ戦略を追求することを妨げるものであってはなりません。むしろ、責任あるデータ共有のための適切なガバナンスの枠組みを導入することで、保護レベルを向上させることができるのです。

例えば、個人情報を保護するために、プライバシー保護ツールを使用することができる。差分プライバシー、同型暗号化、機密コンピューティング、匿名化、非識別化などの技術や手法を活用することで、組織、研究者、市民社会によるデータへのアクセスを強化しながら、個人のプライバシーを保護することができる。これらの技術はすべての環境に適しているわけではないが、特定の文脈では有用である。

オープンデータイニシアティブのインパクトをしばしば決定する有効条件と無効要因の詳細については、The GovLab'sPeriodic Table of Open Data's Impact Factorsをご覧ください。

オープンデータが組織にもたらすメリット

より適切な意思決定ができる

オープンデータは、利害関係者がより多くの情報を得た上で客観的な意思決定を行うのに役立つ新しい知識を与えることができます。さまざまなソースからの追加データセットの価値は、ユーザーが問題をより明確にし、新しい洞察を引き出すのに役立ちます。"知らないことは知らない "という言葉があります。オープンデータは、ユーザーがこれまで考えもしなかった新しい可能性を発見する機会を提供します。

このプロセスを推進しているのは、オープンデータの性質そのものです。例えば、データを様々な方法で分析し、パターンを明らかにして、ユーザーが解決しようとしている問題を多面的に見ることができます。これらの知見を広く一般に公開し、クラウドソーシングによって知見を深めたり、まだ発見されていない新しい知見を生み出したりすることができる。オープンデータは、より広範な共有と認識とともに、他者への還元を促し、すべての人に利益をもたらす貢献をもたらすことができるのです。

例えば、The Nature Conservancy (TNC) -IndiaとMicrosoftは、既存のオープン衛星画像を使用して、インドの太陽光発電所に関する新しいオープンデータセットを作成しています。このデータは、太陽光発電プロジェクトに適した土地の要因を特定するのに役立ち、最終的には公共機関が太陽光発電開発をよりよく計画するのに役立ちます。

したがって、意思決定は、特定の組織内に存在するデータセットに厳密に従う必要はないのです。オープンデータによって、他者が公開したデータにアクセスすることが可能になり、組織のデータにさらにインプットする機会が生まれ、最終結果や意思決定にさらに情報を提供することができるようになるのです。

新たな発見の機会を生み出す

上記のように、オープンデータは、ユーザーが当初は考慮されなかったかもしれない様々な問題を特定し、対処するのに役立ちます。オープンデータはまた、組織が他のデータセットとのつながりを特定するのにも役立つ。Purdue Food and Agricultural Vulnerability Indexは、COVID-19が農業生産と農民や農業従事者の健康に与える影響について新しい洞察を得るために、非常に異なるオープンデータセットを利用しました。

より多くのデータにアクセスすることで、より速くインサイトを得ることができます。これにより、ユーザーは新しいアイデアを試したり、これまで知られていなかった相関関係を見たり、発見段階を長引かせたりする自由を得ることができます。このようにデータを継続的に展開することで、従来よりも効率的な方法で新たな可能性を見出すことができるのです。

その結果、イノベーションを加速させることができる。

オープンデータを利用した科学のブレークスルーは、研究者にとって重要なモデルであることを既に示している。それはプロトコルの共有、結果の報告と普及、コードの共有などを促進するものである。どのような種類の研究であっても、第三者による精査のために、データが検索可能で、アクセスでき、再利用可能であることを確認することは、まさに本質的な課題です。

オープンデータは、そのような扉を開き、公共の利益のために研究とイノベーションを促進することが期待されています。例えば、特定の健康データを共有・公開することで、COVID-19ウイルスに対抗するために製造されたワクチンのような医療行為の開発を加速させることができました。この経験から学んだ教訓により、米国はよりタイムリーな研究を支援するために何十億ドルも割り当てるようになりました。米国国立衛生研究所は、COVID-19の研究プロジェクトを支援するために、現在までに約49億ドルの資金を提供しています。これらのプログラムにオープンデータの原則を取り入れることで、研究を加速させることができ、現在のパンデミックだけでなく、今後起こるであろう危機にも役立つことでしょう。

オープンデータの価値 - 数値で見る

  • マッキンゼー・グローバル・インスティテュートの2013年のレポートでは、年間3兆ドルと評価されるオープンデータ市場の中心は、政府のオープンデータと企業が保有する共有データの組み合わせによる価値であるとされています。
  • 2014年、Lateral Economicsは、G20に対するオープンデータの潜在的価値は年間約2.6兆ドルで、2014年から2019年のG20各国の累積国内総生産(GDP)約1.1%、G20の追加成長目標2%の55%に寄与すると試算しています。
  • 2020年、欧州データポータルは、EU28+のオープンデータの価値を2019年に1844億5000万ユーロと推定し、2025年には19951ユーロから3342億ユーロに達すると予測した。また、雇用の数字にも注目し、2019年のオープンデータ従業員数は109万人、2025年には112万人から197万人のオープンデータ従業員が予測されています。
  • ロンドン交通局は、そのオープンデータの利用により、民間企業がロンドン経済に年間1200万ポンドから1500万ポンドの貢献をしていると報告しています。

企業がデータ共有に取り組む理由についてのその他の洞察やケーススタディについては、オープンデータ研究所の「企業がデータ共有に取り組むべき7つの理由」をご覧ください。

データ連携や公益的なデータ再利用のためのビジネスケースについては、Open Data Policy Labの9Rsフレームワークをご覧ください。

社会的インパクトのためのオープンデータフレームワーク リーダーが使えるツール

フレームワークについて

Open Data for Social Impact Frameworkは、二酸化炭素排出量の削減、ブロードバンド格差の解消、雇用のためのスキル向上、アクセシビリティとインクルージョンの推進など、重要な社会的課題の解決にデータを役立てるためにリーダーが使用できるツールです。以下のフレームワークは、政府、非営利団体、多国籍組織など、データエコシステム全体の組織リーダーを、重要な社会問題の解決に役立つ洞察とソリューションに導くために設計されています。

このサイトでは、社会的成果を向上させるためにデータを利用しようとする際に、組織が考慮すべき5つのトピックエリア(リーダーシップ、機会、スキル、コミュニティ・ガバナンス、テクノロジーとデータ)を特定しています。このサイトでは、問うべき質問を提案し、その答えに役立つリソースを提供しています。これらのコンセプトは、実際のオープンデータ・プロジェクトの例を通して、現実のものとなっています。また、組織のリーダーが開始するために使用できる、オープンデータへのロードマップもあります。

このフレームワークは、オープンデータとデータ・コラボレーションのための基礎固めをするためのツールとして役立ちます。しかし、社会的インパクトを与えるためにデータを利用したいと考える人たちの助けとなる優れたリソースは他にもたくさんあり、そのうちのいくつかはこのサイトを通して紹介しています。

このフレームワークは、組織のリーダーを次のような問いかけによって導くことで、オープンデータとデータ連携の文化を促進します。

1.リーダーシップ社会的成果を向上させるためにデータを活用する準備はできていますか?

2.機会です。データで答えたい質問は何ですか?

3.スキルの有無データ分析に必要な才能があるか?

4.コミュニティ・ガバナンスデータの利用に関して、コミュニティの信頼を築けたか?

5.テクノロジーとデータ。インパクトの測定、有効化、強化のために必要なソリューションやリソースは何か?

1.リーダーシップ リーダーシップあなたは、社会的成果を改善するためにデータを活用する準備ができていますか?

オープンなアプローチの採用は文化の変化

組織のリーダーは、困難な課題を解決するためにデータを活用する際に、さまざまな懸念や抵抗に直面することがあります。データサイエンティスト、データアナリスト、プログラムマネージャー、研究者など、さまざまな役割を担う人材が社内におらず、データを取り込み、分析することができないケースもあります。また、他の組織とデータ共有のガバナンス体制を構築するのに長いリードタイムが必要なため、成果が出る前に協力が打ち切られるケースもあります。

結局のところ、ほとんどの組織にとって、オープンデータのアプローチを採用することは文化的な変化なのです。

ここで重要なのは、組織はデータの成熟度によって区分されるということです。データをイノベーションに活用することに早くから取り組んできた組織から、データイノベーションがあらゆるレベルに浸透している組織まで、さまざまな組織があります。組織がどのような段階にあるかにかかわらず、オープンデータのアプローチには、組織のデータを活用することを約束するリーダーが必要です。このコミットメントには、次のようなさまざまな形態があります。

  • データ共有の重要性を提唱し、公言すること。
  • データからインサイトを導き出す。
  • コラボレーションとコミュニティーの参加を促進する。
  • 主要な受益者、潜在的なデータ利用者との関係構築。
  • 責任あるデータ活用のための枠組みを設定する。

これらはすべて、ステークホルダーに信頼を浸透させることができるデータ共有のアプローチを構築するための行動です。

検討ステップ

以下のステップを踏むことで、優先順位の高い課題を解決するために、データを革新的に活用するための体制を整えることができます。

  • データを活用するためには、どのような投資が必要なのか?
  • データを活用するためには、どのようなインセンティブが必要なのか?
  • 社内外での信頼関係をどのように構築していますか?パートナーやステークホルダーは誰ですか?
  • データを使ったイノベーションを短期的なプロジェクトではなく、長期的な優先事項として考える機運を組織内で醸成するには、どうしたらよいでしょうか。

強いリーダーシップが求められる

データを重要なリソースとして優先する組織には、当然ながら強力なリーダーシップが必要です。Data Orchardが2021年7月に発表した調査によると、回答者の63%が、自分の組織のリーダーシップはデータの価値について納得していないと回答しています。リーダーシップが関与・支持し、データに対して適切な質問をし、その価値を活用することに積極的であると答えたのは、わずか3分の1です。データの活用が期待できることは、リーダーにとって、データを組織のために活用する能力を向上させる大きなチャンスとなります。

NYUのGovLabは、自己学習プログラムを含むData Stewards Academyを開催しています。このコースは、世界中の様々な立場でデータスチュワードとして活躍する個人を対象としています。この機能は、体系的、持続的、かつ責任あるデータ連携を可能にする方法で、上記の質問に答えようとするものです。

プロフィール世界保健機関(WHO)のリーダーシップは、いかにしてデータドリブンな文化に変革したか

オープンデータやデータ共有の取り組みを実施するには、文化的、戦略的、運用的な転換がすべて必要です。成果に対する説明責任、信頼、透明性、安全性などのメリットを実現するためには、まずリーダーが内部の障壁やその他の種類の組織的抵抗に対処しなければなりません。これには、現状への挑戦、大規模な改革の実施、新たなリスクへの挑戦などが含まれます。これらのすべての変化には、特に大規模な組織では、強力なリーダーシップとコミットメントが不可欠です。

組織の文化をよりデータドリブンに変革する際、その必要性を継続的に示しているのが世界保健機関(WHO)です。全世界で8,000人以上の従業員を抱え、6つの地域にまたがる194の加盟国に対して説明責任を負っているため、デジタル変革イニシアティブの実施は、あらゆるレベルでの強力なリーダーシップと行動によってのみ達成することができました。

WHOは多国籍機関として、健康を促進し、世界を安全に保ち、弱者に奉仕することを使命として、世界的に適用可能な規範と基準を設定する科学と根拠に基づく組織として、独自の地位を確立しています。2017年にテドロス・アダノム・ゲブレイエスス博士がWHO事務局長に就任した際、このミッションを達成し、10億人以上がより良い健康と幸福を享受し、10億人以上が安価なユニバーサル・ヘルス・カバレッジにアクセスし、10億人以上が健康危機からよりよく守られるという「トリプルビリオン」目標を達成するためにはデータが不可欠であることを認識したのです。

2019年、テドロス博士は自身のビジョンを公に発表し、新たにDivision for Data, Analytics and Delivery for Impact(DDI)を設立することで、WHOを近代的でデータ駆動型の組織へと変革させるというコミットメントを示しました。この部門は、データのギャップに緊急に対処し、データの断片化を減らし、WHOのエンドツーエンドのデータプロセスの効率性を高めるために設立されました。特に重視されたのは、外部および内部のユーザーのための保健データと資産の統合、ならびに個人情報や機密データのセキュリティ、透明性の高い分析、強力な可視化手法などの最新技術の利用でした。

当初からWHOのリーダーシップは、データガバナンスに対する戦略的かつ一貫したアプローチを推進することで、内外のステークホルダーとの信頼関係と継続性を構築することを目的としていました。内部的には、シニアリーダーシップで構成されるデータガバナンス委員会を設立し、データ戦略およびポリシーの方向性を決定しました。また、データハブ・スポークコラボレーションを設立し、関連するすべてのプログラムとすべての地域が参加し、WHO全体のデータガバナンスポリシーの実施を促進しました。シニアリーダーは、定期的にコラボレーションのミーティングをサポートし、ガイダンスを提供することで、進捗を促し、新しいデータガバナンスの仕組みを制度化するために必要なアドボカシーを行うことが課されました。

外部的には、WHOは外部の助言を求め、民間を含む国連以外の組織と提携し、データと分析能力を向上させた。2021年6月と9月には、WHO、加盟国、パートナー、一般市民が一堂に会するヘルスデータガバナンスサミットを開催し、ベストプラクティスを検討し、グローバルな公共財としてのヘルスデータの必要性を強調しました。

さらに、マイクロソフトやアバナードなどとの提携により、WHOの指導部は、タイムリーで信頼性が高く、実用的なデータによる意思決定の推進に必要な技術システムの開発と維持に長期的な投資を行いました。この投資の結果、World Health Data Hub (WHDH)が開発されました。WHDHは、グローバルヘルスに関する世界初の包括的なエンドツーエンドソリューションで、プロセスを合理化し、すべての関係者がデータにアクセス、検索、使用できるようにすることを目的としています。

この変革のプロセスを通じて、WHOのリーダーシップは、公の場で発言し、社内外で目に見える形で関与し、実施に必要な実用的ツール(WHDHなど)や行動変革(価値憲章の更新など)に対して長期的な投資を行うことで、このコミットメントを実証してきました。データ駆動型組織への大規模な文化的転換は、リーダーシップのコミットメントなしには不可能であり、WHOは同様の転換を目指す他の組織の模範となることができるのです。

2.機会(Opportunity オポチュニティデータで答えたい質問は何ですか?

プロジェクトを始めるには、「なぜ」の理解が不可欠

なぜ、その問題を解決したいのかを理解することは、簡単なことのように思われます。実際、「なぜ」と問うことはとても簡単なことのように思えるので、このステップはしばしば見落とされがちです。しかし、「なぜ」を問うことは、プロジェクトを立ち上げ、持続可能なソリューションを維持するために不可欠です。組織内での機運の醸成、ステークホルダーの関与、プロジェクトの進行、ガバナンスの適切なアプローチ、データの目的適合性の確保、技術的ソリューションの実装など、イノベーションのライフサイクル全体を通じて必要なことなのです。

問題を解決するために必要な質問を特定する

答えを出したい質問を特定することは、重要な最初のステップです。疑問が明確になれば、それに対応するために必要な解決策を考え始め、問題解決に役立てることができるのです。

オープンデータが解決に役立つ問題の例としては、以下のようなものがあります。

  • 私の組織は、地域のモビリティ計画の改善に貢献できるデータを持っています。このデータを有意義かつ責任ある方法で共有するにはどうしたらよいでしょうか?
  • 私の所属する組織は、人種間の不公平に関するオープンデータを公開しています。このデータの利用をどのように促せばよいでしょうか?
  • 各地域で大気の質を改善するために、特に低・中所得国に影響を与える汚染源に対して、最も費用対効果が高く、公平な介入策は何か。

この最後の例や、関連するデータセットを責任を持って活用すれば解決できる、緊急でインパクトのある他の質問については、GovLabの「The 100 Questions Initiative」をご覧ください。

データから答えを導き出す方法を理解する

さて、質問を特定したら、次のステップは、組織が答えを得るための道筋のどこにいるのかを理解することです。そのためには、現在のデータエコシステムの地図を作成することが有効です。データエコシステムのマッピングは、新しいデータソースの探索、既存のデータフローの活用、変更が必要な箇所の特定、同じまたは類似の問題の解決に取り組んでいる他のステークホルダーの特定に使用することができます。

まず、データエコシステム内のデータアクターと、エコシステム間でどのように価値が交換されているかをマッピングすることから始めるのが一つの方法です。例えば、価値はデータの形でもたらされるかもしれませんが、フィードバックや知識の交換である可能性もあります。

データエコシステムマッピングの演習は、Open Data InstituteのData Ecosystem Mappingをご覧ください。Tool and Guidanceをご覧ください。

ステークホルダーにとっての価値を見極める

データへのアクセスを提供することは、この作業の重要な一部ですが、考慮すべき要素はそれだけではありません。データエコシステムのすべてのステークホルダーがどのように価値を実現するか、より広範に検討することも重要です。

社内では、シニアリーダーがステークホルダーから賛同を得るとともに、組織内で課題に取り組む機運を醸成することが必要です。社外のステークホルダーは、自分たちの利益との整合性を理解し、参加するインセンティブを持つ必要があります。つまり、"What's in it for me?" という問いに対する答えが必要なのです。

ステークホルダーの関心事を考慮することは、最終的に信頼関係を築くことにつながります。これには、グループデータエコシステムマッピングセッションに参加するなどして、価値交換に関する議論の一部にステークホルダーを参加させることができます。

どのデータセットが役立つかを特定する

データの現状を把握するのは大変な作業である。答えたい質問を明確に定義すれば、データセットを特定するステップはより管理しやすいタスクになる。手持ちのデータを評価し、問題解決に役立つオープンデータや共有データがどれかを特定する。これは次のような方法で実現できます。

  • チェックリストの活用 を使用して、自分が持っているデータと、そのデータで何ができるかを確認する、など。
    • データセットは何から構成されているのですか?
    • どのような点を保護する必要があるのか、どの程度の機密性があるデータなのか。
    • データの出所はどこですか?データの血統を理解することは、信頼できるデータ利用を促進するための重要な要素である。血統」とはデータセットの品質を指し、データセットの出所(推定信頼度、信頼度、リスクなどの指標を含む)など、いくつかの要因に基づいて決定される。
    • データはどこに保存されていますか?
    • どのような目的で使用されるのでしょうか?
    • アクセスや使用に関する制限はありますか?
  • データのギャップを特定し、プロジェクトに貢献できるパートナーや 、オープンデータを入手するためのリソースを特定する。
  • Azure Open DatasetsGitHubMicrosoft Research Open Dataなど、オープンデータの条件で公開されているデータセットを活用する。
  • 外部共有のために内部データセットを準備する。オープンデータとして利用できるデータについては、Community Data License Agreement - Permissive, Version 2.0(CDLA-Permissive-2.0) または他のオープンデータライセンスを利用してデータを共有することが推奨されます。利用規約は、データの使用を規定する条件や制限を利用者が理解するのに役立ちます。適切な条件を付けることで、データがオープンであることを識別し、再利用を明確にし、イノベーションを促進することができます。非営利団体は、Microsoft Nonprofit Innovation Hub にアクセスすることができます。このハブには、データコラボレーションを確立するための軽量の法的テンプレートが含まれています。
  • 同じ問題を解決しようとする他の組織やステークホルダーと提携すること。

プロフィールデータ連携による平等への配慮

2021年初頭、Open Data Instituteとマイクロソフトは、データを中心に協働する組織が直面する課題に、より効果的に取り組めるようにすることを目的に、Peer Learning Networkを立ち上げました。これには、参加者と他のステークホルダーとの間の信頼と信用に関連する問題を探ることも含まれていました。

最初のワークショップでは、参加者にデータエコシステムマッピングツールを紹介し、エコシステムにおけるデータの流れと価値を探りました。このワークショップでは、信頼性の高いエコシステム・マップを作成し、信頼性またはその欠如がデータの流れによって生み出される価値に影響を与える場所を理解することによって、データ共有への障壁を克服することができました。

ピアラーニングネットワークの共同プロジェクトの1つである「Caring for Equality」は、アルゼンチンのブエノスアイレス市政府、Center for Global Development、Open Data Charterが協力して、女性の経済的自立を制約する介護関連業務に関する不平等格差に対処することを目的としたものである。ブエノスアイレス市の状況に対応し、政策立案と市民への説明責任を改善するための情報を提供する「ケアリング指標システム」を、複数の民間および公的ソースからのデータを使用して作成しました。

このコラボレーションでは、データエコシステムマッピングの演習を使用して、データプロバイダーとソース、データへのアクセスと活用方法、政府とのデータ共有と政府内の信頼関係の課題を検討する方法を特定しました。この演習は、構築されるケアシステムの価値に対する共通の理解をもって、イニシアチブを前進させるための重要な判断材料となりました。

Caring for Equalityの詳細については、こちらをご覧ください。

プロフィールロンドンがオープンデータを使って電気自動車の充電容量をより良く理解した方法

ロンドンは、2030年までに炭素ゼロの都市を目指すという計画を発表し、市内および郊外における環境に優しい交通手段を検討する必要がありました。ガソリン車やディーゼル車から電気自動車への切り替えは、二酸化炭素排出量の削減につながるため、市は電気充電のためのより良いインフラを構築する機会をより良く理解する必要がありました。そのため、開発業者と充電ポイント運営業者が協力して、電気自動車(EV)所有者の需要を理解するための豊富なデータセットを作成することが必要でした。

ロンドン市内のEV充電インフラをどのように改善できるかを理解するために、データ共有のパイロットプログラムが作られました。官民合同のデータ共有プログラムでは、EV充電ステーションの設置候補地を決定するための知見が得られました。このデータ共有実験では、データ共有、データ連携、オープンデータが、ロンドンのEV充電インフラを発展させ、最終的には2030年までにカーボンニュートラルになるというロンドンの目標をサポートする可能性があることが示されました。

交通行動データ、充電容量データ、土地登記簿データなどのデータセットにより、EV充電ポイントの候補地としてさらに検討すべき市内の公有地2,000区画以上を特定することができました。

データの透明性により、市は分析根拠を示すことができ、懐疑的な人からの信頼とEV充電インフラへの投資家のモチベーションを高めることができる。また、第三者が分析結果を精査することで、その結論が信頼できるものであるか、正確なものであるかを検討することができる。このように、オープンデータを活用したプロジェクトは、データの共有によって、大規模なプロジェクトでもインフラの壁を乗り越えることが可能であることを示している。

EV充電インフラ試験についての詳細は、こちらをご覧ください。

3.才能 才能データ分析に必要な人材がいるか?

データを扱うために必要なスキルを持つことは、どのような組織にとっても重要です。

組織が問題解決やイノベーションを起こすためにデータへのアクセスが重要であるように、そのデータを扱うために必要なスキルを持つことは、どのような組織にとっても不可欠です。しかし、LinkedInの数字によると、技術的なAIスキルを持つ人の約半数はテクノロジー部門で働いており、他の組織や分野では不足しがちです。

データを組織で活用しようとする場合、達成したい洞察や答えを得るための計画を立案し、実行するのに必要な人材を組織で確保することが重要です。これは、コンピュータ科学者のチームを雇用する必要があるという意味ではありません。それどころか、データアナリスト、データサイエンティスト、ソフトウェアエンジニア、研究者など、さまざまな職種やスキルセットがさまざまな形でデータを扱っているのです。必要な人材は、あなたのイニシアチブに必要なデータスキルによって決まるのです。

必要なデータスキルの評価

その評価のために、組織が使用する質問のチェックリストには、以下のようなものがあります。

  • 特定された課題に対処するために、どのような重要なデータスキルが必要なのか。例えば、技術的なスキルとしては、データ処理のためのシステムやインフラの管理、データパイプラインや分析の実装、データの可視化やレポート作成などが考えられる。非技術的なスキルとしては、コンサルティングによる要件収集、ステークホルダーの管理、プログラム管理などが考えられます。
  • 現在、組織内にはどのようなデータスキルがあるのでしょうか?
  • 重要なスキルギャップがあるのはどこですか?
  • このギャップを埋めるために、他の組織と提携することができるのか、それとも自社内に人材が必要なのか。
  • 新しい人材を採用する必要がありますか?現在の人材にスキルアップのチャンスはありますか?
  • データスキルを高めるために、現在トレーニングプログラムを提供していますか?どのようなトレーニングプログラムが必要だと思われますか?

学際的なチームにおける主要な技術的およびビジネス的役割の詳細については、こちらからダウンロード可能な「The AI playbook」をご覧ください。

その他のリソースについては、Open Data InstituteのData Skills Frameworkを参照してください。

プロフィールオープンデータを活用したクラウドソーシングのメリット

オープンデータを利用したクラウドソーシングは、予想外の解決策を導き出し、問題解決を迅速化し、ユーザーの負担を軽減できるため、組織が困難な問題を解決するのに役立つ。クラウドソーシングでは、調査を行う組織と直接のつながりがあるかどうかに関わらず、ボランティア(または有償)のデータ収集者を利用することで機能します。クラウドソーシングを利用することで、現在のスキルやシステムを補強し、コストと時間を削減することができます。モバイル技術の進歩により、より多くの人がデータや世界中の幅広いコミュニティにアクセスできるようになったため、クラウドソーシングの普及に拍車がかかっています。

クラウドソーシングのメリットは以下の通りです。

  • 多様なデータ。寄稿者は世界中の様々なユーザーを反映している可能性があるため、彼らのインプットには最も信頼できる結果を作成するために必要な多様性が反映されている可能性があります。
  • コストの削減。データ収集をアウトソーシングすることで、コストを削減し、組織内のデータセットのソース、クリーニング、構造化に必要なリソースを少なくすることができるかもしれません。
  • より大きな信頼。クラウドソーシング」という名称には、特定の組織の外からデータを調達し、幅広い貢献者を活用するという意味が込められています。そのため、このプロセスは信頼性を獲得することができます。このような信頼性の向上により、一般の人々も研究に参加するようになるかもしれません。

医療分野におけるクラウドソーシングの好例として、次のようなものがあります。 折りたたみ@ホームは、COVID-19の原因であるコロナウイルスのようなシミュレーションを加速させ、新しい治療法を開発するためにクラウドソーシングを利用する組織とオンラインプラットフォームである。

ワシントン大学医学部の分子生物物理学者であるグレッグ・ボウマン博士は、マイクロソフトのAI for Healthとの提携により、世界中からボランティアを募り、パーソナルコンピュータのパワーを使ってタンパク質のシミュレーションを行い、生成したデータを同社のサーバーに送り返しました。世界的なパンデミックを解決したいという情熱の結集により、Folding@homeを実行するデバイスの数は、わずか2ヶ月で約1万台から100万台に増加しました。Bowman氏は、オープンデータを利用したクラウドソーシングの手法を、既存の病気と未来の病気の両方に対処するモデルとして捉えています。

"1台のデスクトップで500年かかるような問題を、半年で解決することができる "と。

Folding@homeと Greg Bowman博士について詳しくはこちら。

マイクロソフトのAI for Healthプログラムおよびプロジェクトの詳細については、こちらをご覧ください。

4.コミュニティ・ガバナンス コミュニティ・ガバナンスデータの利用に関して、コミュニティの信頼を築いたか?

グッドガバナンス体制の確立

社会問題に対処するためのデータ利用には、しばしばガバナンスやコンプライアンスといった重要な問題が絡んでくる。これらの問題は、データとその利用に関心を持つ利害関係者のコミュニティとの関係で考えることが重要である。そのようなコミュニティと強い関係を築くことは、良いガバナンスを促進し、新しい許容される利用方法を特定するのに役立ち、データ連携や関連する取り組みから予想外の利益を得ることができる。このような機会がコミュニティから信頼されれば、関係する、あるいは影響を受けるすべての組織、個人、コミュニティにとって、データ構想の利益を増幅させることができる。

優れたガバナンスの枠組みは、リスクを軽減するのに役立ちます。これらのリスクは法的規制の場合もあるが、社会的信用と評判に対するリスクも組織にとって重要である。これらのリスクは、公共の利益のためにデータへのアクセスを提供しないリスクとのバランスを取る必要がある。GovLab や他の機関は、このプロセスを、データ対象者に害を与える不正使用や、データの再利用によって人々の生活を向上させる機会を逸するなどの使用失敗の両方を回避する方法を見つけることと位置づけている。以下は、初期段階で検討し適用することで、リスク軽減とデータ活用の機会拡大の両方を実現できるガバナンスの検討例である。

透明性・コンプライアンスを実現するガバナンス

誰もが理解できるデータ活用を可能にするためにはどうしたらよいでしょうか。それには、以下のような配慮を最初から組み込んだ取り組みを展開することが考えられます。

  • イニシアチブのガバナンスとガバナンス委員会の透明性
  • 取り組みの目的の透明性
  • 収集、アクセス、または作成されたデータの透明性
  • データの利用がどのように法令を遵守しているかの透明性
  • データスチュワードの特定
  • データの安全な保存と共有
  • プライバシーおよび商業上重要な情報を保護する方法でのアクセスの提供またはデータの共有
  • 幅広いステークホルダーにインサイトを提供し、利益を共有する。
  • データの収集、使用、保存、共有の方法について、個人と組織に発言権を与えるアプローチの使用

地域の支持を生み出すガバナンス

地域社会が地域の問題を解決するのに役立つデータを収集できるとしたらどうでしょう?データを使って、社会参加への障壁に対処できるとしたらどうだろう?このような質問に対する答えは、データを新しい責任ある方法で活用することが自分たちの利益につながり、長期的にプラスの効果をもたらすことを一般の人々に示すのに役立ちます。

オープンな利用を可能にするガバナンス

データを共有し、利用できるようにするために、どのような仕組みがあるか?などが検討される。

  • データを「可能な限りオープン」にすることで、イノベーションや利用を助け、新しく興味深い方法でデータを組み合わせるにはどうしたらよいか。匿名化など、信頼できる方法でデータをオープンにしたり、共有したりすることができるのか。
  • 共通のデータモデル、標準、安定した識別子を用いて、どのようにデータの相互運用を可能にするのか。例えば、FAIR原則は研究データの見つけやすさ、利用しやすさ、相互運用性、再利用性を向上させるためのガイダンスを提供しています。

これらの目的をマッピングすることは、公正でオープン、かつ信頼できるデータエコシステムのためのガバナンスフレームワークを開発する上で非常に有用です。データの利用方法を開発・評価するための有用なツールに、Open Data InstituteのData Ethics Canvasがあります。

イニシアチブのライフサイクルを通じて、ガバナンスの枠組みを再検討し、目的が常に再評価されるように、特に目的が変更された場合は、フィードバックループを確立する必要があります。ガバナンスの決定は、ステークホルダーのグループや独立した機関、例えばガバナンス委員会や独立したデータスチュワードに委任するのが最善と判断することもできます。意思決定を委任する場合、意思決定をイニシアチブの精神に沿った形で展開できるよう、ガイドラインや合意された原則的なアプローチを持つことが特に重要になる場合があります。

さらに、GovLabのThe Data Assemblyが提示したモデルのように、直接審議を通じてデータにアクセスし再利用する際の原則や条件を共同で作成することで、データ連携のための追加の社会的ライセンスを提供することができるかもしれません。

原則的なアプローチ

ガバナンスに対する原則的なアプローチは、法律やコンプライアンスへの配慮を超えたガバナンスの枠組みを構築するのに役立ちます。これは、複数の組織がデータ革新イニシアチブに関与している場合に有効です。データの収集、保存、使用、共有をどのような原則で行うかについて最初に合意しておくことで、そのグループは将来的に意思決定する力を得ることができます。原則は、場合によってはデータチャーターに明記されることもある。

データ共有に関するポリシーや原則を評価する出発点として、マイクロソフトは、信頼できるデータ連携への貢献とコミットメントを示す5つの原則を発表しました。私たちは、これらの原則がオープンデータに関するより広範な会話に情報を提供し、他の人々がこれらの原則を基に改善できることを願っています。5 つの原則は次のとおりです。

  • オープン- 重要な社会問題に関連するデータは、自らオープンデータを提供するなど、可能な限りオープンにするよう努めます。
  • Usable- 新しい技術やツール、ガバナンスの仕組みやポリシーを生み出し、誰もがデータを使えるようにするために投資していきます。
  • Empowering- 組織の選択に応じてデータから価値を生み出し、効果的かつ自立的にデータを活用するAI人材の育成を支援します。
  • セキュア- データ連携が望まれる場所で、運用上の安全性を確保するためのセキュリティコントロールを採用します。
  • プライベート- 個人を特定できる情報を含むデータ共有のコラボレーションにおいて、組織が個人のプライバシーを保護することを支援します。

プロフィールロンドンで進行中の官民データパートナーシップ

コミュニティガバナンスの一例として、ロンドンデータ委員会の提言を受けて2021年に発表された「データ憲章」があります。

都市の将来の成長に影響を与える問題を解決するためには、データ主導のソリューションを解き明かすことが重要です。自治体と民間の利害関係者が相乗効果を発揮しなければ、大気質の改善、通勤時間の短縮、交通機関の改善、渋滞の緩和といった差し迫った問題への解決策を見出すことは不可能でしょう。2019年末、経済団体ロンドン・ファーストは、ロンドン・データ・コミッションのメンバーとして、官民の団体を招集した。ロンドン・ファースト、Arup、オリバー・ワイマン・フォーラム、マイクロソフトなどのデリバリー・パートナーによるプロジェクトチームが指揮を執るデータ委員会は、できるだけオープンなデータ共有を軸に、自治体と民間企業を結集させました。データ委員会は、都市データに関する権威あるビジネス・ボイスとして機能し、データ品質基準を作成し、プライバシー、倫理、信頼などの問題に対処することによって、データ共有エコシステムの立ち上げを支援することを使命とした。2020年9月、ロンドン・データ委員会は、「Data for London」フレームワークの提案を作成しました。このフレームワークでは、ロンドンデータ委員会とロンドンデータ憲章の実現が提言されました。

ロンドンデータ委員会の勧告を受けて、London Firstはこれらの勧告を実現するためのワーキンググループを設立し、ロンドンデータボードの実現とロンドンデータ憲章の策定に向けて、ロンドン最高デジタル責任者と引き続き協働しています。

ロンドンデータ憲章は、7つの原則からなる枠組みで構成されています。ロンドン市民に利益をもたらす包括的なイノベーションを推進する、プライバシーとセキュリティを保護する信頼を促進する学びを他者と共有する、拡張可能で持続可能なソリューションを創造する、可能な限りオープンであることです。幅広い企業がこの枠組みにコミットしており、憲章は現在、ロンドンのビジネスコミュニティと協力して、公共プロジェクトの利益のためにデータを確保する方法について、ロンドンでのマイルストーンを検討しているところです。

ロンドンデータ委員会についてはこちら、ロンドンデータ憲章についてはこちらをご覧ください。

5.テクノロジーとデータ テクノロジーとデータインパクトの測定、有効化、強化のために必要なソリューションとリソースは?

適切な技術基盤を決定するための要因

オープンデータの基本は、そのデータを扱い、データ共有をサポートするために必要な技術インフラです。これには、データ分析やデータ可視化ツール、組織内や組織間で簡単かつ安全にデータにアクセスし共有するための技術やプラットフォームが含まれます。

データイニシアチブの技術的およびプラットフォーム的なニーズを判断するために、重要な要素には以下のようなものがあります。

  • 機密性の高いデータですか?
  • 何を、どのような基準で、法律上あるいは契約上保護する必要があるのか。
  • 倫理的、風評的、商業的配慮を考慮した上で、何を守るべきか?
  • どのような目的でデータを公開しているのか?
  • データは誰に対して公開されているのか?
  • データを扱うのに、どの程度のユーティリティが必要なのか?
  • プライバシー向上技術を適用することで、必要なレベルの効用を達成できるか?
  • 要求される標準に従って、データの共有とアクセスを促進するために、どのようなプラットフォームが存在するか?
  • 機密性の高いデータについては、アクセスや共有をコントロールするために、どのようなガバナンスの枠組みがあるか?

GovLabのData Responsibility Journeyは、このような疑問を対話形式で検討できるようにすることを目的とした評価ツールである。

これらの要因のそれぞれは、さまざまな技術的ニーズを指し示している可能性があります。例えば、データ分析ツールは、トレンドの追跡、問題や効率の特定、予測に役立ちます。データの可視化ツールは、扱っているデータを可視化し、視覚的に操作することができます。

プライバシーを保護しなければならないシナリオでは、匿名化や非識別化など、さまざまなプライバシー保護技術を検討する必要があります。差分プライバシーは、データ保護を危険にさらすことなく、データをよりオープンにするための業界主導の技術である。概念的には、差分プライバシーはプライバシーの利点を得るために2つのステップを使用します。

  • まず、個々のデータポイントの寄与をマスクするために、各結果にノイズを加える。このノイズは、個人のプライバシーを保護するのに十分な大きさですが、アナリストや研究者が抽出する回答の精度に実質的な影響を与えないことを目的としています。
  • 次に、各クエリから明らかにされた情報量が計算され、全体のプライバシー損失バジェットから差し引かれる。プライバシーバジェットが完全に使用されると、データは破棄され、個人のプライバシー侵害を回避するために追加のクエリーは許可されません。これは、誰かのプライバシーを侵害し始めたときに、システムがデータを表示しないようにする内蔵のシャットオフスイッチと考えることができます。

セキュリティに関しては、組織のセキュリティ目標を達成するための適切なメカニズムだけでなく、データライフサイクルを実施するためのポリシーや状態も考慮することが重要です。データへのアクセスを制御し、アクセスを許可された者が適切に認証されるようにすることは重要ですが、データとその使用方法によっては、さらに技術的な対策が必要な場合があります。コンフィデンシャル・コンピューティングは、使用中のデータの暗号化によるセキュリティを提供することで、クラウド上の機密データを保護し、処理中のデータをさらに保護するとともに、組織間の協力体制を強化することができます。

プロフィールプライバシー保護技術の活用による遠隔教育への影響評価について

COVID-19の大流行から8カ月、オープンデータ研究所とマイクロソフトは、遠隔学習への移行が若い学生の教育に与える影響を調べるため、教育オープンデータチャレンジを開始しました。

チャレンジ参加者に新しい関連データセットを提供するため、マイクロソフトは、当社のソフトウェアとサービスのパフォーマンスとセキュリティを向上させるための継続的な作業の一環として収集した匿名化データから、郡レベルと郵便番号レベルの両方で、米国ブロードバンド使用率データセットを公開しました。郵便番号レベルのデータセットでは、郵便番号内の世帯によるブロードバンド利用率を詳細に確認できるため、データプライバシーを保証するための追加措置を講じました。差分プライバシーを適用し、データ集計にノイズを加えました。BroadbandNowも参加し、郡レベルの料金およびブロードバンドプロバイダーのデータを初めて利用できるようにしました。

教育オープンデータ・チャレンジでは、データの組み合わせや可視化など、洞察に満ちた提出物や分析結果が得られました。また、このチャレンジは、プライバシーを保護しながら、より多くのオープンデータを利用できるようにする方法を強調するものでした。

 

教育オープンデータ・チャレンジの詳細はこちら

 

リソース リーダーシップ

データスチュワードアカデミー

Open Data Policy LabのData Stewards Academyは、ソーシャルイノベーションのためのデータ活用を目指すリーダーを対象としています。公共問題解決のためのデータ再利用戦略の策定」は、自己学習型プログラムです。

データ成熟度アセスメント

ソーシャルセクターの組織は、data.orgのデータ成熟度評価ツールを使って、組織の現在の状況を測定・理解することができます。

機会

データエコシステムマッピング

データエコシステムマッピングの演習は、Open Data InstituteのData Ecosystem Mappingをご覧ください。Tool and Guidanceをご覧ください。

データランドスケープ・プレイブック

データ環境の評価と、データイニシアチブの背景(イニシアチブが対処しようとしている問題の特定など)については、Open Data InstituteのData Landscape Playbookをご覧ください。

タレント

トレーニングプログラム

現在の人材のスキルアップや既存人材のスキルアップのためのトレーニングプログラムについては、さまざまなリソースがあります。

  • データアナリスト向けのLinkedIn LearningとMicrosoft Learnのコースです。LinkedIn Learningの自習コースは業界のエキスパートが指導し、Microsoft Learnのコースは短いステップバイステップのチュートリアル、ブラウザベースのインタラクティブなコーディングとスクリプト環境、タスクベースの成果を提供します。
  • データとAIの基礎に関するマイクロソフト認定資格。業界で認知されているマイクロソフト認定資格は、人材がマイクロソフトの技術を使用して職務を遂行するためのスキルや能力を検証するのに役立ちます。
  • Microsoft Digital Skills Center for Nonprofits(非営利団体向けデジタルスキルセンター)。TechSoup CoursesとMicrosoftのコラボレーションにより、特に非営利団体向けに、ExcelやPower BIなどに焦点を当てたコースを含むMicrosoft製品のトレーニングにアクセスすることができます。
  • マイクロソフトのワークショップやトレーニングセッションは、マイクロソフト ストアから利用できます。ビジネスパーソンやプロフェッショナルのための無料のライブトレーニングコースには、入門編とディープダイブ編があります。
  • Microsoft Viva Learningのご案内です。Microsoft TeamsのMicrosoft Viva Learningの一環として、オンデマンドトレーニングが利用できます。
  • MySkills4Afrika イニシアチブ。MySkills4Afrikaを通じて、世界中のマイクロソフト社員がボランティアで時間、才能、専門知識を提供し、アフリカの個人や組織を支援しています。

データスキルフレームワーク

その他のリソースについては、Open Data InstituteのData Skills Frameworkを参照してください。

ガバナンス

データエシックスキャンバス

Open Data InstituteのData Ethics Canvasは、データの利用方法を開発・評価するのに有効なツールです。

データアセンブリ

GovLabのThe Data Assemblyは、データにアクセスし再利用するための原則や条件を、直接審議によって共創するモデルを提供しています。

ロンドンデータ憲章

2021年末に発表された「ロンドンデータ憲章」は、コミュニティガバナンスの実践例と言えるでしょう。

技術・データ

データ・レスポンシビリティ・ジャーニー

GovLabのData Responsibility Journeyは、データコラボレーションやイニシアチブに必要な組織のテクノロジーやリソースを評価する際に、データライフサイクルの各段階で考慮すべき機会やリスクの概要を示すツールです。

スマートノイズ

マイクロソフトは、ハーバード大学が主導するOpenDP Initiativeと共同で、差分プライバシーを実現する世界初のオープンソースプラットフォーム「SmartNoise」をリリースしました。誰でもこのプラットフォームを利用することで、自分のデータセットを世界中の人が広く利用できるようになります。オープンソースのコードとサンプルは、GitHubで公開されています。

コンフィデンシャル・コンピューティング

コンフィデンシャル・コンピューティングは、使用中のデータを暗号化することでセキュリティを確保し、処理中のデータをさらに保護することで、クラウド上の機密データの保護を支援します。コンフィデンシャル・コンピューティングの紹介はこちら、プロジェクトの例はこちらでご覧いただけます。

Azureデータシェア

マイクロソフトは、複数の顧客やパートナーと簡単かつ安全にデータを共有できるAzure Data Shareなど、さまざまなユースケースでよりオープンなデータをサポートする技術をいくつか持っており、組織が内部データとパートナーデータを組み合わせて新しい洞察を得るための機能を提供します。

GitHub

GitHubは世界最大のソフトウェア開発およびコードホスティングプラットフォームです。GitHubはデータプロジェクト、特に小規模なデータセット、共同でバージョン管理されたデータ、コードと同位置にあるデータ、機械学習のワークフローによく利用されています。GitHubは、様々な形式のデータやノートブックのレンダリングをサポートしています。