开放数据促进社会影响框架

简介 充分发挥开放数据和数据协作的作用

伯顿-戴维斯的说明

在微软,我们相信数据对于解决我们世界今天所面临的重要社会问题至关重要。全球大流行病让我们看到了数据在理解、评估和采取行动解决COVID-19所带来的挑战方面的重要作用。然而,几乎所有的组织,无论大小,仍然在努力使数据与他们的工作相关。尽管数据提供了价值,但许多组织未能利用其力量来改善结果。

这场斗争的部分原因是 "数据鸿沟"--那些能够有效获取数据以帮助他们创新和解决问题的国家和组织与那些不能有效获取数据的国家和组织之间存在差距。为了缩小这一鸿沟,微软在2020年发起了开放数据运动,以帮助实现更多开放数据和数据合作的承诺,推动创新。

我们从该运动以及我们与合作伙伴开放数据研究所政府实验室所做的工作中获得的关键经验之一是,获取和使用数据以改善结果的能力涉及的不仅仅是技术工具和数据本身。能够利用和分享促进有效数据合作和决策的经验和做法也很重要。在与政府、多边组织、非营利组织、研究机构以及其他寻求开放和重用数据以解决重要社会问题,特别是发展中国家所面临的问题时,这一点尤其重要。

换句话说,仅仅拥有数据和技术并不能神奇地创造价值和改善结果。充分利用开放数据和数据合作,需要思考组织的领导层如何致力于使数据对其任务有用,定义它想用数据回答的问题,确定其团队使用数据所需的技能,并确定如何在合作者和所服务的社区之间最好地发展和建立信任,以便从数据中获得更多的洞察力和利益。

开放数据促进社会影响框架是领导者可以用来将数据用于解决对他们最重要的挑战的工具。我们认识到并不是所有的数据都可以被公开访问,但我们看到了推动更多的开放数据所带来的巨大利益,不管是以可信的数据合作还是真正的开放和公共数据的形式出现。我们使用 "社会影响 "这一短语,是指在解决社会问题方面的积极变化,如减少碳排放、缩小宽带差距、培养就业技能、推进可及性和包容性。

我们相信,在解决世界上一些最紧迫的挑战时,围绕数据的开放、共享和协作可以创造出无限的机会,从而得出新的见解,做出更好的决定,并提高效率。

伯顿-戴维斯
微软公司知识产权部副总裁兼副总法律顾问

 

本网站无意提供法律指导,不应以此为依据。该框架提供了一些资源,以帮助各组织推进开放数据,并为社会公益而参与数据合作。分享数据并非毫无风险。建议获得独立的法律咨询。本网站包括第三方资源的链接。对于因使用第三方提供的链接或依赖第三方提供的材料而引起的任何损失、伤害或损害,微软概不负责。

快速启动。你的开放数据路线图 一个简单的入门路线图

探索路线图

对使用开放数据感兴趣的组织可能了解它的好处,以及它如何适用于特定的项目,但如何迈出这第一步可能并不清楚。以下是一个简单的路线图,你可以按照这个路线图开始使用更多的开放数据来解决你的组织、社区和更大世界的挑战。如有说明,请点击了解更多信息,并跳转到本框架中的相应部分。

1.确定你是否有组织的基础设施。

对于许多组织来说,采用开放数据的方法是一种文化转变。你是否得到了你的利益相关者的认可?你是否评估了将数据用于工作所需的任何投资?利益相关者之间是否建立了信任?在采取下一步行动之前,请确保你有这些答案。

了解更多信息 领导力。你准备好将数据用于改善社会成果了吗?

2.理解你想用数据回答的问题。

你的数据策略首先是确定你要回答的问题。一旦你确定了这些问题,你就可以确定需要哪些数据集,以及你是否有机会获得这些数据。

了解更多信息 机会。你想用数据回答的问题是什么?

3.组建必要的人才。

你需要正确的战略和正确的数据集。但你也需要合适的人在项目过程中提供分析和洞察力。请确保你评估所需的数据技能,并确保你的所有团队成员理解合作是项目的核心。

了解更多信息 人才。你有数据分析所需的人才吗?

4.在社区建立信任。

创建一个良好的治理框架,以确保数据机会和数据风险都得到解决。确保你的治理政策确保利益相关者之间的透明度,社区成员之间的包容性,并促进赋权,使他们了解为什么收集和使用开放数据是符合他们的最佳利益。

了解更多信息 社区治理。你是否在你的社区中围绕数据的使用建立了信任?

5.确保你有正确的数据资源。

如果你在广泛的数据集和大量的数据中工作,分析和数据可视化工具是必不可少的。同样,确保任何隐私和安全需求得到考虑,对于负责任的开放数据和数据共享合作至关重要。

了解更多信息 技术和数据。你需要哪些解决方案和资源来实现和加强你的影响?

背景介绍 解读开放数据的挑战

为什么获取数据如此重要?

人工智能,或称AI,是目前世界正在经历的数字转型的支柱。工业运营、业务流程、客户管理等正在被机器学习所改变,这为更大的实验、效率和速度创造了机会。简化大量数据的收集、存储和管理,创造出更可靠的洞察力,组织可以在决策中使用。

大型和多样化的数据集可以帮助加强这些洞察力或增加这些洞察力。开放数据,即公布给任何人不受限制地访问、使用和分享的数据,可以帮助用户以更快的速度和更大的权威性解决问题,这可以导致更快的突破,而且由于它也可以是预测性的,可以产生更准确的预测。由于这些原因,开放数据在医疗、科学、教育、环境等方面提供的价值是不可估量的,有助于解决社会的最大挑战。

但通过开放数据,它不会失去价值吗?

在大多数情况下,数据本身并不是价值所在,价值来自于你对这些数据的处理。在这种情况下,注意到数据的几个经济方面也很重要。数据是无价的--它可以被许多人反复使用而不会耗尽价值,它可以被用来实现网络效应--例如,更多的数据可以创造更好的人工智能,这可以吸引更多的使用并产生更多的数据。

开放数据或使数据更容易获取,有可能产生比保持数据孤岛更多的价值,它可以释放出巨大的公共价值。用户将数据与其他数据集结合起来,或者在新的背景下使用它,可能会发现在最初使用时并不明显的新见解。正如开放数据政策实验室在其9R框架中所提到的,更多的开放数据还可以实现可重复性,通过允许其他人进行相同或相关的工作来提高对结果的信心。

关键不是简单地将数据传输给其他用户,而是与他们一起工作,了解数据是如何被使用的,以及如何将这些使用的好处与社区分享。它的价值来自于如何利用它来促进新的意义和解决方案。开放数据可以帮助避免遗漏的使用--如果数据一直被封闭,就会遗漏数据的价值。这就是开放数据的合作精神。它的价值是无穷的。

关于数据价值的更多信息,请访问开放数据研究所的《数据的价值》报告。

与开放数据相关的隐私问题呢?

开放数据的一个顾虑可能是披露敏感数据的风险。保障个人隐私和保护机密或商业敏感信息可能是法律要求的,或受合同约束的。此外,企业还必须考虑共享敏感数据的声誉、道德和商业风险。

为了保护数据共享生态系统中的利益相关者,并使人们对数据共享产生信任,必须通过适当的法律、技术和组织手段来保护敏感数据。但这一要求不应阻止组织追求有效的数据战略。相反,可以通过实施适当的治理框架来实现负责任的数据共享的保护水平。

例如,可以使用隐私增强工具来帮助保持个人信息的私密性。诸如差分隐私、同态加密、保密计算、匿名化和去标识化等技术和工艺可以被用来保护个人隐私,同时增强组织、研究人员和公民社会对数据的访问。虽然这些技术可能不适合所有环境,但在某些情况下是有用的。

关于通常决定开放数据倡议影响的有利条件和不利因素的更多信息,请访问The GovLab的开放数据影响因素定期表

开放数据对你的组织的好处

它创造了更明智的决策

开放数据可以为利益相关者提供新的知识,帮助他们做出更明智和客观的决定。来自不同来源的额外数据集的价值可以帮助用户更清楚地了解问题并释放新的洞察力。正如口述的那样,"你不知道你不知道的事情"。开放数据提供了一个机会,可以发现用户以前从未考虑过的新的可能性。

推动这一进程的是开放数据本身的性质。例如,数据可以通过多种方式进行分析,以揭示模式,从而获得对用户试图解决的问题的多层面看法。这些发现可以与更广泛的公众分享,以众包的方式加强发现或创造尚未发现的新发现。在更广泛的分享和认识的同时,开放数据可以鼓励其他人进行互惠,并可以产生有利于所有人的贡献。

作为一个例子,大自然保护协会(TNC)-印度和微软正在使用现有的开放卫星图像来创建一个关于印度太阳能农场的新的开放数据集。这些数据将有助于确定驱动土地适合太阳能项目的因素,并最终帮助公共机构更好地规划太阳能发展。

因此,决策不一定要严格基于任何一个组织的数据集。开放数据使人们能够访问他人发布的数据,它可以为你的组织的数据创造进一步输入的机会,进一步为最终结果和决策提供信息。

这创造了新的发现机会

如上所述,开放数据有助于用户识别和解决最初可能没有考虑过的不同问题。开放数据也有助于组织识别与其他数据集的联系。普渡食品和农业脆弱性指数借鉴了大量不同的开放数据集,对COVID-19对农业生产以及农民和农场工人的健康的影响产生了新的见解。

随着对更多数据的访问,可以更快地获得洞察力。这使用户可以自由地尝试新的想法,看到以前不知道的相关性,或延长发现阶段。这种不断展开的数据允许新的可能性,其方式可以比以前存在的更有效。

因此,可以加快创新的步伐

使用开放数据的科学突破已经向我们表明,它代表了研究人员的一个重要模式,一个促进共享协议、报告和传播结果、共享代码等等的模式。任何一种研究的本质确实取决于确保数据的可搜索性、可访问性和可重用性,以推动第三方的审查。

开放数据的承诺是,它打开了这些大门,加快了研究和创新,使公众受益。例如,将某些健康数据共享或公开有助于加快医疗手段的发展,如为对抗COVID-19病毒而生产的疫苗。从这一经验中获得的教训促使美国拨出数十亿美元来支持更及时的研究。美国国家卫生研究院迄今已提供了近49亿美元的资金来支持COVID-19研究项目。将开放数据原则纳入这些项目可以帮助加速研究,这将有利于当前的大流行病以及未来的危机。

开放数据的价值--从数字看

  • 在麦肯锡全球研究所2013年的一份报告中,开放数据市场每年的价值为3万亿美元,其核心是将开放的政府数据与企业持有的共享数据相结合的价值。
  • 2014年,Lateral Economics估计,开放数据对G20的潜在价值每年约为2.6万亿美元,在2014-2019年期间为G20国家的累计国内生产总值(GDP)贡献约1.1%,或G20 2%额外增长目标的55%。
  • 2020年,欧洲数据门户网站估计,2019年欧盟28国+开放数据的价值为1844.5亿欧元,预测到2025年将达到1995.1亿欧元至3342亿欧元。报告还研究了就业数字,2019年开放数据雇员为109万,预测到2025年开放数据雇员为112万至197万。
  • 伦敦交通局报告说,使用其开放数据使私营部门的公司每年为伦敦经济贡献1200万至1500万英镑。

关于企业拥抱数据共享的其他见解和案例研究,请访问开放数据研究所的 "企业应该共享数据的七个原因"。

更多关于数据合作和为公共利益重新使用数据的商业案例,请查看开放数据政策实验室的9R框架

开放数据促进社会影响框架 一个领导者可以使用的工具

关于框架

开放数据促进社会影响框架是一个领导者可以用来将数据用于解决重要的社会问题的工具,如减少碳排放、缩小宽带差距、培养就业技能以及推进无障碍和包容性。以下框架旨在引导整个数据生态系统的组织领导者--政府、非营利组织和多边组织--了解他们可以用来帮助解决重要社会问题的见解和解决方案。

本网站确定了组织在寻求使用数据来改善社会成果时应考虑的五个主题领域:领导力、机会、技能、社区治理以及技术和数据。它提出了要问的问题,并提供了可以帮助回答这些问题的资源。这些概念通过现实世界中的开放数据项目的例子被带入生活。本书还提供了一个开放数据的路线图,组织领导者可以用它来开始工作。

这个框架可以作为一个工具,帮助为开放数据和数据合作奠定基础。然而,还有许多其他优秀的资源可以借鉴,可以帮助那些想要利用数据来产生社会影响的人,其中一些我们在整个网站上都可以看到。

该框架通过引导组织领导者解决以下问题来促进开放数据和数据协作的文化。

1.领导力。你准备好将数据用于改善社会成果了吗?

2.2. 机会。你想用数据回答的问题是什么?

3.技能。你是否具备数据分析所需的才能?

4.4.社区治理。你是否在你的社区中围绕数据的使用建立了信任?

5.技术和数据。你需要哪些解决方案和资源来衡量、促成和加强你的影响?

1.领导力 领导力。你准备好将数据用于改善社会成果了吗?

采用开放的方法是一种文化转变

在将数据用于解决棘手的挑战时,组织的领导者可能会面临一系列的担忧或阻力。在某些情况下,人才--从数据科学家和数据分析师到项目经理和研究人员的角色--并不在内部,无法摄入和分析数据。在其他情况下,与其他组织建立数据共享治理结构所需的漫长准备时间可能会导致合作在获得收益之前就被放弃。

归根结底,对于大多数组织来说,采用开放数据的方法是一种文化的转变。

在这里,重要的是要认识到,组织处于数据成熟度的光谱上--从早期承诺使用数据进行创新到数据创新被嵌入到每个层面的文化。无论一个组织在这个光谱上处于什么位置,开放数据的方法需要一个致力于将组织的数据用于工作的领导者。这种承诺可以采取多种形式,例如:。

  • 倡导并公开谈论共享数据的重要性。
  • 从数据中获取洞察力。
  • 鼓励合作和社区参与。
  • 与主要受益者和潜在的数据用户建立关系。
  • 为负责任地使用数据设定一个框架。

这些都是有助于建立一个值得信赖的数据共享方法的行动,可以在利益相关者之间灌输信任。

需要考虑的步骤

考虑以下步骤,使你的组织更好地定位,创新地使用数据来解决优先问题。

  • 需要哪些投资来使数据发挥作用?
  • 需要哪些激励措施来将数据用于工作?
  • 你如何在内部和外部建立信任?谁是你的合作伙伴/利益相关者?
  • 你如何在你的组织内建立动力,将数据创新作为一个长期的优先事项,而不是一个短期项目?

需要强有力的领导

毫不奇怪,将数据作为重要资源优先考虑的组织需要强有力的领导。根据Data Orchard在2021年7月发布的一项调查,63%的受访者表示他们组织中的领导层对数据的价值不以为然。只有三分之一的人说他们的领导层是参与和支持的,对数据提出正确的问题,并积极利用其价值。利用数据的承诺为领导者创造了一个重要的机会,以提高他们使用数据的能力,使他们的组织受益。

纽约大学的GovLab主办了一个数据管理员学院,其中包括一个自我指导的学习课程。该课程是为在世界各地以不同身份担任数据管理员的个人设计的--这一职能旨在以实现系统、可持续和负责任的数据合作的方式回答上述问题。

简介。世界卫生组织的领导层如何将其文化转变为数据驱动的文化

文化、战略和运营方面的转变都是实施开放数据和数据共享计划所必需的。为了实现这些好处的潜力--包括对结果负责、信任、透明和安全--领导层必须首先解决内部障碍和其他类型的组织阻力。这可能包括挑战现状,实施大规模的改革,或承担一系列新的风险--对于所有这些变化,特别是在一个大型组织中,强有力的领导和承诺是至关重要的。

在将一个组织的文化转变为更多的数据驱动时,世界卫生组织(WHO)不断地证明了这种必要性。世卫组织在全球拥有8000多名员工,对其六个地区的194个成员国负责,只有通过强有力的领导和各个层面的行动,才能完成数字化转型举措的实施。

作为一个多边组织,世卫组织具有独特的地位,它是一个以科学和证据为基础的实体,制定全球适用的规范和标准,其使命是促进健康,保持世界安全,并为弱势群体服务。Tedros Adhanom Ghebreyesus博士在2017年被任命为世卫组织总干事时,认识到数据是实现这一使命和实现"三个十亿 "目标的关键组成部分,即再有十亿人享有更好的健康和福祉,再有十亿人获得负担得起的全民医保,再有十亿人得到更好的保护,免受卫生紧急情况的影响。

2019年,特德罗斯博士公开宣布了他的愿景,并成立了一个新的数据、分析和交付影响司(DDI),从而表明他致力于将世卫组织转变为一个现代的、以数据为导向的组织。该部门的成立是为了紧急解决数据缺口,减少数据分散,提高世卫组织端到端数据流程的效率。特别强调为外部和内部用户整合卫生数据和资产,以及使用现代技术,包括私人和敏感数据的安全、透明分析和强大的可视化方法。

从一开始,世卫组织领导层就着手通过促进数据治理的战略性和连贯性方法,与内部和外部利益攸关方建立信任和连续性。在内部,成立了一个由高级领导层组成的数据治理委员会,为数据战略和政策确定企业方向。还创建了一个数据枢纽和辐条协作机构,以促进在整个世卫组织实施数据治理政策,所有相关方案和每个区域都有代表。高级领导层的任务是定期支持合作组织的会议,以提供指导,从而鼓励进展,并为新的数据治理机制的制度化提供急需的宣传。

在外部,世卫组织寻求外部顾问,并与包括私营部门在内的非联合国组织合作,以提高其数据和分析能力。2021年6月和9月,他们召开了两次卫生数据治理峰会,将世卫组织、成员国、合作伙伴和公众聚集在一起,审查最佳做法,并强调需要将卫生数据作为一种全球公益物

此外,世卫组织领导层与微软和Avanade及其他机构合作,进行了长期投资,以开发和维护必要的技术系统,通过及时、可靠和可操作的数据推动决策。这项投资导致了世界卫生数据中心(WHDH)的发展。世界卫生数据中心是世界上第一个全面的、端到端的全球卫生解决方案,旨在简化流程,确保所有利益相关者都能获得、找到和使用数据。

在整个转型过程中,世卫组织的领导层通过公开讲话、在内部和外部的可见度和参与度,以及对实施所需的实用工具(如WHDH)和行为改变(如更新的价值观章程)进行长期投资,来证明这一承诺。如果没有领导层的承诺,这种向数据驱动型组织的大规模文化转变是不可能的,世卫组织可以作为其他旨在进行类似转变的组织的榜样。

2.机会 机会。你想用数据回答的问题是什么?

了解 "为什么 "对启动项目至关重要

了解你为什么要解决一个问题,似乎是一个很简单的任务。事实上,问 "为什么 "可能看起来如此简单,以至于这个步骤常常被忽略了。然而,问 "为什么 "对于启动一个项目和维持一个可持续的解决方案至关重要。在创新的整个生命周期中,从在组织内建立势头、为利益相关者的参与提供信息、推动项目的进展、得出正确的治理方法、确保数据适合目的、到实施技术解决方案,都需要问 "为什么"。

确定你需要回答的问题以解决你的问题

确定你想要回答的问题是关键的第一步。一旦确定了问题,你就可以开始思考解决这些问题所需的解决方案,并帮助解决问题。

开放数据可能有助于解决的问题的例子包括。

  • 我的组织拥有的数据可以帮助改善我所在地区的交通规划。我怎样才能以一种有意义和负责任的方式分享这些数据?
  • 我的组织已经发布了关于种族不平等的公开数据。我们如何鼓励使用这些数据?
  • 为改善每个地区的空气质量,特别是对影响中低收入国家的污染源,有哪些最具成本效益和公平的干预措施?

关于这最后一个例子以及其他如果以负责任的方式利用相关数据集可以解决的紧迫、高影响力的问题,请访问The GovLab的The 100 Questions Initiative

了解数据如何能帮助你回答这些问题

现在你已经确定了这些问题,下一步是了解你的组织在获得这些答案的道路上处于什么位置。要做到这一点,绘制当前的数据生态系统是有帮助的。绘制数据生态系统图可以用来探索新的数据来源,利用现有的数据流,确定需要改变的地方,并确定其他也在努力解决相同或类似问题的利益相关者。

开始的一个方法是绘制你的数据生态系统中的数据行为者,以及如何在其中进行价值交换。例如,价值可能以数据的形式出现,但它也可能是反馈或知识的交流。

关于数据生态系统图谱的练习,请访问开放数据研究所的数据生态系统图谱。工具和指南

确定对你的利益相关者的价值

提供数据访问可能是这项工作的一个关键部分,但它不是唯一需要考虑的因素。更广泛地考虑整个数据生态系统的所有利益相关者将如何实现价值也很重要。

在内部,高级领导人将需要获得利益相关者的支持,并在组织内建立起应对挑战的动力。外部利益相关者将需要理解与他们的利益相一致,并有动力参与。换句话说,他们需要得到 "对我有什么好处 "这个问题的答案。

将利益相关者的利益考虑在内,最终将有助于建立信任。这可以包括让你的利益相关者参与到关于价值交换的讨论中来,比如参加一个小组数据生态系统图的会议。

确定哪些数据集将有助于

试图评估数据状况是一项艰巨的任务。一旦你清楚地定义了你想要回答的问题,识别数据集的步骤就会成为一项更容易管理的任务。评估你所拥有的数据,并确定需要哪些开放和共享的数据来帮助解决这个问题。你可以通过以下方式完成这一任务。

  • 使用核对表 来确定你所拥有的数据以及你能用它做什么,例如。
    • 该数据集包括哪些内容?
    • 你需要保护哪些方面,数据有多敏感?
    • 数据的来源是什么?了解数据的血统是促进数据可信赖使用的一个关键组成部分。血统 "指的是数据集的质量,基于几个因素,包括数据集的来源(包括估计的可靠性、置信度和风险的指标)。
    • 数据储存在哪里?
    • 它将用于什么目的?
    • 在访问或使用方面是否有任何限制?
  • 找出数据的差距,并确定能够为项目做出贡献的合作伙伴 或获得开放数据的资源。
  • 利用公开的数据集,例如在Azure开放数据集GitHub微软研究院开放数据上根据开放数据条款提供的数据。
  • 为外部共享准备你的内部数据集。对于可以开放的数据,建议利用社区数据许可协议--许可,2.0版(CDLA-Permissive-2.0)或其他开放数据许可来分享你的数据。条款有助于用户了解使用数据的条件和限制。附上适当的条款,可以确定数据是开放的,使再使用变得清晰,并促进创新。非营利组织可以访问微软非营利创新中心,其中包括建立数据合作的轻型法律模板。
  • 与其他试图解决相同问题的组织或利益相关者建立伙伴关系。

概况。通过数据合作关爱平等

2021年初,开放数据研究所和微软推出了一个同行学习网络,目的是帮助围绕数据进行合作的组织更有效地解决他们面临的挑战。这包括探讨与参与者和其他利益相关者之间的信任和可信度相关的问题。

在第一次研讨会上,与会者被介绍了数据生态系统图工具,以探索其生态系统中的数据流和价值。这包括通过开发一个值得信赖的生态系统图来克服共享数据的障碍,以了解信任--或缺乏信任--对数据流所创造的价值的影响所在。

同伴学习网络合作项目之一,"关爱平等",是阿根廷布宜诺斯艾利斯市政府、全球发展中心和开放数据宪章的合作项目,旨在解决在制约妇女经济自主权的护理相关任务方面的不平等差距。利用来自多个私人和公共来源的数据,各小组创建了一个 "护理指标系统",以解决布宜诺斯艾利斯的情况,并提供信息以改善政策制定和对该市公民的问责。

该合作项目利用数据生态系统映射活动来确定数据提供者和来源,如何访问和利用数据,以及如何考虑与政府和政府内部共享数据的信任挑战。这项工作导致了重要的决策点,有助于在对正在建立的护理系统的价值有共同理解的情况下,引导该倡议前进。

有关 "关爱平等 "的更多信息可在这里找到。

简介。伦敦如何利用开放数据来更好地了解电动汽车的充电能力

当伦敦宣布其到2030年成为零碳城市的计划时,有必要考虑在整个城市和周边郊区使用更绿色的交通方式。鉴于从使用汽油和柴油驱动的车辆转为电动车有助于减少碳排放,该市需要更好地了解创造更好的电动充电基础设施的机会。这就需要让开发商和充电桩运营商共同合作,创建更丰富的数据集,以了解电动汽车(EV)车主的需求。

创建了一个数据共享试点,以了解如何改善伦敦境内的电动车充电基础设施。公私合营的数据共享项目发展了洞察力,以确定电动车充电站的潜在位置。数据共享试点展示了数据共享、数据合作和开放数据的潜力,以帮助发展伦敦的电动汽车充电基础设施,并最终支持伦敦在2030年实现碳中和的目标。

包括交通行为数据、充电容量数据和土地登记数据在内的数据集帮助确定了该市2000多块公共土地,应进一步考虑作为电动汽车充电点的候选地点。

数据的透明度使城市能够展示分析的基础,从而有助于在怀疑论者中产生信任,在电动汽车充电基础设施的投资者中产生动力。第三方可以仔细检查分析,考虑得出的结论是否可靠和准确。总的来说,该项目中开放数据的使用表明,通过数据共享,克服基础设施的障碍对于这样一个大规模的努力是可能的。

关于电动汽车充电基础设施试点的更多信息可在这里找到。

3.人才 人才。你有数据分析所需的人才吗?

拥有处理数据的必要技能对任何组织都是至关重要的。

就像获得数据对组织解决问题和创新至关重要一样,拥有处理这些数据所需的技能对任何组织都至关重要。然而,根据LinkedIn的数据,所有拥有人工智能技术技能的人中约有一半在技术部门工作,而在其他组织和部门往往是短缺的。

当你想让数据为你的组织工作时,关键是要确保你的组织拥有必要的人才来架构和执行一个计划,以实现你想实现的洞察力和答案。这并不意味着你必须雇用计算机科学家团队。相反,各种职业和技能组合以不同的形式与数据打交道,包括数据分析师、数据科学家、软件工程师和研究员。你所需要的人才将由你的倡议所需的数据技能来驱动。

评估所需的数据技能

你的组织用于评估的问题清单可能包括。

  • 为应对所确定的挑战,需要哪些关键的数据技能?例如,技术技能可以包括管理数据处理的系统和基础设施,实施数据管道和分析,以及数据的可视化或报告。所需的非技术性技能可能包括咨询性需求收集、利益相关者管理和项目管理。
  • 今天你的组织内有哪些数据技能?
  • 你在哪里有关键的技能差距?
  • 你是否可以与其他组织合作来填补这一空白,或者你需要在自己的组织内培养人才?
  • 你需要雇用新的人才吗?是否有机会提高现有人才的技能?
  • 你今天是否提供培训计划来帮助提高数据技能?可能需要哪些培训项目?

关于跨学科团队的关键技术和业务角色的详细描述可在 "人工智能游戏手册 "中找到,可在此下载。

关于其他资源,请参考开放数据研究所的数据技能框架

概况。使用开放数据进行众包的好处

使用开放数据的众包有助于组织解决困难的问题,因为它可以带来意想不到的解决方案,更快地解决问题,并减少用户负担。众包的工作方式是使用志愿者(或付费)的数据收集员,他们可能与进行研究的组织有或没有直接关系。他们的帮助最终可以通过增强现有技能和系统来降低成本和时间。移动技术的进步帮助推动了众包的普及,因为现在有更多的人可以接触到数据和世界各地的广泛社区。

众包的好处包括。

  • 多样化的数据。因为贡献者可能反映了来自世界各地的一系列用户,他们的输入可能反映了创造最可靠的结果所需的多样性。
  • 降低成本。通过外包数据收集,组织可能能够降低成本,在组织内部寻找、清理和构建数据集所需的资源也会减少。
  • 更大的信任。众包 "这个名字本身就意味着数据的来源是在任何一个组织之外,并挖掘出广泛的贡献者。正因为如此,这个过程可以获得公信力。这种增强的信任可能会在公众中产生更大的参与,以帮助研究。

医学领域中众包的一个好例子是 折叠@家,这是一个组织和在线平台,利用众包来加速模拟,如构成COVID-19的冠状病毒的模拟,并开发新疗法。

通过与微软AI for Health的合作,圣路易斯华盛顿大学医学院的分子生物物理学家格雷格-鲍曼博士从世界各地征集志愿者,利用他们的个人计算能力来运行蛋白质模拟,并将产生的数据发回其服务器。解决全球大流行病的集体热情导致运行Folding@home的设备数量在短短两个月内从10000台左右增长到100万台。鲍曼认为使用开放数据的众包方法是对抗现有和未来疾病的模式。

"他说:"我们可以把一个在单个桌面上需要500年才能完成的问题,在6个月内解决。

了解更多关于Folding@homeGreg Bowman博士的信息。

关于微软的人工智能健康计划和项目的更多信息可以在这里找到。

4.社区治理 社区治理。你是否在你的社区中围绕数据的使用建立了信任?

建立良好的治理框架

使用数据来解决社会问题往往会带来重要的治理和合规问题。重要的是,要把这些问题放在与数据及其使用有关的利益相关者群体的背景下。与该社区建立牢固的关系将有助于促进良好的治理,并确定新的和可允许的用途,从而从数据合作或相关倡议中获得意想不到的好处。当这些机会被你的社区信任时,它们可以放大你的数据倡议对所有参与或受影响的组织、个人和社区的好处。

良好的治理框架可以帮助减轻风险。这些风险可能是法律和监管方面的,但对公众信任和声誉的风险对组织来说也是非常重要的。这些都需要与不为公共利益目的提供数据访问的风险相平衡。GovLab和其他机构将这一过程描述为找到避免滥用的方法,如伤害数据主体的未经授权的使用,以及错过的使用,包括未能通过数据的再利用改善人们的生活的机会。以下是一些治理考虑的例子,如果在早期阶段进行审议和应用,可以用来实现风险缓解和提高数据使用的机会。

产生透明度和合规性的治理

如果我们能使每个人都能理解的数据的使用,会怎么样?这可能包括制定一项倡议,从一开始就内置以下任何考虑。

  • 倡议的管理和管理委员会的透明度
  • 倡议目的的透明度
  • 收集、访问或创建的数据的透明度
  • 数据的使用如何符合法律和法规的透明性
  • 确定一个数据管理人
  • 安全地存储和共享数据
  • 以保护隐私和商业敏感信息的方式提供访问或共享数据
  • 向广泛的利益相关者提供洞察力,让他们分享利益
  • 使用让个人和组织在如何收集、使用、存储和共享数据方面有发言权的方法。

创造社区支持的治理

如果我们能收集到帮助当地社区解决当地问题的数据呢?如果我们利用数据来解决包容性的障碍呢?对诸如此类问题的回答将有助于向公众表明,以新的和负责任的方式利用数据符合他们的利益,并能产生长期的积极影响。

实现开放使用的治理

有什么机制可以确保数据可以被共享和使用?考虑的因素可能包括。

  • 如何使数据 "尽可能地开放",以帮助创新和使用,并以新的和有趣的方式组合数据。能否使数据开放或以可信的方式共享,如通过匿名化?
  • 如何利用通用数据模型、标准或稳定的标识符使数据具有互操作性?例如,FAIR原则为改善研究数据的可查找性、可访问性、互操作性和可重复使用性提供了指导。

描绘出这些目标对于制定一个公平、开放和值得信赖的数据生态系统的治理框架非常有帮助。开发和评估数据使用方式的一个有用工具是开放数据研究所的数据道德画布

在倡议的整个生命周期中,治理框架应该被重新审视,以创建一个反馈回路,确保目标不断被重新评估,特别是当这些目标发生变化时。你可能会决定,治理决策最好委托给一组利益相关者或一个独立的机构,例如,治理委员会或独立的数据监管者。当决定被委托时,特别重要的是要有指导方针或商定的原则性方法,使这些决定能够以符合倡议的精神的方式发展。

此外,通过直接商议,共同创造数据获取和再利用的原则和条件,如GovLab的数据大会所提出的模式,可以为数据合作提供额外的社会许可。

一个有原则的方法

一个有原则的治理方法将帮助你制定一个超越法律和合规考虑的治理框架。当多个组织参与到一个数据创新计划中时,这可能会有帮助。通过最初商定收集、存储、使用和共享数据的原则,该小组将被授权在未来做出决定。在某些情况下,这些原则可能会被写入数据章程。

作为评估和评价你的数据共享政策和原则的起点,微软公布了五项原则,这些原则是我们对可信数据合作的贡献和承诺。我们希望这些原则能够为更广泛的关于开放数据的对话提供参考,也希望其他人能够在此基础上加以改进。这五项原则是:。

  • 开放--我们将努力使与重要社会问题相关的数据尽可能地开放,包括通过自己贡献开放的数据
  • 可用- 我们将投资于创建新的技术和工具、治理机制和政策,使数据对每个人都更可用。
  • 授权- 我们将帮助企业根据他们的选择从他们的数据中产生价值,并发展他们的人工智能人才,以有效和独立地使用数据。
  • 安全- 我们将采用安全控制措施,以确保数据协作在需要的地方操作安全
  • 隐私- 我们将帮助组织在涉及个人身份信息的数据共享合作中保护个人的隐私。

概况。伦敦正在进行的公私合营数据伙伴关系

社区治理的一个例子是根据伦敦数据委员会的建议,在2021年发布的《数据宪章》。

释放数据主导的解决方案对于解决影响城市未来发展的问题至关重要。如果没有地方当局和私人利益之间的协同作用,找到改善空气质量、缩短通勤时间、改善交通和减少拥堵等紧迫问题的解决方案将是不可能的。2019年底,商业团体 "伦敦第一 "召集了一批公共和私人组织作为伦敦数据委员会的成员。数据委员会由包括伦敦第一、奥雅纳、奥利弗-怀曼论坛和微软在内的执行伙伴项目组指导,将地方当局和私营公司围绕尽可能公开地分享数据聚集起来。数据委员会的任务是作为城市数据的权威商业声音,并通过创建数据质量标准和解决隐私、道德和信任等问题,帮助启动一个数据共享生态系统。2020年9月,伦敦数据委员会制定了关于伦敦数据框架的建议。该框架建议提供一个伦敦数据委员会和一个伦敦数据宪章。

根据伦敦数据委员会的建议,"伦敦第一 "创建了一个工作组来实现这些建议,并继续与伦敦首席数字官合作,以实现伦敦数据委员会并制定伦敦数据宪章。

伦敦数据宪章建立在一个七项原则的框架之上。为伦敦人带来利益推动包容性创新保护隐私和安全促进信任与他人分享经验创造可扩展和可持续的解决方案;以及尽可能地开放。广泛的公司已经对该框架做出承诺,该宪章目前正在考虑伦敦的里程碑,即如何与该市的商业界合作,为公共项目的利益保障数据。

这里了解更多关于伦敦数据委员会的信息,以及伦敦数据宪章。

5.技术与数据 技术和数据。你需要哪些解决方案和资源来衡量、启用和加强你的影响?

确定正确的技术基础设施的因素

开放数据的基础是使用这些数据和支持数据共享所需的技术基础设施。这包括数据分析和数据可视化工具,以及技术和平台,以便在组织内和组织间轻松、安全地访问和分享数据。

为了确定你的数据计划的技术和平台需求,需要考虑的重要因素包括。

  • 这些数据是否敏感?
  • 你需要保护什么,以及在法律上或合同上达到什么标准?
  • 考虑到道德、声誉和商业因素,你应该保护什么?
  • 提供数据的目的是什么?
  • 向谁提供数据?
  • 使用数据时需要什么程度的实用性?
  • 能否通过应用隐私增强技术达到必要的效用水平?
  • 按照规定的标准,有哪些平台可以促进数据共享和访问?
  • 对于敏感数据,有什么治理框架来控制访问和共享?

GovLab的 "数据责任之旅 "是一个评估工具,旨在以互动方式对此类问题进行审查。

这些因素中的每一个都可能指向一系列的技术需求。例如,数据分析工具可以帮助跟踪趋势,识别问题和效率,以及进行预测。数据可视化工具允许你将你所处理的数据可视化,并对其进行可视化操作。

在必须保护隐私的情况下,应考虑一系列保护隐私的技术,如匿名化和去身份化。差别化隐私是一种行业驱动的技术,使数据在不危及数据保护的情况下更加开放。从概念上讲,差异化隐私使用两个步骤来实现隐私效益。

  • 首先,噪声被添加到每个结果中,以掩盖个别数据点的贡献。噪声足够大,以保护个人隐私,但目的是不对分析师和研究人员提取的答案的准确性产生实质性的影响。
  • 第二,计算每次查询所透露的信息量,并从总体隐私损失预算中扣除。一旦隐私预算被完全使用,数据就会退役,并且不允许进行额外的查询,以避免任何个人隐私被泄露。这可以被认为是一个内置的关闭开关,当系统可能开始损害某人的隐私时,它就会阻止系统显示数据。

当涉及到安全问题时,重要的是要考虑数据生命周期的政策或要执行的状态,以及实现你的组织的安全目标的正确机制。控制对数据的访问并确保那些被授予访问权的人得到授权和适当的认证是至关重要的,但根据数据和数据的使用方式,可能需要采取额外的技术措施。保密计算有助于保护云中的敏感数据,它通过使用中的数据加密提供安全,在数据被处理时为你的数据提供额外的保护,并使各组织之间的协作得到加强。

简介。隐私增强技术如何帮助评估远程学习对青年学生教育的影响

在COVID-19大流行的8个月后,开放数据研究所和微软发起了一个教育开放数据挑战,研究向远程学习过渡对年轻学生教育的影响。

为了让挑战赛参与者获得新的相关数据集,微软公布了美国宽带使用百分比数据集,包括县级和邮政编码级的数据集,这些数据来自我们收集的匿名数据,是我们为提高软件和服务的性能和安全性所做的持续工作的一部分。邮政编码级别的数据集提供了一个邮政编码内家庭宽带使用百分比的细化视图,因此我们采取了额外的步骤来确保数据的隐私保障。我们应用了差异化隐私,在数据汇总中加入了噪音。BroadbandNow也参与其中,首次提供了其县级价格和宽带供应商数据。

教育开放数据挑战赛产生了有洞察力的提交和分析,并对数据进行了组合和可视化。该挑战还有助于强调如何在保护隐私的情况下提供更多的开放数据。

 

阅读更多关于教育开放数据挑战的信息。

 

资源 领导力

数据管理人学院

对于那些寻求利用数据进行社会创新的领导者来说,开放数据政策实验室的数据管理人学院。为解决公共问题制定数据再利用战略,提供了一个自我指导的学习计划。

数据成熟度评估

社会部门组织可以使用data.org的数据成熟度评估工具来帮助衡量和了解你的组织今天的状况。

机会

数据生态系统图谱

关于数据生态系统图谱的练习,请访问开放数据研究所的数据生态系统图谱。工具和指南

数据景观游戏手册

欲了解更多关于评估数据景观和你的数据倡议所处的环境,包括确定你的倡议所要解决的问题,请访问开放数据研究所的数据景观游戏手册

人才

培训计划

当涉及到提高现有人才的技能或磨练现有人才的技能的培训计划时,有各种资源可以利用。

  • 针对数据分析师的LinkedIn Learning和Microsoft Learn课程。LinkedIn Learning的自定进度课程由行业专家教授,而Microsoft Learn课程提供简短的分步教程,基于浏览器的互动编码和脚本环境,以及基于任务的成就。
  • 关于数据和人工智能基础知识的微软认证。行业认可的微软认证帮助人才验证他们的技能和能力,以便在使用微软技术的情况下履行职责。
  • 非营利组织的微软数字技能中心。TechSoup课程和微软之间的合作,专门为非营利组织提供的微软产品培训,包括专注于Excel、Power BI等课程。
  • 通过微软商店提供的微软研讨会和培训课程。这些针对企业和专业人士的免费现场培训课程包括介绍性和深入的课程。
  • 微软Viva学习。作为Microsoft Viva Learning的一部分,可在Microsoft Teams中进行按需培训。
  • MySkills4Afrika倡议。通过MySkills4Afrika,来自世界各地的微软员工自愿贡献他们的时间、才能和专业知识,帮助支持非洲各地的个人和组织。

数据技能框架

关于其他资源,请参考开放数据研究所的数据技能框架

治理

数据伦理画布

开放数据研究所的数据道德画布是一个有用的工具,用于开发和评估数据的使用方式。

数据大会

GovLab的 "数据大会 "提供了一个模式,通过直接审议,共同创造数据获取和再利用的原则和条件。

伦敦数据宪章

2021年底发布的《伦敦数据宪章》是社区治理行动的一个例子。

技术和数据

数据责任之旅

在评估一个组织的数据合作或倡议的技术和资源需求时,GovLab的数据责任之旅是一个工具,概述了在数据生命周期的每个阶段需要考虑的机会和风险。

智能噪音

微软与哈佛大学领导的OpenDP倡议合作,发布了SmartNoise,这是第一个用于差异化隐私的开源平台。任何人都可以开始利用这个平台,将他们的数据集广泛提供给全世界的其他人。开源代码和例子可在GitHub上找到。

机密计算

保密计算有助于保护云中的敏感数据,它通过使用中的数据加密提供安全性,在数据被处理时为你的数据提供额外的保护。在这里可以找到保密计算的有用介绍,以及这里的示例项目。

阿兹维尔数据共享

微软有几项技术支持在各种使用情况下更多地开放数据,如Azure数据共享,它使企业能够简单和安全地与多个客户和合作伙伴共享数据,并为企业提供将内部数据与合作伙伴数据相结合以获得新的见解的能力。

GitHub

GitHub是世界上最大的软件开发和代码托管平台。GitHub经常被用于数据项目,特别是较小的数据集、协作版本的数据、与代码共存的数据以及机器学习工作流程。GitHub支持以各种格式呈现数据和笔记本。