大数据 > 原创蚂蚁金服凭什么发布全国首个共享智能联盟标准?

原创蚂蚁金服凭什么发布全国首个共享智能联盟标准?

2020-05-04 13:30阅读(65)

在最近的一系列“共战”疫情现场直播中,技术局将组织和发布“公共服务技术”官方帐户。 今天的安排来自蚂蚁金服的高级标准化工程师Park Xinyang,他将为所有人

1
在最近的一系列“共战”疫情现场直播中,技术局将组织和发布“公共服务技术”官方帐户。

今天的安排来自蚂蚁金服的高级标准化工程师Park Xinyang,他将为所有人解释共享智能标准和共享智能技术的实施实践。 这里是演讲:

大家好,我是蚂蚁金融技术战略发展部的朴信阳。 不久前,以蚂蚁金服为首的共享智能联盟标准在中国人工智能产业发展联盟AIIa中正式发布,这也是中国第一个共享智能联盟标准。 今天,我将主要解释该标准。 同时,我将在这里与您分享共享智能的技术实践。 今天的共享主要分为三个部分,第一部分解释相关标准的分类和价值,第二部分解释共享智能的标准,第三部分介绍共享智能的应用实践。

标准的分类和值

标准的分类分为四类。 首先是级别,然后是属性,然后是对象,最后是自然。 按级别划分,我们分为国际标准,国家标准,行业标准,地方标准和企业标准。 按照属性,我们分为技术标准,管理标准和工作标准。 按对象划分,分为基本标准,安全标准,卫生标准,环保标准,产品标准,方法标准,管理标准等。 从本质上讲,我们分为强制性标准,推荐性标准。 当然,强制性标准可能是一些国家标准,并且可能主要针对安全性或隐私保护的方向为企业制定一些强制性标准。 顾名思义,推荐标准是推荐标准,其后是仅适用于国家标准和行业标准的指导技术文件。

标准主要包括技术要求,实施指南,评估依据,管理,基本协议和创新研究。 目前,我们在蚂蚁上要做的实际上是技术要求和创新研究的标准。 由于蚂蚁的创新技术仍然非常好,其中很多都是创新技术,因此我们希望将蚂蚁的创新技术出口到外界,与此同时,我们对与相关技术感兴趣甚至合作。 公司制定标准。

我相信很多观看现场直播的学生都不十分了解该标准,因此我将简要介绍该标准本身的价值,这体现在四个方面:

在技术领先方面是第一 ,因为它基于强大的技术研究实力,所以可以通过标准来指导技术方向,或者输出我刚才提到的出色的技术实践。

的第二个方向是参与标准和技术政策的制定,这可以促进健康的市场规则。

推出了全文

的第三个方面,以关注主流为目标,引导业界关注主流标准,并防止由旁流标准引起的市场分散化。 最后一个关于工业生态学。 联盟就像一个工业生态。 在行业本身的共识基础上,联盟标准组织可以构建行业生态,促进技术商业化的发展。 在通过规范工作引领行业发展的过程中,可以提高公司的技术影响力和品牌价值,从而打破产品进入市场的壁垒。 同时,实现ICT网络互联,提高相关产品研发质量,最终促进产业链上下游合作。

共享智能标准的解释

刚才我们也说过,今年3月30日,共享学习系统的技术要求已在AIIa联盟中正式发布。 蚂蚁金服与八个财产,学习,研究和使用机构共同领导了该标准的研究和开发。 这八家机构分别是中国联通,中国通信科学研究院,中国电信,阿里巴巴集团,北京大学,中和农信,北京百度网通技术有限公司和运从科技集团有限公司。感谢这八家公司对 我们的标准身体。

标准的开发和发布花费了大约一年的时间。 从去年5月开始,我们花了很长时间收集内部需求,并终于在今年3月30日发布了内部需求。 我想简单介绍一下标准制定的步伐和过程。

首先是关于标准化要求的收集。 在收集内部标准化要求之后,我们在相关联盟和协会中申请标准项目。 在成功建立标准之后,我们将编写标准本身的草案。 在蚂蚁方面,该标准草案主要由标准化的学生编写,技术专业的学生将提供相应的技术帮助。 标准草案完成后,我们会将其提交给联盟或协会征求意见。 该意见主要针对联盟或协会的成员,我们将共同努力建立标准。 经过大约两三轮的咨询,我们将进入提交阶段以供审核。 整个手稿基本上已经成熟。 在联盟技术委员会审核了

之后,我们将进入提交阶段以供批准。 基本上,该标准可以发布给公众。 在最终草案之后,我们的标准将被发布,然后到标准实施过程中。 该标准的实施可能涉及一些技术更新或某些新要求,这又可能导致该标准的修订,这是整个标准制定的节奏和过程。 接下来,我想谈谈共享情报的技术背景,以及为什么我们应该成为共享情报的标准。

随着数据岛的突出问题,数据共享变得越来越重要,但是仍然存在一些与非法交易和滥用数据泄漏有关的问题,公众和政府越来越重视数据隐私保护 。 我们知道,欧盟的gdpr法也已经正式执行,许多国家正在努力效法。 对数据隐私和安全的关注已成为一种趋势。 在安全,隐私和监管的要求下,如何设计相应的框架来实现数据的多方协作和授权? 这需要更准确和有效的模型和决策,以进一步释放数据价值,然后尝试建立相应的标准。 目前,我们知道人工智能的问题是鱼和熊掌不能兼得,隐私和可用性也无法考虑。 如果要让AI系统发挥作用,则可能必须先牺牲隐私,但是在许多实际情况下,如果您既不能兼顾隐私又要兼顾可用性,则将导致登陆AI的许多困难 。 例如

,让我在这里举一个例子。 一是贷款风险控制。 如果用户想去银行贷款,他首先要去银行A。银行a根据一些本地数据判断这是一个坏人。 我们不能给他贷款。 此人去了银行B,但是银行B没有银行a的数据,因此银行B可能会将贷款提供给用户本人。 实际上,这种矛盾无处不在,这都是由于数据不流通造成的。

让我们看一下这张照片。 在实际环境中,某些地方存在一些临时连接,但是大多数数据已断开连接或断开连接。 我们的目标是在通过技术保护数据安全的前提下,走过数据孤岛,用技术手段解决技术难题,实现数据共享和价值转移。

用于共享情报,我们希望实现无形数据可用性的目标。 在有多个参与者且每个数据提供者与平台之间相互不信任的情况下,我们可以从多个参与者的信息中学习,以确保不泄露每个参与者的隐私并且不滥用数据。 接下来,我要介绍标准本身的范围和框架。 我们在该联盟中发布了共享情报标准,该标准主要用于制定共享学习系统的技术要求,以标准化共享情报的定义。 包括技术框架和过程,技术要求和安全要求。 该项目本身也适合指导共享智能系统的设计,开发,测试,使用,操作和维护管理。 我们主要将这些方面包括在

标准中。 一方面,我们将概述共享智能。 稍后,我将作简要介绍,包括基于受信任执行环境的共享智能系统和多方安全计算的共享智能系统。 这两个部分包括不同的技术框架,功能组织和技术过程。 同时,还需要共享智能系统的技术和安全性。 在附录中,编写了两种方案和示例,包括智能风险控制和智能营销。 在此介绍共享机器学习的定义。 首先,这种共享智能是一个学习范例,其中多个数据提供者参与其中,并且平台可以在每个数据提供者与平台之间互不信任的情况下收集或协助聚合多方数据信息并保护多方数据隐私。 派对。 在此标准中,我们已经编写了两个共享的智能方案,包括tee(可信执行环境)和MPC(多方计算)。 除了这两种方案,实际上,我们也在其他方向进行技术方案的研究。 将来,我们会将它们添加到我们的标准中。

首先介绍了可信执行环境方案。 可信执行环境主要用于解决多个数据提供者共享智能时的隐私保护问题。 其技术框架主要由计算平台和多个数据提供者组成。 我们可以看到计算平台,包括融合学习,功能模块和身份验证模块。 对于每个数据提供者,它包括本地数据,用于数据处理和加密的模块以及用于认证的模块。 数据提供者在处理完数据后,通过身份验证模块的公钥对其进行加密,然后将其上传到计算平台。 计算平台的认证模块本身通过私钥解密加密的数据,然后将其发送到融合学习模块。 解密之后,通过机器学习融合多方数据,以确保不泄露数据的隐私性。

是一种依赖可信硬件的方案。 它通过数据加密集中传输到我们可信赖的平台。 对于已经在云上的某些组织,他们可以将所有内容存储在云上,并在云上部署所有技术。 这样,可以非常快速方便??,同时可以达到很好的隐私保护效果。 这是三通的技术方案。 用于MPC的

技术解决方案,该技术架构包括模型平台和