2021年11月25日,北京数牍科技有限公司(以下简称「数牍科技」)宣布完成3.08亿元人民币Pre-A及A轮融资,本轮融资由GGV纪源资本、上海人工智能产业基金、深创投联合领投,老股东红杉中国跟投,恒生曦域产业基金、理工创动、华盖资本、将门创投等机构跟投,INP麟华殷资本担任本次独家财务顾问。本轮资金将用于公司隐私计算底层核心平台的持续研发以及更丰富数据协作场景的产品化落地。
GGV纪源资本管理合伙人李宏玮表示:“数据已经成为各行各业的核心资产和价值,但同时对数据隐私的保护越来越严格。数据作为一种特殊的资源,需要流动起来才能产生价值。不过这种流动不是数据本身的共享,而是数据价值的流动。因此隐私计算有机会成为数据流通的基础设施,实现数据的,‘可用不可见’,既能充分挖掘数据共享的价值,也能保护隐私与安全。GGV认识数牍两年来,看到了管理团队快速的成长和进步,把海外经验和前沿技术落地到本土场景中。我们看好数牍带领隐私计算行业发展。”
数牍科技成立于2019年初,在国内较早以系统性隐私工程视角和基于协作场景的产品来落地隐私计算,并与合作伙伴共同推进隐私计算的多个首次突破。成立的两年时间内,数牍与三大运营商、银联、工商银行、北京银行等多家国央企、金融机构、头部互联网公司及其对应各行业的数据协作生态企业达成合作,覆盖金融、营销、风控、医疗等场景,积累了近百个数据协作产品和模型。
2020年上半年,数牍科技在行业内率先落地运营商场景,并成为联通数科(原联通大数据)唯一一家隐私计算平台技术提供商,与联通共同完成行业首个TB级隐私计算商用项目落地,目前仍在持续支撑联通数科亿万级数据量在生产环境中的流通与协作。2021年,数牍参与了深圳数据交易所关键技术预研,与深圳数据交易所共同探索数据要素市场建设,并提供数据流通环节中的隐私计算技术平台支撑。同时,数牍还成为上海数据交易所首批签约数商,北京国际大数据交易所联盟首批成员单位。
数牍科技积极参与公安部、工信部、国家金融科技测评中心等国家部委和权威机构的多项认证,成为行业首批通过信通院金融场景隐私保护计算平台测评的公司,并积极参与推动隐私计算技术的行业标准设定和技术落地——与中国信息通信研究院、中国电子技术标准化研究院、北京大数据中心、中国电子工业标准化技术协会信息技术应用创新工作委员会等多家机构合作并编写行业白皮书。
隐私工程与研究并进,打造安全高性能、自主可控的数据要素流通基础设施
数牍科技创始人宋一民毕业后在Juniper担任安全工程师;之后加入微软Azure,成为存储和计算早期团队成员,参与了Azure Cloud从零到一的搭建过程;在微软积累了五年多云计算经验后,宋一民加入Facebook ads,主导了Facebook收购instagram后的数据打通等大型数据工程项目,并在内部发起Facebook和多个世界五百强公司基于多方安全计算的数据协作项目。云计算、数据工程和隐私、安全十多年的经历,让其对隐私计算深厚的技术栈有更深刻的理解和全局视野。联合创始人蔡超超博士毕业于UCLA,是机器学习和联邦学习领域专家,曾获得Facebook Distinguished Equity(杰出贡献奖)。
展开全文数牍的工程团队覆盖密码学、联邦学习、分布式计算、云原生、数据科学和数据工程、安全等领域,来自华为、字节跳动、Facebook、Google、Amazon、Microsoft等国内外顶尖的科技企业。有Google Cloud BigQuery的大数据系统架构师,有曾在Facebook 隐私基础构架组(Privacy Infrastructure)从零到一参与隐私工程系统性搭建的数学和密码学科班工程师,有Compass等云原生前沿企业的基础架构负责人,有华为硬件安全资深专家等,并有多名ACM获奖者。产品和销售团队由来自金融、营销、风控、医疗等行业头部企业的一线专家组成,行业积累和场景理解深厚。从最初的宋一民、蔡超超两个人到目前的一百多人团队,“我们有超过二十多个工程师都是放弃硅谷高薪带着家人回到祖国,我们希望将隐私工程技术栈各个关键模块的人才引回祖国,并与国内的技术和行业专家共同打造国产自主研发的、具有核心知识产权的隐私工程平台。”
相较于作为协作关键环节的“隐私计算”,“隐私工程”更能表达数牍团队对数据流通全生命周期的愿景与理解。隐私工程是一套从底层计算及网络资源到最上层数据产品及应用的工程体系、贯穿对数据流通全生命周期的理解,要在严格的隐私保护和数据安全基础上,做好系统效率、网络成本、用户体验的平衡;也需要细节详尽的工程技巧,包括敏感数据检测、匿名技术、数据追踪等技术运用,甚至要具体到诸如用户标签分类在隐私保护和准确度间的权衡问题。
隐私工程的思想也体现在数牍科技全自主研发的隐私计算平台Tusita上:1)在“计算分布式,流通可监控”的架构设计,原始数据及模型在本地进行分布式处理,监控节点能实现开放透明的流通可视;2)将性能优化做到极致,实现工业级部署和落地。目前 Tusita在十亿级数据量协作场景和高并发、高实时性环境中,能够进行毫秒级响应,满足多种复杂场景的业务需求; 3) 开箱即用的产品体验和可插拔的兼容性。可视化、针对不同的应用场景丰富的产品和模型支持,让用户上手即用、将使用门槛降到最低。同时平台充分考虑了各类数据基础设施和治理产品工具的对接,降低不同类型数据的接入成本;4)贯穿数据全生命周期的工具链支持。从数据安全和隐私治理到下游协作计算,数牍研发了多个易用且解决痛点的工具、贯穿数据流通全链路,未来也会进一步开放给生态用户。
隐私工程扎实落地场景的同时,数牍前沿研究团队也实现了计算机体系架构层面的硬件突破。不同于现有的TEE或硬件加速方案,这是一套通信和体系架构层面的创新,在大幅度提高计算性能的同时,能进一步解决数据投毒、计算不可信等问题。
从协作场景出发的数据产品矩阵和模型库
数牍从成立初期就开始搭建行业专家组成的产品与场景团队,探索数据协作场景并进一步抽象为数据产品和模型。在宋一民看来,通过基于协作场景的数据产品或模型才能让隐私计算真的被用起来发挥作用,但不是把传统的数据产品用隐私计算技术重新做一遍,其更大场景在于增量协作场景的价值创造。数牍产品和场景团队两年间探索了数百个协作场景,抽象了数十个通用产品和近百个模型,包括风控反洗钱、销售线索去重和线索评级等产品,已落地多家头部车企、头部金融机构、互联网公司和新经济企业。其中不少产品还是行业基建类型的首创。
成人达己,与合作伙伴共建数据协作生态
两年来,数牍与三大运营商、中国银联、中国工商银行、北京银行等行业头部企业都展开了深度合作,协作其与上千家生态企业通过隐私计算进行数据协作。数牍的第一步是通过安全高性的隐私计算基础设施和可落地的数据协作产品,帮助头部企业及其数据生态建立连接和协作,并打磨隐私隐私计算平台Tusita的易用性、稳定性和工具链生态。未来随着数据要素市场的进一步成熟,将进一步开放平台隐私工程能力和工具链降低协作门槛,促进中小数字化企业间的协作,让数据不再成为AI的制约瓶颈。