中国约束互联网算法的开创性举措可能并不现实

中国网信办最近公布了属于中国一些最有影响力的互联网公司的核心算法的摘要。

图片来源:THOMAS PETER/REUTERS

中国强大的互联网监管机构在管控自动化系统方面已经迈出了第一步。自动化技术能够塑造互联网,中国政府的监管具有开创性,但也面临着不确定性。

本月早些时候,中国国家互联网信息办公室(简称:网信办)公布了30种核心算法的概要信息,这些算法来自于中国20多家最具影响力的互联网公司,包括TikTok的所有者字节跳动(Bytedance Ltd.)、电子商务巨头阿里巴巴集团控股有限公司(Alibaba Group Holding Limited, 9988.HK, BABA)以及在中国广为使用的的超级应用微信的所有者腾讯控股有限公司(Tencent Holdings Ltd., 0700.HK, TCEHY)。

这一里程碑标志着监管机构首次系统性地要求互联网公司披露各自平台所用技术的信息,这些技术已经显示出根本性地改变流行文化和政治等各领域格局的能力。这也使中国政府走上一条在一些技术专家看来很少有政府能应付的道路。

公开版本的文件以简单的语言解释了特定算法使用的数据类型及其对数据的处理。其中许多公司针对其算法披露的细节少于Facebook自愿向用户披露的关于其如何在新闻源中对内容进行排名的信息。

完整的文件没有公开,据知情人士称,完整的文件里包含了对数据和算法的更多描述,包括一些被认为属于商业机密的信息。根据公开文件里阐述的网信办要求企业提供的内容,里面还包含企业对潜在安全风险的自我评估。

字节跳动是提交数据和算法信息的互联网公司之一。

图片来源:VCG/GETTY IMAGES

这些互联网企业是遵照3月份生效的一项新规定提交这些信息的;该规定赋予了监管部门整顿算法负面影响的职责,这些负面影响包括放大有害信息、侵犯用户隐私和侵犯行业从业人员合法权益等。该规定还要求算法积极传播“正能量”,这是习近平执政时期提升公众舆论的一种说法,被用于对中国共产党的正面宣传。

并非只有中国政府在试图限制互联网所倚赖的算法的影响力。美国和欧盟的监管机构也在努力应对类似问题,比如如何保护青少年的心理健康,以及遏制虚假错误信息在网上的快速传播。

不过,中国这项法规代表了直接监管算法的最果断尝试。最终该规定可能适用于任何在中国使用算法技术的服务。

斯坦福大学(Stanford University)数字中国项目(DigiChina Project)运营负责人Graham Webster说,中国正在做其他国家从未尝试过的事情,其他国家可以从中学习正反两方面的经验。数字中国项目追踪中国的数字政策动向。

在北京的一个菜市场,一位顾客使用微信的二维码进行支付;微信是中国的万能应用。

图片来源:GREG BAKER/AGENCE FRANCE-PRESSE/GETTY IMAGES

算法专家表示,这个尝试的一个重要问题是,在实际操作中直接监管算法是否可行。

如今大多数互联网平台算法都基于一种被称为机器学习的技术,这种技术借助庞大的数据库来学习预测用户行为,从而实现定向投放广告等决策的自动化。与包含工程师编码的明确规则的传统算法不同,大多数机器学习系统都是黑匣子,很难破译其逻辑或预测其使用的结果。

知情人士透露,中国政府对监管算法的兴趣始于2020年,当时为避免在美国被禁用,短视频平台TikTok开始寻找一个美国买家。知情人士称,中国监管部门宣布对信息推荐技术实施新的出口管制后,几个竞标方对TikTok失去了兴趣,这让中国政府意识到了算法的重要性

知情人士称,网信办迅速起草了一部关于算法推荐系统的新规,主要是试图了解中国的科技公司如何塑造网络言论以及如何遏制这种影响。

到2022年1月,这部规定已经准备就绪,并于3月1日起施行。Webster说,对于有时会搁置立法草案多年的中国政府来说,这是很快的节奏。

网信办没有回复记者的置评请求。

布朗大学(Brown University)计算机科学教授Suresh Venkatasubramanian表示,中国的法规因其实施范围和咄咄逼人的力度而震惊了美国科技政策界人士。Venkatasubramanian曾担任白宫科技政策办公室的助理主任直至本月。

去年秋季Facebook的举报人豪根(Frances Haugen)在国会主张对该社交媒体公司的算法加以限制。Venkatasubramanian称,这在当时引起了美国政府一些人的好奇心。然而,监管机构担心这会为国家控制信息流开创先例。

他说:“一旦走上这条路,就很难回头了。”

面对同样的问题,欧盟监管机构立场更加强硬,但还是避免了采取政府直接审查算法的行动。

今年7月,欧洲议会通过了一项立法,要求谷歌(Google)和Facebook等大型平台定期评估各自的系统性风险,如是否在传播非法内容等。这些公司可自行选择如何应对这些风险,包括调整算法,但必须接受独立审计,以证明其解决方案确实行之有效。

新规要求算法促进“正能量”,这个词指的是提升公众舆论和用户中国共产党的内容。

图片来源:SHELDON COOPER/ZUMA PRESS

有政策专家表示,欧盟法律的实施和执行细节含糊不清。总部位于柏林的非营利性研究和倡导组织AlgorithmWatch的执行董事Matthias Spielkamp说,要解释这项法律,将需要多年的努力,甚至可能对簿公堂。

中国的做法也依然模糊。从理论上讲,中国关于算法推荐的管理规定可以让政府完全控制协调网络空间以及越来越多的线下生活的关键机制。但一些科技专家们表示,中国很可能会被自己的野心绊倒。

社交媒体推荐引擎代表了一些最复杂的算法系统,Facebook和TikTok等应用使用数百甚至数千种算法来确定推荐哪些用户看哪些信息。

与美国政府机构合作检查公司算法的算法审计员Cathy O'Neil表示,掌握这些系统的详细文档,甚至是代码,还不足以了解这些系统将如何影响像网络言论这样广泛的领域。她说:“实际上重要的是算法处理的数据。”

数据随着每次用户发帖和互动而变化,据O'Neil说,即使能够完全掌握数据,科技公司的工程师仍难以精确调整其系统的行为。她说,像推广更多的宣传这样有针对性的改变是可行的,“但实际上不可能控制一个推荐引擎的整体行为”。

技术分析人士和业内人士还质疑网信办是否具备技术专长来执行自己的规定。网信办最初是一个宣传部门。

知情人士说,在中国这部新规生效后不久,字节跳动负责政府关系的员工和算法工程师与网信办的官员会面,进一步解释说明他们提交的文件。知情人士说,在其中一次会面中,网信办的官员表现得对技术细节知之甚少,公司代表不得不使用比喻加上简单化的语言来解释推荐算法如何工作。

知情人士称,公司没有被要求提交代码或用户数据。

中国政府去年发布的指导方针要求多个机构扩充人员对算法进行监督检查。

总部设在北京的战略咨询公司Trivium China的科技政策研究主管Kendra Schaefer说:“他们正试图构建工具,雇用人员,并掌握技术专长来应对这类问题。”Schaefer说:“因此,在未来5到10年内,这方面的执法工作将慢慢加强。”