论文详情

算法型信息分发:技术原理、机制创新与未来发展

关注“壹学者”微信 >>
125    
第一作者认领本论文 邀请作者认领本论文

第一作者:喻国明

作者简介:喻国明,教育部长江学者特聘教授,北京师范大学新闻传播学院执行院长,中国人民大学新闻与社会发展研究中心主任; 韩婷,北京师范大学新闻传播学院硕士生

人大复印:《新闻与传播》2018 年 08 期

原发期刊:《新闻爱好者》2018 年第 20184 期 第 8-13 页

关键词: 算法型信息分发/ 场景适配/ 人机交互/ 规制创新/

摘要:算法型信息分发给传播领域带来巨大而深刻的革命性改变,必然是一种重塑传播规则、改变人们认知的全新规则与机制的建构与改变。算法与传媒业的深度融合,不断形塑着传媒业的实践,给信息采集、制作、分发等流程带来了全新机制与规则,同时也给传播伦理造成了相当大的影响。作为一种越来越主流的信息分发形式,其未来发展必须着力于解决现实发展中所存在的问题与隐忧,才能开辟其登堂入室的光明前景。

一、问题的提出:算法型信息分发的强势崛起与社会质疑

人类的信息分发模式迄今为止大体上经历了三个主要的发展类型:(1)倚重人工编辑的媒体型分发;(2)依托社交链传播的关系型分发;(3)基于智能算法对于信息和人匹配的算法型分发。

这三种类型作为信息分发的主流模式依次出现,各有其特色与擅长。譬如,媒体型倚重人工进行信息的专业化处理和加工,这种分发模式可以解决社会的共性需要,把那些对于全局、对于所有人具有普遍意义的信息筛选出来,并以点对面的方式传播出去。它的价值在于解决了“头部信息”的社会化分发。但是它无暇顾及人的分众化、个性化及偶然性、体验性及高场景度的信息需求。于是便出现了依托社交链传播的关系型分发模式:你的朋友、你关注的人帮你推荐、过滤信息,他们的评论、转发形成了一种信息筛选机制。社交分发模式最大的价值是在人类的传播史上第一次激活了大众传播时代那些被忽略的极大量的“长尾信息”,形成了对于信息服务的“利基市场”,实现了信息分发的“千人千面”——不同的人通过不同的“朋友圈”有了个性化的信息世界。2010年Facebook主页访问量超过Google,可以看作是社交驱动的“关系型分发”在全球成为主流的“拐点”,所谓“无社交不传播”即是对关系型分发的一种不无夸张的描述。

但“关系型分发”的问题在于无法解决用户社交关系爆炸情况之下的内容生产源的爆炸所带来的“信息超载”以及基于社交关系的推荐质量不断降低的问题。经验表明,在微信朋友圈中养生、微商、晒娃晒吃类的无效信息越来越多;微博上则是大V和营销类账号占据了主体流量——有研究表明,在微博平台上,90%以上的内容是由3%左右的“大V”生产和分发的。在此背景下,算法型信息分发模式便应运而生,渐成潮流:现在人们随便打开一个网站或资讯APP,都会有“个性推荐”或“猜你喜欢”之类的栏目,系统会根据你的浏览记录和阅读爱好,自动为你推荐内容。第三方监测机构易观发布了一个具有标志性意义的数据:早在2016年,在资讯信息分发市场上,算法推送的内容已经超过50%。它意味着,我们现在接触到的信息,主要是由“智能算法”为我们搜索和推送的。“算法型”信息分发之所以“流行”,有分析者认为是因为算法对流量的分配独立于社交关系,不被“大号”垄断;算法能够处理的信息量几乎没有上限,能够更好地激活、适配“汝之毒药,我之甘饴”的长尾信息;算法能够对用户的社交推荐机制进行二次过滤,优化推荐结果。概言之,算法型实现了对于海量信息价值的重新评估和有效适配。“汝之毒药,我之甘饴”意味着你觉得不感兴趣甚至是垃圾的信息,对于我可能极有价值。于是,信息价值不再有统一的标准,不再有重要性的绝对的高低之分。对刚生下宝宝的妈妈来说,PM值绝对比英国脱欧更重要。对旅游者来说,当地的天气信息绝对比当地的房价更重要。在算法的驱动下,每个人都有了自己的头条,这一点得以实现。整个信息世界大一统的秩序被打破。

但也正因为如此,算法型分发模式站在了风口浪尖上。《人民日报》曾连续三天撰文从内容生产、信息分发和社会创新等角度对某算法型信息分发平台进行了全方位立体式的批判。公允地说,这些批判在现实状况下不无道理。比如,在现在的算法还不足够“聪明”的情况下,用机器智能去完全替代人的“把关”,这样的资讯“守门人”是否可以完全信赖?再比如,由于算法型信息分发更多地建立在对于人们的直接兴趣和“无意注意”的信息需求的挖掘上,它的直接后果是:对于人们必需的那些非直接兴趣和需要“有意注意”所关注的信息的忽略所导致的“信息茧房”问题,等等。这些社会质疑对于算法型信息分发是不能不面对与正视的。

更进一步说,信息的社会性分发历来被视为是一种政治权力,一直以来这个权力都是牢牢地掌握在政治和商业巨头手中的。现在,在技术驱动和现实需求拉动的双引擎下,基于大数据与人工智能的推荐算法系统的引入,对传媒领域来讲,实质上是一种传统的寡头权力逐步让位于技术逻辑主导的用户权力的过程,这一技术逻辑与分发范式不断形塑着传媒业的实践,也给信息的采集、制作、分发等流程带来了全新的指导理念,同时也对信息的社会传播效果及传播规范与伦理造成了深刻的影响。这是一个我们不能不认真、严肃对待的重大课题。

二、算法型信息分发的技术原理:主流推荐算法的类型及系统架构

随着信息技术和互联网尤其是移动互联网的发展,人们迅速从信息匮乏的时代跨入了信息过载和泛滥的时代。在这个信息海量的时代,无论是信息消费者还是信息生产者都遇到很大的挑战:对于用户而言,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;而对于信息生产者而言,让自己的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费和信息生产者的双赢[1]。换言之,推荐的精髓在于,我想要的你都有,你给我的都是我想要的。

目前,推荐系统有三大主要类型:

(一)协同过滤推荐(collaborative filtering recommendation)

它包含两种主要的推荐技术——基于记忆的(Memory-based)协同过滤和基于模型的(Modelbased)协同过滤。前者假设如果两个用户过去对产品有相似的喜好,那么他们现在对产品仍有相似的喜好,后者则假设如果某个用户过去喜欢某种产品,那么该用户现在仍喜欢与此产品相似的产品。[2]因此,前者利用用户历史数据在整个用户数据库中寻找相似的推荐项目进行推荐,后者通过用户历史数据构造预测模型,再通过模型进行预测并推荐。[3]基于记忆的协同过滤可以有效挖掘用户的潜在需求,个性化程度高,在众多互联网平台得以应用,比如亚马逊、Netflix、Hulu、YouTube的推荐算法的基础都是该算法。[4]研究数据表明,亚马逊35%的销售额与推荐系统有关。[5]但是基于记忆的协同过滤推荐依赖系统内整个用户历史数据库作为其推荐系统的原料,当数据严重稀缺时,会存在冷启动(这里所谓的冷启动是指对于某APP的新用户,算法系统缺少其历史数据,难以通过算法准确了解和把握其需求的状况)差、推荐精准度下降等问题。而基于模型的推荐可以有效地解决这一问题,该算法根据训练集数据学习得出一个复杂的模型,来预测用户感兴趣的信息。[6]基于模型的推荐虽然提升了预测的准确度,但也存在建模复杂和冷启动差的缺陷。[7]

(二)基于内容的推荐(content-based recommendation)

上一篇

下一篇

*非会员只能阅读30%的内容,您可以单篇购买,也可以订购全年电子版,或成为壹学者高级会员,畅用壹学者站内优质学术资源和服务。

近期0位学者阅读过本论文

回应区(0条)

确定

回应