现如今,我们生活在“信息化”时代,信息如洪流般淹没了我们,使我们深陷信息焦虑、信息过载、信息疲劳的困扰;信息又是“碎片化”的,无孔不入又无序杂乱,我们是否意识到,在依托大数据系统的组织与传播模式下,碎片可以为我们描绘出事物的全貌?
在互联网行业,“大数据”更是盛行已久,大数据如同波涛汹涌的海洋,在这个数据大航海的时代,我们会扮演什么角色?作为“内容”/“信息”相关的产品经理,又有何作为?如何梳理与思考?
(OTA老鸟,案例和思路围绕“酒店”展开)
本文整理思考如下5个词语:信息、数据、消息、知识、内容
概念:泛指人类社会传播的一切内容;
人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。
继续深入,信息到底是什么?是物质还是能量?好像都不是。
信息就是信息,是构成我们世界最普遍的存在之一。
我们无时不刻在接收着各种信息,有长or短,有正确or错误,有重要or无价值;
思考一下“信息”可能的属性:
(1)信息熵
信息是否有判断标准?引入本文最重要的概念:信息熵
可简单认为是:信息杂乱程度的量化描述
“熵”这个词在热力学、生物学等应用广泛,主要体现对应内容的杂乱程度。
举个栗子,如果中国男子国家足球队和巴西男子国家足球队比赛,历史交手64次,中国队赢过1次,输了63次(Just举例,相信我们国足还是能在友谊赛逼平1场的o(╥﹏╥)o),暂定认为中国队赢球的概念是1/64,巴西则为:63/64。
那么,中国队赢和巴西队赢,分别对应的信息量为:
因此,中国队和巴西队比赛结果的熵 = 6*1/64+0.023*63/6 =0.1164
熵的数值比较小,可以理解为是一个相对比较明确结果的信息。
信息越确定,越单一,信息熵越小;信息越不确定,越混乱,信息熵越大。
在互联网行业,比如为什么有些信息会导致某薄服务器瘫痪,因为大家觉得该信息发生的可能性很小,信息熵非常大,俗话说的:“信息量”很大!
衍生:任正非的管理哲学,核心就围绕:“熵”展开,灵感来自:“熵减”
任正非把熵从自然科学应用到社会科学,并在华为落地。
(2)信息的确定性
一条信息是否准确、是否明确,需要进行判断,我们很多时候都会遇到难以判定的情况;
信息是否正确,也不是完全0或1的选择,从数学角度,就是概率,比如用“置信度”来衡量。
因此,在信息取值过程中,并不是简单的取A或者取B,更多的需要使用“投票机制”,具体规则的完整性、不同来源的权重与合法性判断、一票否决制等,需合理设置。
(3)信息的质
对比熵衡量了信息“量”,那是否存在信息的“质”?这是个人还在思考的一个问题;
可以想到的是:首先,信息的呈现/传递,是否本身足够代表其要表达的信息,即:“保真”度;其次,信息的精简/冗余程度如何,即:“精简”度;最后,信息的读取/理解便捷性,暂且定义为“友好”度。
一条信息可以包含很小的信息量,但信息本身可能会有重复、冗余等情况,就显得不那么精简;
但冗余信息不一定就不好,在日常语言中,冗余可以辅助理解;飞机系统为了安全会冗余非常多的逻辑备份,而有些看似有损于精炼和简洁的冗余信息反而提升了信息传播的精准性,需要基于具体的场景和目的来看。
另外,再引入一个重要概念:“信息噪声”,笼余并不一定意味着无价值,但如果有“噪声”,则大概率是较差的体验。
同样,一定无噪也不一定是最佳,超级无敌著名数学家:香农,就是他提出了:信息熵的概念,他著名的三大香农定理之一就是有噪信道编码定理,它指出利用纠错编码可以有效地抵消噪声和失真的影响,也奠定了通信发展的基石。
人的大脑在同一时间能处理的信息是优先的,在设计中的“7±2法则”相信大家也不会陌生,单信息的去燥、信息的分类汇总提炼、同一时刻在用户视线范围内给予用户可接收的信息、给予用户的形式等,都需要产品经理去思考。
概念:指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。
数据,可以是连续的值,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字等。
在我们熟悉的计算机系统中,数据以二进制信息单元0,1的形式表示,将我们的信息都存储在数据库中,物理学家约翰·惠勒所说:“万物源自比特”,底层的数据承载了我们的信息。
得益于数据的收集、存储、使用的快速发展,我们正面临大数据的重大时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,这正是一个个数据组合起来创造的巨大威力。
概念:一般来说,新鲜的事就叫消息;“消息”一词还可以指报道事情的概貌而不讲述详细的经过和细节,以简明的文字迅速及时地报道最新事实的短篇新闻宣传文书,也是最常见、最经常采用的新闻体裁。
关键词:新鲜,即:消息有一定的时效性。
大家是否想过,为什么日常总听到的提示或广播是:“你有一条新的消息,请及时查收”,而不是一条信息、一条数据。
同学给你发微信一起出去吃饭是一条消息,你第二天才看到相比于马上看到,这条消息的影响就非常巨大。
消息一般有发出对象与接收对象,新闻就是最主要的消息之一,是新闻媒体或对记者比较实时希望传递给大众的消息。
什么是内容?自己一度非常的困惑,在运营的内容可能获得了答案;
先看下两条对“内容运营”的解读:
是否对“内容”有了一定的概念?个人觉得对比“数据”、“信息”,内容更强调:价值。
不管是运营,还是产品,还是任何的内容产出,都是通过创造/生产/编辑处理等,为满足目的而生产出的。
对于电商而已,是为了用户停留/促进转化留存等,主要功能:充分的帮助用户完成决策!
另一个比较好理解的维度是,结合“形式”来一起更好认知“内容”的概念:
任何事物既有其内容,也有其形式,不存在无内容的形式,也没有无形式的内容,内容决定形式,形式服从内容,并随内容的变化而变化。
形式,可以是音频视频,也可以是动画图像,但背后的“内容”可能是相同的。
也有概念:内容是指事物所包含的实质性事物或意义。
不仅仅是一个事物或者描绘,一个艺术作品的表现、基本含义、意味或审美价值也是内容。
内容涉及到我们感受到的感觉的、主观的、心理的和情感方面的意涵。
谈到内容,不可避免想到下属概念:
(1)UGC——用户生产内容
特点是:零门槛、强互动与参与;
旅游行业,不得不提马蜂窝,在各大电商网站中的“点评”是最普遍的存在,可发挥流量优势构建起丰富的内容。
(2)PGC——专业生产内容
具备专业知识的人或专家,一般更专业、有深度,质量更容易保障。
(3)OGC——职业生产内容
从业人员获得劳动报酬,门槛高、职业身份的把关,比如记者的新闻报道。
从整个生态链看,OGC更多站在金字塔尖的位置,PGC负责生产中间内容, 保持内容的质量。UGC则代表最广大的长尾内容,能够充分利用流量优势提升用户参与度。
随时AI时代的到来,增加第4个概念:
(4)MGC(Machine-generated Content)——机器生产内容
阿里的AI设计师“鲁班”已经在一定程度能够替代专业的设计师,当下我们看到的:新闻、报道,可能作者已经是机器人。
在产品经理日常的工作中,是否有遇到过没有足够的信息内容、信息质量无法判定等困难,通过多种方式针对性获取信息,包括爬虫抓取、建立机制引导外部参与者共同生产/维护内容,激励用户反馈等,都可能是可执行的出路。
概念:人类在实践中认识客观世界(包括人类自身)的成果,它包括事实、信息的描述或在教育和实践中获得的技能。
知识,至今也许并没有一个非常统一而明确的界定,普遍的价值判断标准在于实用性,以能否让人类创造新物质,得到力量和权力等为考量。
先看下来自于柏拉图的经典定义:
一条陈述能称得上是知识必须满足三个条件:
(1)一定是被验证过的
(2)正确的
(3)被人们相信的,这也是科学与非科学的区分标准
由此看来,知识属于文化,而文化是感性与知识上的升华,这就是知识与文化之间的关系。
读过《未来简史》的伙伴应该知道,在书中有一个有趣的悖论:知识如果不能改变行为,就没有用处;但是知识一旦改变了行为,知识本身就立刻失去意义。这也体现了知识的属性:是变化的、进步的、能改变人行为的。
如果大家看了一篇文章之后点头称是,然生活照旧,那这篇文章和其他所有类似文章一样,都只是一个信息。只有你看完后,受到启发,并改进了思考问题的方式或者做事的方法,这个信息就转化为你真正的知识。
小时候,很多人的理想都是科学家,希望自己知识渊博;
如今,我们接收了非常多的“数据”、“信息”、“消息”,我们要做的,是更多的吸收思考并付诸行动,才是真正收获了“知识”。
(1)信息熵的应用
不同信息之间,信息熵的大小可能会有很大差异,需定义信息熵的计算,有针对性的呈现告知用户。
信息自身对比维度:比如,X城市的酒店,90%都有WIFI,则“M城市的A酒店有WIFI”这一信息熵很小,普通呈现即可,但“X城市的B酒店没有WIFI”这一信息熵就很大,需重点提示用户。
场景/用户匹配维度:比如时间,一条酒店入住政策:“凌晨到店需XX”;则对于在凌晨时间预定时的用户,需格外重的提示,而非场景用户则一文不值。
比如用户,一条儿童入住政策,对于带孩子的用户非常重要,但对于单人用户的预订一文不值。
不同的维度,信息熵会产出不同的定义和计算,需要产品对于行业/用户/场景有足够的分析和认知,并建立起规范的“信息熵”评估体系。
(2)信息的准确性
准确性是基础,需做好合法性、准确性等的评估判断;
外部的数据源并不是能完全可信的,产品需要建立验证体系来持续的积累与识别。
比如,希尔顿五星级酒店都是有WIFI的,在建立这个认知标准后,若数据源告知此酒店没有WIFI,则大概率该数据是错误的,需标记核实,在持续的运营过程中完善认知/规则,来保障数据的输出质量。
综上,初步的信息流处理应该主要包括以下大环节,供大家参考:
从形式上看:消息,是信息的一种,相比于一般的信息,具备:时效性、有明确的对象的特征;从本质去思考:消息背后,蕴藏了信息,我们需要在接收到消息之后,去获取背后的信息。
比如A给B发消息:“在吗?”,传递的信息可能是:“我想你了”
“消息”相比于“信息”,其特性需要我们在呈现给用户时,做差异性的处理;
且我们需要主要:在不同的场景下,是直接的通过消息呈现给用户,还是委婉的通过消息传递你的信息。
对于“需用户知晓”类的非营销消息,需注意其:时效性、对象,以及内容的明确清晰;
比如,A酒店之前告知用户有WIFI,当信息变更为无WIFI的那一刻,若核实确认变更,对于确认会影响的已下单用户做及时的消息触达告知;而对于未浏览过此信息的用户,“A酒店无WIFI”则为一条普通的“信息”。
首先:先有信息,还是先有数据?
论我们定义的本质的“信息”,作为客观存在,是最普遍的存在;而数据只是人类发明的载体和实现方式,将“信息”存起来。
而当今时间,在互联网计算机世界上,就是有无数个0,1组成了我们的数据,承载了信息。
其次:信息通过数据存储后,如何发挥价值?
答案是:传播
数据在传播后,就行为了我们通俗所讲的“信息”。 (一个是本质的信息,一个是我们通俗讲的信息,不知大家是否理解~~)
数据放在数据库中,就是一条数据,如果不去使用并触达用户,就永远成为不了用户的信息。
就如同一本书,如果你不去阅读,就只是一些数据;而当你阅读了内容之后,它就成了你的信息;但只有你知道了如何改变你的行动,信息才变成了你的知识。
最重要:在日常工作中,我们容易更多的思考信息/数据的“处理”,而过程中的“传递”无处不在,可别忽视了“传递”;
产品经理更需要思考的是:如何保障在传递过程中的保真?
对于做“内容/数据”相关的产品经理,数据库等相关基础知识是必不可缺的,简单罗列几点:
(1)数据存储的结构,决定了数据的顺序和位置关系,有:链表、数组、栈、队列、堆等,不要只觉得数据就是存起来就好了,怎么存储,至少决定了日常维护与不同使用场景的效率,需要找到对应数据最适合的存储结构。
(2)数据字段的具体属性,比如是数值(int)还是字符串(varchar)还是时间(datetime),是否必填、长度限制等,各种细节都需要产品掌握到位。
(3)数据处理方式,ETL(Extract-Transform-Load)过程,用的框架是Storm还是Flink,他们的优劣和特性是什么,处理的速度与效率、实效性要求等,都需要产品有一定的认知,以提升技术协同效率和最终产出数据质量。
(4)会写Sql,当然是做数据产品必不可少的技能。
请时刻记得:本质的信息是什么?在数据处理过程中,是否完整体现了信息的完整性、准确性、及时性、价值等特征,而没有在传输过程中:失真、丢失、增加噪音、信息内容降低等情况。
我们给予了用户非常多的“信息”,更多的是让用户在进行信息的整理与判断。
你看了一篇文章之后点头称是,然后生活照旧,那么这篇文章和其他所有类似文章一样,都只是一个信息;正如用户浏览了我们的页面,没有足够的信息决策,就离开了。
只有你看完一篇文章、了解一个观点之后,受到启发,改进了思考问题的方式或者做事的方法,这个信息才是知识。但我们不能指望用户来自己做深入的启发思考,我们需要提炼出有价值的“知识”帮助用户决策。
给予用户“知识”,创造真正知识的过程是一个为用户创造价值的过程,也更能达成我们的目标。
比如,各类“排行榜”,给予了用户一定的参考并可能改变用户的行为,在处理过程中,需要让用户明确的接收到:被验证、是正确的,这样的明确信心,并让用户能够相信。
比如,我们可以给予用户:“带孩子出游,建议选择带浴缸的房型并自行带好消毒液,入住更舒心便捷”,并在后方添加:“浴缸”的筛选按钮,更好的指导用户的行为。
产品经理日常做的事情,就是从现象中提取本质,输出结果。
经典的“啤酒与尿布”,也许是一个“知识”,但产品还需要更多去思考为什么,还能真正的学习此案例,在日常工作中学以致用。
大家可以想一下,日常的学习看书、听培训、看案例,有多少是记住了这些“信息”,又有多少真正转化为了大家的“知识”。
而我们页面上,提供了那么多的信息给用户,是否可以更好的提炼输出,让用户更高效的接收到知识并促成行为呢?
基于上述所说,信息、数据、消息、知识、内容,这5个词语,大概关系如下:
从产品维度,简单总结为:
现如今,借助触手可及、无孔不入的信息输出和接收工具,人类每天需要面对的新生信息已经超过了过去几千年以来的总和。即使在中国的偏远地区生活的人们,也已经看上了电视,用上了手机。
对于当前信息的发展,个人有个可能不一定特别恰当的比喻:
信息社会就如同当前的汽车与交通,汽车的人均保有量已经越来越高,一方面对应的高速、高架快速路、乡间小道等(信息来源和途径),也都越建越多、越修越好,我们也许能够更快速的到达某一个目的地(获取我们想要的信息),但在这过程中,我们需要及时的掌握交通规则、借助导航防止自己走错路(掌握方法,避免迷失)等;另一方面,身边其他人的小汽车也越来越多、越来越好,你自己是否能够持续的领先,是否能够找到适合自己持续向前的路线(明确自己的目标),不扎堆避免堵车(同质化的人云亦云),也需要更好的保养自己的爱车(方法需与时俱进)、驾驶过程中始终注意安全风险(掌握信息辨别能力),才能更好的到达想要的目的地。
对于旅游OTA来说,解决用户的信息差,是OTA能够存在的最本质原因,这也是为什么OTA更容易促成单体小酒店的生意,而五星级连锁品牌酒店的订单占比很少,这些客人只需要少量的固定品牌酒店,且更关注会员权益积累等,因此OTA酒店的丰富度对他们价值较小。
对我们来说,在整合供应链同时,如何针对我们定位的用户与场景,在用户的搜索(本质是精准查找)/筛选(本质是结果中挑选)/查看信息(本质是信息获取与决策)等核心动作中,适时的给到有价值的“信息”供用户完成决策;
更重要的是如何能够在互联网与信息发展过程中,持续的奠定OTA自身的价值:在信息的更宏观获取、更有效的处理、更有价值的触达用户等方面,紧跟时代节奏和载体(未来讲可能是穿戴设备、汽车等),是行业内的从业者们始终要思考的问题。
最后,推荐阅读2本相关的好书:
Ps:先阅读《编码》应该是阅读《信息简史》的基本前置储备
作者:ElevenWang,微信号:jiajian1005
本文由 @ElevenWang 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。