大数据时代,数字化成为当下各行各业普遍关心的话题,出版业也不例外。出版机构如何实施数据治理?外研社的经验值得借鉴。
该社通过系统化的数字内容、产品和平台,实现了课堂内外、线上线下的数据融通,形成了可量化的用户学情数据指标,让用户需求变得“清晰可见”。同时,数据治理也为外研社的内部管理提供了强大助力,帮助管理层实时掌握业务动态,实现降本增效,构筑起强大的企业核心竞争力。
6月16日,在第29届北京国际图书博览会期间,以“携手迎挑战 合作促发展”为主题的2023北京出版高峰会议举行。
数字化可以说是当下各个行业、各个企业最关心的话题,出版行业也不例外。当下和未来最重要的方向就是数字化,它既是一次重大的机遇,也是一次巨大的挑战。
首先,我们共同梳理一下出版行业的数字化发展,简单总结应该分别处于以下四个不同的阶段:内容数字化,产品数字化,服务数字化和数字化生态的构建。
无论处于数字化的哪个阶段,只要开始服务于用户,就会产生大量可以追溯的数据。当然,我们要确保数据获取和使用的合法合规,要注意维护数据安全。这些在服务用户过程中产生的海量数据是互联网时代+人工智能时代给予我们的馈赠。
为什么这么说?过去,非数字化的产品、服务和生态也服务于万千用户,但是我们和用户的联系看不见摸不着,也无法实时交互和批量回溯,我们和用户之间的关系如同雾里看花,似有若无。
但是现在,因为数字化,我们和用户之间有了实时的、密切的、可累计的双向互动的联系,这些数据是用户在以实际行动告诉我们他们的真实想法、他们对产品的体验、对服务的感受、对教育生态的需求等。我们应该怎样对待用户的这些宝贵反馈?那就是做好数据治理。因此有人说数据治理是数字化转型的“牛鼻子”。
我深以为然。数据作为数字经济时代的生产要素,与传统生产要素相比,它更像一个导师,或者说一面镜子,时时在给生产者、服务提供者提供反馈、帮助及时纠偏。
数据是企业数字化转型的基础,数据治理能够激发出数据的价值活力。数据治理成熟度模型可以映射企业数字化发展的不同阶段。各种数据治理成熟度模型的侧重点和形式虽有所差别,但核心目的是一致的,那就是帮助企业发展一个可靠、可重复和可持续的数据治理流程,从而赋能战略决策,促进数字化与业务体系、管理体系高效结合。
这些能力的提升,又将极大地惠及广大用户。以教育行业的主要用户之一学生为例,我们都知道在基础教育领域产生深远影响的“双减”政策,“双减”减去的是什么?过重的作业负担和校外培训负担。那是否意味着我们不要学习了,可以“放羊”了?当然不是。减去的这两个负担集中体现的是无效的学习。
我们要减去盲目的、重复的,以刷题、培训为代表的学习行为,这就需要有客观的数据来让学生和老师知道,每个人的水平高低,短板在哪里,并依此提供个性化的学习资源,实现“对症下药”、因材施教。数据治理让这一切成为可能。
外研社每年销售的图书有1亿多册。全国有超过一半的大学生和约三分之一的中小学生在课堂内使用外研版教材;在课堂外,外研社的培训教材、自学教材、词典、听说读写译等方方面面的教学产品,也是外语教学领域最大的供给方。
比如说,外研社的分级阅读产品有50个系列4000多册——从开卷数据来看,外研社的分级阅读产品数量占全国英语分级阅读总产品数量的一半,销售额占60%,英语分级阅读Top50图书中外研社占24个品种。依托强大的外语资源和常年服务于全国大中小幼全年龄段的渠道能力,外研社的数字化是线上线下互相赋能、融合共生的数字化。
我在社内提出一个号召叫“应数尽数,纸数融合”,意思是,聚焦核心IP,同时推动所有内容和服务的数字化,加大数字教材、智慧版图书、新形态教材等的内容侧供给;同时纸数内容联动、销售联动、服务联动。
我们有一个全资子公司叫外研在线,是外研社数字化转型的核心载体,员工超过500人。纸数融合强调的是即便有外研在线这样一个规模很大的数字化公司,它也不是外研社数字化的全部,更不是数字化孤岛。外研社的数字化是外研集团开元体育、外研社从产品生产到业务生态,从企业治理到组织能力的全面的数字化。数字化是给集团业务和管理装上轮子、插上翅膀。
支撑以上我说的“应数尽数、纸数融合”的是外研社的两大平台——外研U学和UNIPUS云,它们共同形成对外语学习全学段数字业务的平台支撑能力;同时,基于外语教育发展的定位,我们自研了写作引擎、语音引擎和翻译引擎,又在今年4月份新增了外研AIGC(AI Generated Content人工智能生成内容)平台;在此基础上,我们构建了线上线下相融合的外语教学生态。
这个生态由外语教和学所需要的各种软件和硬件融合构成,包括大家所熟知的软件形态如小程序、App、Web应用、桌面应用程序,也包括硬件如点读笔、听力宝、教学云盒、智慧教室等,因为都是基于外研的内容,所以它们之间都有内在的联系开元体育官网出版业的数据治理怎么做?这是外研社的实践和思考。
这样的完整教学生态使得我们不仅汇集了学生在学校的课内学习数据,还汇集了学生在课堂外比如家庭等场景里做练习和阅读的数据,通过我们自己研发的听说考试系统和优诊学这样的诊断测评工具,进而实现课堂内外、线上线下的数据融通,形成了以量化数据衡量的用户学情数据指标。
在外研社“统一架构、统一用户、统一支付、统一安全”的整体规划下,同一个学生在学校、家庭等课堂内外不同地点的学习数据,以及日常、考试等不同场景的综合学习数据都汇聚在一起,全方位开元体育、系统化地反映出该学生的学习概貌。
学习者在听、说、读、写、译哪些环节容易出现困难?学生从中小学到大学再到职后的发展中,分别需要什么样的学习资源?随着用户画像越来越全面,用户的需求也越来越清晰,用户变得“清晰可见”。在海量的数据治理和数据挖掘之下,数据比用户更懂用户自己。
在更懂用户之后,我们要做什么呢?第二步是因材施教,给每个用户私人定制最适合的学习内容。为此,我们开发了外语学习的知识图谱,并用知识图谱对外研社海量的内容资源进行标注,实现将结构化的内容颗粒化以及根据需求重构封装为新的结构化内容。通过自主研发的学习策略算法,为用户规划高效、精准的学习路径,匹配最适合的学习内容和服务,让学习者得到最适合自身学习能力的教学生态。正诠释了那句话:适合的才是最好的,在教育领域尤其如此。
前面我介绍的是数据治理帮助我们更好地服务外部用户,外研社的数字化发展同样为内部管理提供了强大助力。无论我在哪里,打开手机上的管理驾驶舱就可以实时看到全社管理动态,包括在售产品和服务的实时数据、各部门以及重点产品的同比环比数据、销售曲线、用户数据,等等。管理驾驶舱为管理层掌握全社业务动态、进而作出决策提供了有力帮助,可以说管理驾驶舱就是带在身边的管理参谋。
现在这些数据只是提供给管理层实时监控哪里出了问题,未来,我们会把相关数据进一步分层共享出来,让业务和管理状态分层透明可视,干部、员工都可以在“导航”的指引下,选择工作中最优的路线,减少拥堵,减少绕路。通过进一步数据治理,解决成本和效率这两个大问题,最终构筑起更强大的企业核心竞争力。
这就是在当下和未来,外研社在数字化发展过程中,汇聚数据力量赋能教育所做的事情——持续清晰的用户画像,帮助用户更了解自己,同时给用户匹配最适合的学习解决方案,通过数据对内部管理赋能。
当然,规范使用数据、确保数据安全是重中之重。正如当下最热的AIGC应用ChatGPT带给人类无限便利、震撼的同时也引发了巨大的担忧,有人把滥用人工智能可能带来的危险和核武器相提并论。一方面我认为这样的忧虑不是杞人忧天,另一方面,我们也不能因噎废食。这些都促使我们更多地思考并行动起来,共同为规范使用数据开元体育、避免数据滥用贡献智慧。
大数据商业应用第一人,《大数据时代》的作者维克多·迈尔-舍恩伯格(Viktor Mayer-Schnberger)说:“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。”这个时间会越来越临近。
如何才能不负时代?我经常问自己。如果站在未来看当下的话,那就是推动以用户为中心,以数据为驱动的数字化转型。希望能有更多机会与业界同仁在数字化的旅途上,一路同行,联合创新。