AI进入校园体育场景是一种必然。
视觉AI可以做什么?人脸识别自然是大众最耳熟能详的领域。但人脸识别之外呢?视觉AI如果仅限于人脸识别,就很难在综合能力上超过人类。因为人类甚至可以做到,不看脸,仅看后背姿态,仅看走路姿态,就能识别出他/她是谁。
视觉类AI最适合的应用场景,安防之外还有哪些?这一问题也悬挂于行业上空很久。安防自然是一个非常重要且广阔的场景,市场规模目前的绝对值堪称最高,但还有哪些新的场景与新的想象?
而近日,AI公司格灵深瞳正式发布深瞳阿瞳目体育训考系统、深瞳阿瞳目体感互动系统及深瞳阿瞳目体育大数据分析系统三大新品,这也是其智慧体育业务线首次正式对外发声。
这种全新方案,核心技术正是机器视觉领域长期以来的难点——姿态识别。而创业之初就坚持3D立体视觉技术方向的格灵深瞳,在姿态识别上积累已久。姿态识别技术能够给校园体育领域带来哪些新变化?格灵深瞳的AI优势,在智慧校园体育领域又将迸发出哪些火花?
据了解,格灵深瞳的智慧校园体育新品以“运动体能训练项目+视觉姿态识别+AI”为技术核心,基于3D重建技术,结合动作模型库和人体运动功能学,为体育教育提供了一种全新的更具科学性的解决方案。
实际上,机器视觉中,哪怕是发展多年的、只能获取处理平面图的2D视觉技术,在体育教育中都很少得到运用,更不要说可以完整重现各类三维场景、进行精准姿态识别的3D视觉了。
3D视觉特别是姿态识别,到底难在哪里呢?
姿态识别(Action Recognition)的重点是检测人体关节点和肢体,但人体姿态的骨骼节点具有尺度小、容易被遮挡等特性,对算法、数据库、感知设备当要求很高。在进行人体姿态数据采集时,外界环境和样本种类的相似度都会降低数据采集的质量,影响特征选取。
而姿态识别流程中的必备模块即姿态估计(Pose Estimation),需要先检测出关键点之后,再确定其空间位置关系,最后预测人体骨架信息。完成姿态估计以后,姿态识别算法需要在不同帧之间的时序信息中挖掘有限的线索与规律、推测无限的变化与可能。
姿态识别的高难度,就表现在“以有涯随无涯”上。
作为业界领先的3D立体视觉技术供应商,格灵深瞳的人脸识别技术获得过 NIST 全球 FRVT 测试冠军,车纹识别技术、人体关键点检测技术等也在 PRCV2019、ICCV 中名列前茅,而且格灵深瞳的姿态识别、行为识别技术已经在金融等领域得以应用。
在3D视觉技术上,无论技术实力还是行业应用经验,格灵深瞳都是业内的领先者。这一先发优势,也让格灵深瞳在进入体育领域时,更能发挥出AI在效率上的大变革作用——体育教育也因此具有后发优势,跳过2D直接进入3D视觉技术时代。
而格灵深瞳与众不同的地方在于,姿态识别技术在公司内部沉淀已久,比如将三维视觉应用在人体姿态识别和物体识别方面的算法,就是格灵深瞳的核心技术之一,且已在应用场景中有了先发落地应用优势。
在轨交运维领域,格灵深瞳的3D重建与立体视觉分析技术解决了传统算法中误差较大的问题,让计算机视觉技术运用于轨交检修的落地应用成为可能;在体育健康领域,格灵深瞳的3D立体视觉技术使得设备成本降低的同时,更是提高了可靠性和易用性,同时运动姿态分析技术通过采集不同场景下人体姿态数据,通过自主研发的三维人体姿态估计算法,能够克服人体关键点采集不准不稳等难题。
实际上,2019年7月开始,格灵深瞳便与相关高校联合展开AI助力竞技运动员训练的合作,为篮球、竞走、冰上运动、体能提升等专业方向的竞技队提供科技服务。
具体来说,格灵深瞳通过视觉技术获取运动员的二维、三维姿态和环境数据,结合动作模型库及人体运动功能学的特点,评估运动员的训练质量,监测训练趋势,并向教练员提供可以指导训练的数据报告。
随着格灵深瞳智慧校园体育三大新品的发布,人工智能技术在颠覆众多场景之后,终于来到了校园场景,尝试为社会关注已久的青少年体育问题排忧解难。
体育一直是中小学教育中的弱势领域,这也导致我国青少年多项身体指标不尽如人意。
据第八次全国学生体质与健康调研数据,我国青少年依然存在学生视力不良和近视率偏高、学生超重肥胖率上升、学生握力水平有所下降、大学生身体素质下滑等学生体质与健康状况亟待解决的问题。
国家也意识到体育的重要性,近几年,围绕青少年体育教育的政策陆续出台。在《关于深化教育教学改革全面提高义务教育质量的意见》中,规定了“让每位学生掌握1至2项运动技能”的具体目标;而在《体育强国建设纲要》中,“青少年体育服务体系更加健全,身体素养显著提升,健康状况明显改善”已经写入战略目标;《关于深化体教融合 促进青少年健康发展的意见》则提出“向全体学生,开齐开足体育课”,要“实现文明其精神、野蛮其体魄”;国务院《关于全面加强和改进新时代学校体育工作的意见》更是提出“建立日常参与、体质监测和专项运动技能测试相结合的考察机制”。在政策鼓励下,各地体育中考分值纷纷提升,一些地区的体育中考分值甚至提到了100分。
在2022年4月教育部印发的《义务教育课程方案和课程标准(2022年版)》,更是明确“体育与健康”课占总课时比例10%-11%,仅次于语文(20%-22%)、数学(13%-15%),高于外语(6%-8%),排名第三。
除了课时比例,在绝对时长上,2022年6月,“保障学生在校期间每天参加不少于一小时体育锻炼”也写入新修订的《中华人民共和国体育法》。
青少年代表着国家的未来,青少年体魄强健,才能在愈加激烈的国家竞争中保证中国的朝气蓬勃。
在进入中小学智慧校园体育场景之前,格灵深瞳的3D视觉、姿态识别等技术其实已经用于国家队的专业体育训练中。格灵深瞳通过姿态识别等技术获取运动员的三维姿态和环境数据,结合动作模型库及人体运动功能学的特点,评估运动员的训练质量,监测训练趋势,并形成可以充分指导训练的数据报告向教练员提供。
但校园场景与专业体育场景也有很多不同,AI技术不是简单搬来就能用的,还需要针对场景进行针对性细化、调整,需要AI公司对校园体育有着更深的理解,知晓老师和学生的痛点。
对此,格灵深瞳也提前做了非常深入的调研。格灵深瞳发现,在数据价值愈加突显的今天,在校园体育领域,却存在着大量的学生运动数据浪费问题。具体表现在学生缺少反馈与评价,教师缺少指导依据,管理者缺少数据统计手段等方面。
学校体育领域中数据浪费、缺乏留存与开发等问题,也意味着学校体育长期以来依然停留于“手工业”时代。
由于缺少数据,学生的日常训练,很难进行个性化、专项化的指导与建议,体育评价往往流于“唯经验论”;由于缺少AI设备,体育测试中人力占用过多,也难以提升体育教师人效。
特别是随着人们体育意识的增强,对体育运动的追求也讲究专业与正确。比如以往的仰卧起坐测试,往往是科学训练不足,最后只看时间一个维度。但体育考核不能只看时间、次数、距离,体育训练更得在结果之外注重过程,特别是动作规范的要求。
如何衡量体育运动中的动作规范?如何判断不同学生出现同样的动作不规范,或者同一学生出现不同的动作不规范等背后的复杂原因?拥有姿态识别能力的AI设备就必不可少。
格灵深瞳此次推出的深瞳阿瞳目体育训考系统、深瞳阿瞳目体感互动系统、深瞳阿瞳目体育大数据系统,不仅从设备端建立了完备的数据采集、输入链,还建立了完备的后台数据库:
深瞳阿瞳目体感互动系统则兼具体育专项训练和趣味交互体验功能,一方面通过自研的智能双目姿态相机高精度地检测人体的姿态和运动状态,给予学生科学的动作反馈,帮助学生提升动作的标准程度;另一方面通过强交互性的运动项目,激发学生运动兴趣。
深瞳阿瞳目体育大数据系统基于格灵深瞳自研的AI体育大脑,通过汇集多层级的学生体育数据,从学生的身体素质、训练过程、考核结果等多个维度进行分析并生成分析报告,可以为体育教师提供丰富的数据参考,也可以给各层级的教育部门提供区域内学生的全面深入的体育分析数据,提升区域体育教育的管理效能。
也就是说,格灵深瞳的深瞳阿瞳目产品,不仅是产品,更是完备的系统。
三大系列产品,不仅覆盖了体育教研、体育考试、体育课后服务、体育专项教室、体育日常训练、云上运动会六大应用场景,更是提供了可打造学、练、赛、评一体化的智慧校园体育一揽子解决方案。据悉,在此次发布会之前,格灵深瞳的智慧校园体育产品已在全国多个校园进行试点,截至目前已经为超过2万名在校师生提供日常教学支持与考试服务。
值得一提的是,格灵深瞳智慧校园体育解决方案提供了更多人机交互的AI设备,让学生可以与设备进行AR互动,双人同屏PK等。据了解,格灵深瞳的深瞳阿瞳目体感互动系统目前支持 100+ 项交互类运动项目,而且自研智能双目姿态相机可智能识别人体姿态,可在200ms内反馈运动成绩。快速反馈,才是学生进步的有力保障,因为学生可以在最短的时间内,知道自己动作做得对不对,如何规范动作。
格灵深瞳也向亿欧网透露,未来还会拓展更多人机交互领域的创新业务。
不同于ChatGPT在应用于教育领域时,曾引起很多老师对于学生作业抄袭等方面的担忧;但学校体育练测评中不会存在抄袭,对于一直缺乏AI赋能的学校体育来说,格灵深瞳发起的这场学校体育的“AI革命”,可谓是一场及时雨。
在格灵深瞳智能体育业务线产品总监夏鹏飞看来,前两大产品主要展示的是格灵深瞳在技术识别方面的多年积淀,而第三大产品体育大数据系统则证明了公司在进行大数据分析、给出个性化反馈方面的实力。
据了解,目前格灵深瞳做到了识别精度高、复杂场景适应性强、动作反馈快的优势,通过自研模型可以快速精准的检测人体骨骼关键点,各地体育中考、体质健康监测、小升初考试的项目覆盖率90%以上,动作的违规错误覆盖率100%。
这些全新的校园智慧体育产品,用到了格灵深瞳的多项核心技术算法,比如单目3D Mesh重建、人体的跟踪和检测等。覆盖率90%、100%等数据背后,是格灵深瞳长期的技术积累——很多技术格灵深瞳十年前就开始研发布局。
格灵深瞳智慧校园体育产品不仅要进行单人姿态识别,很多集体性质或者对战性质的运动,还需要多人姿态识别。多人姿态识别比单人姿态识别更难的地方在于,传感器识别到的人数是未知的,每个人的位置是未知的,多人更容易发生遮挡。判断出多人正在做的动作之后,还要基于已有数据库去提前预测未来还会做什么动作,这对于设备背后的“大脑”,考验也非常大。
而依托格灵深瞳底层AI技术平台——深瞳大脑,其智慧校园体育解决方案支持多人运动大场景应用,可实现实时运动姿态评估与交互,延时低至200ms。
在动作识别和姿态识别上,格灵深瞳还在继续训练自己的大模型,基于图像预训练大模型来构建视频预训练基础大模型,未来进步的空间还很大。
而格灵深瞳,还在继续训练自己的大模型,未来进步的空间还很大。
当然,术业有专攻。对于AI领域最火的大模型技术,目前很多巨头都在推出自己的大模型产品等。格灵深瞳有自己垂直的技术与商业领域,作为少有的已经实现盈利的AI公司,格灵深瞳在拓展边界上一直是稳扎稳打的作风。
其实,扎根自己最熟悉的3D视觉,通过结合图像理解、自然语言处理、三维重建技术等多模态任务与数据,建构姿态识别领域的专业大模型,在姿态识别领域输出更准确优质的判断,使得模型能更好地适应特定任务或应用,也同样很有价值。
2022年,格灵深瞳已完成跨类别预训练模型自动化微调的升级,纳管了海量领域数据。
据了解,接下来,格灵深瞳将进一步改造深瞳大脑,结合最新的 zero-shot 技术,将海量数据进行多轮迭代后,完成对多模态大模型的数据投喂,最终使其服务于多条产品线。
2022年以来,人工智能行业涌现出了一系列算法技术革新,BERT、GPT-3、DALL-E等大模型算法在多个领域大放异彩。这些算法在海量数据的训练下,表现出了多种接近甚至超过人类的智能水平,不但可以生成人类作者、画手级别的文本、图像,也开始向多模态、跨模态延伸。
格灵深瞳对大模型的研发投入与提前布局,也是提前占领技术的制高点。只有站在制高点上,才能看清更远的未来,并为商业布局提供更精准的参考。
此次在智慧校园体育领域发布深瞳阿瞳目新品,对格灵深瞳来说,不仅是发起体育领域的一场AI变革,也是在探索人工智能落地更多行业的新路径,并将成为格灵深瞳后续业绩增长的重要引擎。