计算机视觉交互技术在企业日常工作中的应用

范文帮发表于2020-03-07 17:15:01归属于综合论文本文已影响我要投稿手机版

  摘要:

  在现代企业的新产品开发,市场调研数据分析报告等集体智力活动当中需要很多的可视化的展示与沟通工作。目前很多情况下企业往往是采用传统的ppt方式进行,这些ppt中大部分动画都是单向无实时交互的。随着现代计算机视觉识别和交互技术的发展,可以设计更好的交互展示系统,帮助企业改善复杂问题的沟通。

  关键词:

  计算机技术;视觉识别技术;交互技术;会议展示;智能办公环境

  在日常的企业办公管理活动中,有很多时候需要可视化地展示企业市场计划、新产品设计、数据分析报告等。尽管这些活动所需要的材料在事前可以经由办公自动化软件处理,但处理结果却很大程度上只能由静态的ppt展示和说明。但很多时候,这些展示和说明往往是多个部门不同专业背景的人员参与,于是展示材料制作的水平和质量就很大程度上影响到了参与者对所展示内容的理解和吸收程度。很多复杂的问题或者设计的展示,如果能采用互动交互的方式展示,在很大程度上能够帮助问题讨论的参与者对所讨论问题更好的理解。这一点在常规的教育过程中已经获得了充分的证实,相关的数据和结果可以从多媒体教学的优势的相关研究中得到。同样,企业中很多方案的讨论,数据分析报告的说明其实对于企业而言也是一个方案设计者或数据研究分析者对相关人员类似教学的过程。采用现有企业常规会议设备诸如投影仪、普通笔记本电脑、电脑摄像头配合相应的计算机视觉识别程序,我们可以将交互的投影演示引入到企业日常的展示讨论活动中,增强沟通效果,提高工作效率,并且在技术上同样的识别交互的程序配合上相应的员工面部特征的数据库,还能扩展延伸到考勤或门禁系统中提供更加智能化的办公环境。对于以展示沟通为主的教育培训企业,通过配合一般人脸数据特征,可以通过摄像头捕捉现场视频并识别其中人脸识别,记录现场关注展示内容的人员的数量,作为日后教学效果的自然客观的评估参考。

  1目前办公信息化中存在的问题

  1.1会议演示文稿展示时多人交互型差

  目前主流的演示文稿制作及展示软件主要大多都集成在套装的办公软件中,其中主要常见的种类分别是microsoftoffice系列中的powerpoint、macos系统下的Keynote、基于linux操作系统的openoffice中的impress。它们主要的功能都是对输入的文字、图片声音等多媒体进行编辑制作最后生成电脑上播放的多媒体幻灯片,尽管它们都具有强大的多媒体数据的处理能力,但最终制作的多媒体幻灯片在演示时都是“单向交互”的,即由播放者播放,而其中的内容及动画按预先设计好的模式显示。如果使用Adobe公司的captivate或Authware这样的多媒体交互制作软件则会需要有专人进行操作,浪费大量的时间和精力,但如果是配置专门的多点触摸屏幕,则一来屏幕尺寸有所限制,二来费用相对较高容易造成设备的浪费。

  1.2传统办公考勤与门禁系统的弱势

  目前企业常规的门禁系统与日常考勤系统往往是分离的,两个系统使用了各自独立的软硬件环境,其中门禁系统使用的是摄像监控设备采集信息并通过专人24小时值班,其主要职能仅仅是监控办公环境的人员进出并记录下相应的影像资料。而企业日常的考勤系统则要么采用人工签到的方式,要么采用人工打卡或者指纹打卡方式。如果采用打卡方式管理则需要添置专门的打卡机,这些打卡机多数是独立工作,对于员工的考勤则需要人工根据卡片记录情况统计。无论是员工自身打卡或者是统计考勤都是人工完成,有时还会出现错误和疏漏,同时主要的问题还在于容易出现代人打卡等作假的情况。所以,在传统的办公考勤与门禁系统独立的情况下,两个系统各自记录各自的相关数据,同时投入两套不同的软硬件环境,有时这样的办公环境的信息化反而没有给人员带来便利,而是增加一项打卡签到的日常任务。

  2对存在的部分问题的分析和讨论

  2.1传统演示设备缺乏交互型功能

  由于很长一段时间硬件以及软件的条件约束,电脑的键盘、鼠标完成了95%以上的数据输入工作,单一显示功能的显示器投影仪也成了最主要的信息输出设备。所以常规软件设计和开发时都是把键盘、鼠标、显示器/投影仪的输入输出组合当做几乎所有使用情况下的模式。但随着触摸屏与多点触控硬件的出现,多点触控、屏幕的直接交互输入输出操作成了未来发展的一个趋势,并且相对普通鼠标和单一显示功能的显示器用户交互体验明显提升,人机交互界面更友好直观。但是对于普通办公中使用的投影仪,由于其投影的目标位置情况多样,如果一体化的设计制造具有交互功能的互动投影仪其成本要比普通投影仪更高,对于解决互动操作的问题经济上不是最优的。而大面积的多点触控屏幕由于设备体积和重量的因素无法在需要灵活移动的新产品推广谈判等活动中使用,如果只是企业自身办公环境中做普通会议展示的效果改进,其投入产出的效率也不理想。

  2.2基于传统输入输出设备的开发

  由于长期以来人机交互都是以鼠标键盘为主,所以绝大多数程序开发设计都只考虑这种单一的输入方式。但对于目前多媒体数据增多的趋势,这样传统的输入输出模式就存在着很多弊端,其中最明显的是对于多媒体数据的采集就需要单独使用设备,采集后再人工处理。而为了简化系统设计的复杂度,很多管理信息系统的数据采集和录入主要基于键盘鼠标的录入,如果出现非键盘鼠标录入的数据则被要求人工进行数据格式的转换,所以从一个侧面也反映出一些企业排斥信息化,因为原本带来效率提升与管理便利的信息系统,反而由于一些数据格式的录入要求增加了人工劳动。如果直接使用现实当中的多媒体类的数据则系统又缺少相应转换的功能。因为系统在考虑使用键盘鼠标录入采集数据时已经默认了操作者来完成数据录入前的标准化工作。但是实际上随着现代计算机视觉以及人工智能、模式识别技术的发展和完善,过去无法识别的原始多媒体数据现在也可以由计算机识别并进行标准化的处理。

  3运用计算机视觉技术改善人机交互

  3.1低分辨率识别情况下改善会议演示交互效果

  采用现代的计算机影像处理技术和方法,可以用普通的图像采集设备配合程序识别影像当中的特定颜色区域的移动轨迹,并对轨迹做出判断实现与计算机的交互。由于该识别只是需要识别图像中的特定颜色的区域的运动,而非具体的形状与细节,所以识别的难度相对不大,可以运用在会议的展示环境下,通过定位确定普通投影区域与特定颜色区域的位置关系,并通过图形图像的投影与变形运算,实现人与普通投影的交互。在环境背景比较清晰,图像采集设备分辨率与色彩分辨比较灵敏的情况下还能更进一步对人体肤色和手的几何特征进行识别,实现更加自然良好的人机互动交互,并且还能引入人工智能的模式识别算法,实现多人的互动交互,从而大大改善互动展示效果,实现更加人性化有效的沟通。特别在教育培训行业,在现有普通硬件条件下能够实现更加生动的教学讲解演示,提高学生的课堂体验激发更多兴趣,改善教学效果。

  3.2运用计算机视觉与模式识别技术整合企业门禁与考勤系统

  应用计算机视觉技术配合相对高分辨率的识别与人像数据库,企业可以采用现有的门禁系统的硬件设备配合相应的软件实现门禁与考勤系统的整合,以此提高企业办公环境的智能化人性化的效果,并对员工进行更加精细化的管理。重要的是,通过人机接口的改进改变以往服务信息系统的面貌,让人在自然的环境下工作提高系统的人性化程度。同时整合门禁与考勤系统可以通过识别企业内部员工与外来人员加强办公环境的管理,而且在硬件上可以利用现有的设备,软件方面可以与前面提到的交互演示系统共用相同的图形图像处理内核,减少代码的冗余降低系统复杂度提高可靠性。就目前的人像识别技术而言,已经在个人电脑的安全保护上得到了应用,所以在技术上是可行的,并且也有了实际应用的例子。将该技术移植到普通的门禁管理系统与考勤系统中,只需要解决接口的数据交换就能实现,并且随着现代企业办公环境的要求,应用该技术能大大提高企业的办公环境的智能化程度,并且通过门禁系统提取的企业员工考勤信息更加自然和真实,能够更加准确地掌握和管理企业员工的日常工作情况提高管理精度。

  3.3具体实现方法与原理

  为了能充分利用企业现有的硬件设备,并使得附加的程序简单化,这里针对类似会议互动展示这样不需要细节识别的情况采用的是颜色识别的方法,即统计场景中的图像直方图,然后探测直方图上的变化,由于特定颜色的待识别区域的引入可以对整体直方图的特定区域产生峰值的变化,并且通过反向的直方图运算又可以确定特定区域的位置。而直方图的运算属于比较简单的图像运算处理所以能够在很多图像处理的开发工具中直接找到。并且对于细节识别要求比较高的人像的模式识别,采用以上的运算也能缩小待检测区域的大小,提高识别效率,并且人的面部特征采用色识别也能很快找到特征点(眼睛、鼻孔、嘴唇、头发以及头像边缘)。在前面通过色彩识别找到的检测区域中,识别出特征点,并测量特征点的位置关系比例,进而在和数据库中数据对比模式匹配找到最终结果。

  4结语

  在越南河内的机场,为了使乘客能在等待航班时有比较轻松的环境,在旅客的候机大厅专门安放了一台具有互动功能的投影仪,并将互动内容投影在地面,乘客可以在候机时与地面上的互动投影交互,缓解候机带来的单调乏味感。同样我们可以把它引入到日常企业办公会议或者是培训教育类企业的日常教学中,运用现有的投影屏幕和现有的设备实现多人的在投影屏幕上的互动交互讨论。而人像识别系统在单机上的应用也在很多商用笔记本电脑上得到了应用,在一些科研院所和高科技企业人像识别的门禁系统也被应用到了办公环境当中,提高了办公环境的智能化程度;将人像识别技术结合考勤系统则在教育行业能够实现更为方便的考勤管理防止目前比较严重的代签逃课等情况的发生。随着现在对数据挖掘技术的研究,从日常情况采集到的数据积累到一定程度还能为今后分析员工/学生行为做出数据的积累。这里所讨论和解决的问题主要只是集中在人机交互界面的一些改进,其实对于it技术而言这只是一小部分,对于企业而言需要使用it技术真正提高企业的工作效率还需要其他很多方面的配合和集成。

  作者:赵磊 邓世翔 刘德飞 单位:云南机电职业技术学院

  参考文献:

  [1]黎松,平西建,丁益洪.开放源代码的计算机视觉类库opencv的应用[J].计算机应用与软件,2005,22(8).

  [2]陈雪松.基于图像势能理论的特征提取方法研究[D].华中科技大学,2011.

  [3]李超,许春耀,潘林,余轮.面向投影环境的计算机视觉交互信息获取[J].电视技术,2013,37(11).

  [4]王修晖,华炜,鲍虎军.面向多投影显示墙的手势交互系统设计与实现[J].计算机辅助设计与图形学学报,2007,19(3).

  [5]张为中.多触摸环境下的软件交互方式研究[D].电子科技大学,2012.

返回综合论文列表
展开剩余(
赞赏支持