《机器人与智能系统》杂志第四期

发布时间:2017-12-01 | 杂志分类:工业机电
免费制作
更多内容

《机器人与智能系统》杂志第四期

16中国科学院深圳先进技术研究院院长  樊建平 中国科学院深圳先进技术研究院 院长  樊建平大数据、人工智能、共享经济作为新词首次出现在十九大报告中,报告中明确提出要发展机器人制造业。在“中国制造2025”,“工业4.0”,《机器人产业发展规划(2016-2020)》,《新一代人工智能发展规划》等一系列国家层面的产业政策助推下,中国已成为世界上最大的工业机器人应用市场,同时也是增长速度最快的市场,机器人的研发、制造、应用已是衡量一个国家科技创新和高端制造业水平的重要标志。在工业机器人产值规模迅速扩张的同时,服务机器人也迎来了快速增长期,据相关方统计,2016-2019年,全球专业服务机器人的销量合计将达到33.32万台,销售额合计达到231亿美元,全球服务机器人市场规模将达到500亿美元。工业机器人的高速发展带动机械部件的革新与进步,大数据与人工智能的发展让机器进入场景复杂的家庭环境成为可能,深圳从上次家电引领时代有十年的时光,通用家用服务机器人的出现是服务机器人时代的标志性事件,深圳应该勇敢面对... [收起]
[展开]
《机器人与智能系统》杂志第四期
粉丝: {{bookData.followerCount}}
文本内容
第2页

16

中国科学院深圳先进技术研究院院长  樊建平 中国科学院深圳先进技术研究院

院长  樊建平

大数据、人工智能、共享经济作为新词首次出现在十九大报

告中,报告中明确提出要发展机器人制造业。在“中国制

造2025”,“工业4.0”,《机器人产业发展规划(2016-

2020)》,《新一代人工智能发展规划》等一系列国家层面的产

业政策助推下,中国已成为世界上最大的工业机器人应用市场,

同时也是增长速度最快的市场,机器人的研发、制造、应用已是

衡量一个国家科技创新和高端制造业水平的重要标志。

在工业机器人产值规模迅速扩张的同时,服务机器人也迎来了快

速增长期,据相关方统计,2016-2019年,全球专业服务机器人

的销量合计将达到33.32万台,销售额合计达到231亿美元,全球

服务机器人市场规模将达到500亿美元。工业机器人的高速发展带

动机械部件的革新与进步,大数据与人工智能的发展让机器进入

场景复杂的家庭环境成为可能,深圳从上次家电引领时代有十年

的时光,通用家用服务机器人的出现是服务机器人时代的标志性

事件,深圳应该勇敢面对这一个新时代的到来。

中科院先进院构建以科研为主,集科研、教育、产业、资本为一

体的微型协同创新生态系统,集聚了一大批科研精英,推动了机

器人产业的快速发展。在第十九届高交会中科院展馆机器人专区

中,有70%的参展企业是服务机器人,展示自主研发全新的创新

产品、技术,技术与产业的标志性时代创新让服务机器人有了全

新的春天,未来在服务机器人领域,一定会存在颠覆性技术,服

务机器人将迎来高峰。

第3页

18

专题报道

“智”时代,“连”未来,

服务型机器人发展驶入快速道

——第七届中国国际机器人高峰论坛纪实

11 月初,以“‘智’时代,‘连’未来”为主题的第七届中国国际机器人高峰论坛(CIRS2017)在上海龙之梦大酒店盛大启幕,

本届论坛由中国机器人网和上海机器人产业园共同主办,中关村双创服务机器人产业联盟、上海添唯认证技术有限公司等

多家机构协办,济南翼菲自动化科技有限公司冠名赞助。论坛邀请到人工智能和机器人领域的顶尖专家学者、知名企业大咖、

资本机构,紧紧围绕当前发展态势,共同探讨如何把握时代脉搏,开启未来。

组编 \/ 编辑部

开幕式上,由中国机器人网 CEO 赵勇致欢迎词,感谢 嘉宾阵强大容,会议内容丰富

嘉宾的到来,并邀请上海市宝山区经济信息委员会主任夏

永军为本次论坛致辞。 上午的主题论坛邀请到来自国家科技部重大计划研究

所的首席专家赵杰,新松机器人总裁曲道奎,英特尔中国

夏主任表示,当前,全球新一代技术革命蓄势待发, 研究院院长宋继强,韩国机器人产业协会秘书长 Johnny

人工智能等新技术日新月异,智能制造和机器人已经成为 Kim,还有国家机器人标准委员会认证专家组组长郑军奇,

各国科技创新的重点和优先领域。近年来,宝山区主动顺 发那科研发中心部长童梁,以及上海机器人产业园副总经

应世界产业发展潮流,不断扩大智能制造,国际合作,积 理李臻做主题演讲。

极推进制造业的研发、生产、管理和服务的智能化水平。

智能制造在宝山的发展迈出了坚实的步伐,宝山区与中国 “十三五”国家重点研发计划组专家赵杰围绕中国机

机器人网联合举办中国国际机器人高峰论坛,就是宝山推 器人技术现状及“十三五”智能机器人重点专项做了解读,

动区域产业转型,与全球跨国公司对话交流深化智能制造 赵杰把“十三五”分为了三个阶段:第一个阶段是到 2020

合作的有利举措和重点平台。 年或 2021 年完成,要突破基础技术和核心技术,提升机器

人行业的创新能力,提高整个国家的机器人技术与产业的

第4页

19

专题报道

水平;第二个阶段到 2025 年,随着物联网的快速发展,智 跟生命科学有密切的关系。现在是发展医疗领域机器人发

能制造将进入到互联智能阶段,基于物联网互联的基础对 展的大好时机,其中大致可以分为四大发展方向:一是手

机器人进行全周期的预测、诊断等等。物联网与机器人网 术机器人,主要是辅助或帮助医生进行手术的机器人;二

络连在一起的,通过大数据,实现云端的自主学习,推理 是未来的康复机器人;三是在医院里帮助医生和护士从事

计划,届时机器人技术前沿理论与水平应该达到世界先进 监护工作的医院用非治疗类机器人,包括一些药品的传输

水平,且核心零部件占国产机器人中的装备量能突破 50% 管理等;四是机器人化医疗设备,例如放疗设备的外观形

以上;第三个阶段是到 2030 年,机器人产业空心化的问 式慢慢越来越像机器人,如一个机器人带着一个放射头,

题要根本解决,关键核心技术要自主可控,更重要的是中 机器人化的概念越来越强化。根据相关数据统计显示,预

国工业机器人应用水平和装机数量要达到发达国家水平。 测到 2025 年,医用机器人将替代军用机器人,成为第二

类重要的机器人开发领域,市场规模约达 170 亿美金,其

新松机器人自动化股份有限公司总裁曲道奎带来了关 中手术类机器人占比最高,约 60%,接下来是放射类机器

于机器人与智能制造新进展的思考,他认为全球新一轮科 人,约占 20%。

技革命和产业变革与中国制造业转型升级形成历史性交汇,

机器人、人工智能、物联网、大数据、云计算等技术跨学 上海有个机器人有限公司联合创始人张阳新认为,服

科融合,将带来制造业模式颠覆性变革;未来的制造业将 务机器人现在还未普及,并不是因为市场没有需求,而是

在云计算平台上用人工智能处理大数据实现数字工厂,用 因为当前的技术还不能完全支撑市场对于服务机器人的要

机器人 + 智能制造装备 + 物联网实现物理工厂,催生数字 求。“就比如说‘走路’。现在的很多机器人都能移动,

化智能工厂制造模式;智能制造涉及技术、部件、产品、 但能移动并不代表真的会‘走路’。机器人如果真的要融

方案、应用、标准、人才等方面,需要做好顶层设计规划,

更需加强生态系统建设。

英特尔中国研究院院长宋继强就家用智能服务机器人

规模化发展的机遇展开演讲,他认为当前产品的性价比突

破临界点,购买力稳步上升,2020 年中产人数将达 7 亿,

养老市场必会成为刚需,当下在技术层面应当突破关键技

术,减少部署成本;在产品方面应降低量产成本,使交互、

安全能力达标;在服务方面建立全国范围的远程控制和交

互体系。

  

服务型机器人迎来快速增长期

在下午的服务机器人主题论坛上,通过几位演讲嘉宾

的专题演讲,大家重点就现阶段服务机器人商业应用场景

的开发,以及对整个服务机器人市场的发展概况做了深入

的介绍和分析。

苏州大学机电学院院长、教授长江学者孙立宁表示,

服务机器人目前的一个重要方向是医疗机器人应用,过去

主要根据器官看病,而现在发展到分子层面从整个系统来

研究生命健康的问题,生命科学多学科交叉显得更加突出,

例如生物科学、纳米技术、信息技术,以及人工智能等都

第5页

20

专题报道

入我们的生活,还需要它与我们生活中的设备,比如电梯、 技术、人文化的一个结合。在硬件方面,在 GPU、TPU、

电话等进行交互。未来的智能生活也是人、机器、机器人 NPU 芯片技术的支持下,服务机器人的一个大的发展方向

之间的有效交互。”他表示,对于机器人来说,能够智能 是运算的速度越来越快,同时各种各样的人工智能基础技

移动则意味着它能够摆脱物理上的限制,真正进入人们的 术开始进入到应用层,如说语音识别、计算机视觉、自然

现实生活之中。目前有个机器人出品的服务机器人可以在 语言处理等, 这些完全颠覆了传统场景五大要素,场景、

50000 平米的室内,7*24 小时自由游走、并且可以自己搭 地点、人物、事件、连接方式,未来的市场是智行合一和

乘电梯和呼叫室内电话。 人剑合一的市场,即将机器人的行为和服务结合在一起,

以及人性化和工具相结合,使得服务机器人开始有了人性

北京康力优蓝机器人科技有限公司的创始人、CEO 刘 化的表达,这是和过去所有的产业都不同的。

雪楠指出,服务机器人现在看到的较为明显的变化是身形

上的变化,它逐渐从小型桌面化成进一步发展成中型机器 中国国际机器人高峰论坛自 2012 年举办以来,已连

人,甚至有超过一米以上的机器人开始量产化进入市场。 续成功举办六届,凭借高质量话题、高素质嘉宾和高规格

除此之外, 更多的是人工智能机器人的成长,例如机器人 的论坛水准,成功汇聚数千行业精英参会,被誉为中国机

的器官在不断演进,包括机器人的耳朵带有 4+1、5+1 环 器人行业的“达沃斯”论坛,为行业发展提供了良好的平台,

形麦克风,可以听到更多的内容;眼睛定位导航功能认得人、 促进机器人技术创新交流,对行业投资者有重要的参考意

物、路;机器人的手臂开始从简单的表演型,发展到未来 义。(本文资料及图片来自中国机器人网)

3 年之内真正实用人手功能等等。跟工业机器人一个重大

的差别就是,服务机器人偏重的不只是人工智能,而且它

设计的种类与内容也很丰富,服务机器人是智能、场景应用、

第6页

21

专题报道

2017 工博会机器人展:

新科技繁花入眼 智能制造近在咫尺

中国国际工业博览会(简称“中国工博会”)于 2017 年 11 月 7-11 日在国家会展中心(上海)拉开帷幕。作为国际装备

制造业顶级盛会之一,在今年的工博会上,机器人成为了人们关注的焦点之一。本届工博会上国外机器人龙头企业悉数到场,

同时国内机器人厂商也不甘示弱,大家纷纷推出了令人眼前一亮、又叹为观止的新产品、新技术。

组编 \/ 编辑部

机器人明星秀

ABB

ABB 应用于 3C 行业的最新款小型机器人 IRB 1100 在本届工博会首次亮相,同时

ABB 还正式发布了应用于快速连续冲压自动化的机器人 IRB 760FX 和 ABB 白车身柔性包

边专机系统。其中,ABB 在工博会上的演示线以生产优盘作为典型的小件装配案例,生产

线由一个配料的人工站、一个卡扣装配的 IRB120 站、一个视觉贴标的 IRB1200 站和一个

插装的 YuMi 站组成,应用磁力抓取和回弹实现无接触式传动。

YuMi 载荷 0.50kg,工作范围 0.50m;重复定位精度 0.02mm;主要应用于小件搬运,

小件装配。IRB1200 荷载(kg)\/ 工作范围(m):5\/0.9;7\/0.7;重复定位精度为 0.025mm;

主要应用于上下料,物料搬运。IRB120 荷载(kg)\/ 工作范围(m):3\/0.58;重复定位精

度为 0.01mm;主要应用在上下料,物料搬运,装配,包装 \/ 涂胶等。

第7页

22

专题报道

费斯托(FESTO)

费斯托的仿生技术明星空中水母(AirJelly)是由直径为 1.35 米的氦气球和八根自适应“触须”

组成。支架采用了轻巧而又具备一定柔韧性的碳素管,水母的翼是近乎透明又韧性十足的膜,电

机高效且精巧。AirJelly 的飞行是由中央驱动器将电力传递到锥齿轮,然后依次传递到八个正齿轮,

这些齿轮带动八个轴,分别激活一个曲柄,以此带动了八根“触须”,“触须”的设计成包括两

个拉压力交替的侧翼。如果侧翼受到压力,则结构会自动沿所施加力的方向弯曲。综合起来,八

根“触须”就产生了一种类似于生物蠕动的运动。

库卡(KUKA)

经过多年的研发,库卡(KUKA)推出了能提供用户良好的手柄导向装置,该装置能教会机器

人做事而不是进行简单的编程。除此之外,ready2_pilot 是世界上首个此种类型的无线解决方案,

具有无与伦比的连接性和灵活性。它的优势主要有:简单控制,无培训要求;无限的灵活性和高度

的多样性;直观的机器人导引,如同在电脑上使用 6D 鼠标;无需重新定向,鼠标可直接安装在机

器人身上。此外,它可配合任何种类的标准机器人使用,独立于有效载荷。

UR 优傲

优傲在工博会现场将机器人安装调试的全过程向观众进行了直播。在第 1 天的现场 PK

中邀请了两支队伍,他们分别用了 30 分钟和 40 分钟的时间,就完成了从机器人开箱、安装、

到调试的任务指定内容。而使用传统机器人解决这类问题,往往仅编程时间就需要 3-6 天。

2004 年优傲 CTO 人机协作机器人发明者艾斯本·奥斯特加(Esben Oestergaard)就

提出了“Nobody is too small to use cobots”,要让协作机器人成为人人都能使用的工具,

这么多年来 UR 一直践行着产品开发的初衷。

发那科(FANUC)

发那科机器人有限公司展出的其中一整套系统由 M-10iA\/12 机器人、双色注塑机

α-S130iA+SI-20A 及 α-S50iA 单色注塑机组成。注塑机加工放大镜及礼品盒后,通过机器

人进行取出及组装,iRVision 2D 视觉系统判断礼品盒是否组装完成。

双色注塑机 α-S130iA+SI-20A 是唯一一款全电动双色机,第二射出单元具有与主射台

相同的控制精度及稳定性。它通过 I\/O LINK 快速连接,可节省系统搭建与调试的时间;系

统集成了注塑、取出、检测、包装为一体,实现了全过程的无人化。

川崎(Kawasaki)

川 崎(Kawasaki) 在 本 次 工 博 会 上 展 出 了 duAro 双 臂 机 器 人。 它 具 备 高 精 度 作

业、人机协同作业、双手臂协同作业三个特点。duAro 双臂机器人的重复定位精度为

±0.5mm,能保证包装盒的装配精确无误;它具有柔性机壳,发生碰撞时可自动停止,高

密度流水线中可与人工共同作业;此外,duAro 双臂机器人的两个手臂可单独执行作业,

快速完成小部件的装配,同时也可双臂协同作业,共同完成大部件的装配作业。

第8页

23

专题报道

那智不二越(NACHi)

那智不二越(NACHi)推出 MZ 系列新成员 MZ12——一款具备强大、纤细的超高速

机器人。它拥有同等级别中最大的工作范围,可轻松对应适用性检讨;强劲的手腕扭矩可对

应大型工件、抓手;在同等级别中以最快的高速、高精度动作提高了生产性;与以往机型比

较,它的设置面积减小 17%,本体体积减轻 29%;手腕、本体部分全防护,防尘防滴等级

IP67,作为标准配备还做了防锈处理,可对应各种各样的用途。

安川电机(YASKAWA)

安川电机(YASKAWA)在本次展会上发布了世界级小型机器人 MotoMINI、新型多用途

机器人 GP 系列(GP7、GP8、GP12、GP25)及新型控制柜 YRC1000 和 YRC1000micro 等

多款产品。其中,世界级小型机器人——MotoMINI 重量约 7kg,最大伸展距离为 350mm,

可搬运重量为 500g,适用于 3C 行业小部件的组装、操作,以及电子电气零部件的配膳及插入等。

MotoMINI 具备小型轻量、高速、高精度三大特点,凭借紧凑型设计,不仅可在最小 (191x124mm)

面积中构建机器人系统,并且还可安装在装置内部,本体重量约 7kg,达到人可搬运的重量,

实现无需行车进行搬运,行走装置等周边系统也可进行小型化设计,可构建紧凑型生产线。

台达集团

在今年的工博会上,台达提供推出了多套机器人工作站解决方案。每套解决方案由三台台达

SCARA 工业机器人 DRS40L 系列、IO 转接板、HMI、光源等组成。其中,台达 SCARA 工业机

器人 DRS40L 系列具有优越的速度、精度、线性度和垂直度等性能,能够提供免感知器的顺应控

制功能,可顺应电子制造中柔性电路板的偏差,快速精准地完成贴片作业,大幅地降低因为操作

员疲劳工作而带来的废品率,帮助企业提升生产效率,并因此而降低人工成本。

新松机器人自动化股份有限公司

展会现场,新松协作机器人家族与 AR 增强现实技术携手打造人机共融,协作生产场景,将

科幻变为现实。AR 远程协助系统以 AR 技术选取指尖陀螺样式,通过人与柔性协作机器人、轻

载复合机器人、双臂柔性机器人以及周边系统集成共同工作,定制私人专属个性设备,一气呵成,

灵活、精准、安全、流畅完成指尖陀螺从选料、生产到配送的智能柔性生产全流程。

珠海格力电器股份有限公司

珠海格力电器股份有限公司此次展出了金字塔 GR4180\/GR6165\/GR650 工业机器人。这款

机器人是由 3 台大负载机型机器人通过信号串接,实现联合码垛功能。它的高通用性可兼容不同

规格尺寸纸箱,可完成多种垛型,实现智能化码垛。

金 字 塔 GR4180\/GR6165\/GR650 工 业 机 器 人 的 高 负 载、 高 速 度 分 别 可 以 达 到 180kg、

165kg 和 50kg;运动速度快,分别可以达到 4m\/s、1.4m\/s 和 1.9m\/s;定位精度高,分别可以

达到 0.3mm、0.2mm 和 0.1mm 的重复定位精度;可实现焊接、码垛、搬运、机床上下料、涂胶、

包装、机器人教学等功能应用。

第9页

24

专题报道

上海新时达电气股份有限公司

上海新时达电气股份有限公司在本次工博会上推出新款高防护等级桌面机器人 SD900。这款

机器人采用轻量式手臂设计、负载可达 8kg,重复定位精度达 ±0.03mm;性能稳定可靠,大幅优

化运行空间,在高速的运动状态下,使其能在狭小工作空间内进行灵活地作业,满足柔性化生产;

IP67 高防护等级可以完美地应对恶劣的生产环境,该系列专为打磨、搬运、装配等低负载、复杂

环境下的工艺应用特别制定。

南京埃斯顿自动化股份有限公司

南京埃斯顿自动化股份有限公司推出的打磨机器人配备专业打磨工装及离线编程软件,可满足

不同客户使用需求,提供一站式服务。ESTUN 打磨机器人优势主要有:采用高精度伺服马达及减

速器,性能稳定、响应快;配备水循环系统,解决抽风管道粉尘爆炸的安全隐患;采用封闭式外观

结构,保证作业安全;配置触摸屏,实时监控设备状态并能提供设备异常信息;具备产品定位功能,

采用吸塑盘直接上料;设备自动更换更换耗材,有效减少作业人数;提供自动抛光离线编程软件,

真正地做到在办公室完成抛光程序,大量减少编程时间。

东莞市李群自动化技术有限公司

东莞市李群自动化技术有限公司在本次工博会上展出了 Helios 系列 HL6-0700 六轴机器

人。这款机器人配合研磨工具对手机金属后盖进行打磨,能够使 CNC 加工后的手机金属后盖

表面光洁度提高。HL6 六轴机器人具备 IP65 防尘防水等级,使其在产出粉尘和水汽的打磨车

间得心应手地作业,同时高速的运动节拍使得打磨效率大大提高。它主要的特点是:提高打磨

质量和产品光洁度,保证产品表面一致性;提高了生产率,一天可 24 小时连续生产;改善工

人工作环境,机器人可在有害环境下长期工作;可再开发性,用户可进行二次开发和产品切换。

运动控制精品秀

登奇机电 GK9 伺服电机

本次工博会上,登奇机电发布了具备高转速密度、高速、高响应、高精度、小体积等特点,

特别适合于对安装空间有要求、高响应设备的 GK9 伺服电机。GK9 系列伺服电机对标国际领先

伺服电机产品,瞄准机器人、数控机床、自动化系统等装备高端应用需求,经过高密聚磁优化设计,

采用了高单位体积磁铁磁材料密度结构,是一款直接导热定子绝缘系统、整圆大口小齿槽转矩

直绕定子的十极伺服电机。

松下 RTEX 超高速运动控制系统

松下 RTEX 超高速运动控制系统作为专区单列出展,集结众多 RTEXClub 成员,突显与

各中国合作伙伴的共赢成果。自新一代 RTEX 超高速运动控制系统以来,松下总线系统 , 包

括 AC 伺服马达、PLC、上位合作伙伴等产品已深受国内客户的广泛青睐。通过不断深化的

创新合作,松下 RTEX 解决方案正在帮助越来多的行业用户提高生产效率。

第10页

25

专题报道

瑞萨电子非 ASIC 高端伺服单芯片解决方案

瑞萨电子推出非 ASIC 的高端伺服单芯片解决方案。该芯片集带 FPU 的高性能实

时 CPU(+ 紧密耦合内存)、多协议工业以太网加速器、多协议绝对编码器接口于一

体,提供一体化的 AC 伺服解决方案。

研华 Motion Studio 二次编程软件平台

这是专为 MAS 运动控制器设计的软件开发平台,集运动控制、视觉图像处理、逻辑

控制、通讯等各种控制于一体的二次编程软件开发平台,用户可以很方便地进行编程、配

置、诊断及调试,大幅缩短设备开发时间,完成专案开发。

皮尔磁安全运动驱控解决方案

Pilz 运动控制技术包含从运动控制系统和伺服放大器到伺服电机在内的一整套完整

的解决方案,包括所有安全方面(如 STO、SS1、SS2、SOS、SLS、SSR 等等)。其中,

PMCprotego S 和伺服放大器 PMCprotege D 的组合形成了安全驱动解决方案,安全

功能能帮助用户减少安装时间和维修工作量,提高生产力。

倍福 AX8000 全新的高性能多轴伺服系统

基于 EtherCAT 的 AX8000 紧凑型驱动系统将功能强大的 FPGA 技术和 ARM 多核处理

器完美结合在一起。FPGA 的控制算法和多通道电流控制技术能够实现电流环控制的采样和

响应时间小于 1 微秒以及低至 16 微秒的速度环控制循环时间。EtherCAT 周期时间最小为

62.5μs,对于运动控制应用,这意味着可以实现高控制性能和高精度定位,同时增加加工过

程中的轮廓清晰度并提高生产吞吐量,增高生产底线。

欧瑞传动 EAC200 运动控制器

欧 瑞 传 动 新 研 发 的 EAC200 运 动 控 制 器 支 持 LD、ST 等 6 种 编 程 语 言, 符 合

IEC61131-3 标准。EAC200 采用多核 ARMCortex-A9 处理器,提供了控制和可视化

的一体化软件开发运行环境。内置的高性能 EtherCAT 主站,可以连接 100 个以上从

站,同步时间误差< 1μs。此外,欧瑞传动还有 EH2000 系列电梯驱动一体机驱动器、

SD20-E 系列总线型伺服系统等精品展出。

第11页

26

专题报道

威纶通 cMT 系列新品

威纶通发布了新品 cMT 系列。其中,cMT-G01 具备高效能、远程存取、多样的通

讯网关界面、用户可自行编译宏指令、全面智慧化升级用户现有设备、连接物联网等特点。

9.7 吋的新机型 cMT3090 搭载双核 CPU,大力强化其资料与图像的处理效能;不仅是

一台人机界面,更同时兼具人机服务器的功能;使 cMT-iPC\/cMT-iPC15 或 cMT-iV5 执

行 cMT Viewer 即能连接 cMT3090,便于监控。

微秒 FusionCube 低压直流伺服驱动器 

深圳市微秒控制技术有限公司开发的 FusionCube 低压直流伺服驱动器基于驱控一

体化设计平台,将运动控制器和高密度驱动器整合在一个很小的体积中,方便服务各种

移动设备,同时集成高级运动控制和逻辑控制功能,支持多种编码器反馈类型及多种总

线通讯协议,兼容多种同步电机及安装方式,适用于物流系统、医疗设备、机器人系统

等应用领域。

LSIS 独立型伺服运动控制器 XMC-E32A

LSIS 独立型伺服运动控制器 XMC-E32A 以基于 EtherCAT-based 运动控制系统的配

置确保了运行效率,并通过紧凑型的控制系统设计,将 10 路数字量输入输出 \/2CH 模拟量

输入、编码器 2CH 输入和 Ether-CAT 端口以及 Ether-NET 端口涵盖其中,可以方便和高

速地连接控制系统。

工业机器人及核心器件联展

在今年以“创新、智能、绿色”为主题的第十九届中国国际工业博览会上,由中国运动控制联盟、中国传动网携手 11 家

联盟成员组成的“工业机器人及核心器件联展区”亮相工博会。展区以机器人核心器件类企业产品集群展示,展品涵盖伺服驱

动器、控制器、电机、减速机、编码器等多条产品线,专业技术人员面对面讲解交谈,增进业内技术交流,增加观展者对核心

器件的理解及感受,打造良好的观展体验,助阵智能制造发展。

武汉登奇机电技术有限公司

登奇机电在本次展会上展出的为金属成型行业专业伺服电机、六轴机器人伺服电机解

决方案以及 GK6 系列交流永磁伺服电机、GZ6 系列水冷电机、GM7 系列交流伺服变频(主轴)

电机、GE1 系列用 IPM 交流伺服电机等产品。登奇还举办了新品发布会,隆重发布 GK9

系列伺服电机。这是一款对国际领先伺服电机产品,经过高度聚磁优化设计,采用高单位

体积磁铁磁材料密度结构,直接导热定子绝缘系统、整圆大口小齿槽转矩直绕定子的十极

伺服电机。

第12页

27

专题报道

深圳锐特机电技术有限公司

锐特机电展出了步进伺服电机与驱动器,步进电机与驱动器,可编程控制器与人机界面等产

品。其产品通过给步进电机增加位置反馈,结合磁场定向 (FOC) 与弱磁技术,使步进伺服特别适

合于中低速的自动化设备;采用超前角控制算法,无需复杂伺服环路调试,兼具步进电机的高刚

性与伺服系统的精度;高效率的 FOC 算法,超低温升,极大提升步进电机效率,可根据不同负载

的响应要求进行伺服调试。

台安科技(无锡)有限公司

台安科技在本次展会上展出了新一代高性能交流伺服系统 G2S。G2S 系列拥有 1.5KHz 的高

速频率响应,搭配 23Bit 的精准高分辨率,搭配 CANopen\/EtherCAT 高速通讯,内建多种应用功

能(龙门同动 \/ 电子凸轮 \/ 全闭回路),Auto-Tuning 自学习功能进一步提升,机种功率范围在

0.1kw ~ 15kw。此外,作为系统化(SI)解决方案提供者,台安科技还提供从马达到驱动器,再至

控制器,搭配上人机界面的自动化整合方案,针对不同行业的需求,搭配不同的自动化系统解决方案。

深圳市吉恒达科技有限公司

吉恒达今年展出的是不断创新升级、更新换代设计,开发出的一系列结构紧凑的高性价比

散热风扇,该散热风扇防尘和防水等级更高,能在各种复杂环境下使用,主要使用在高低压变

频器设备、伺服与传动设备、数控机床等行业。

深圳市正弦电气股份有限公司

正弦电气在联展展台上展出的是 EA180 系列总线型伺服系统,该伺服系统具有完备的产

品系列,支持多种编码器;响应速度频率高达 1kHz,具有 4 个高频震荡抑制陷波器,通讯同

步实时性行业领先;配合 17bit 增量、23bit 绝对值编码器,配合强大的控制性能,定位精度

小于 5 个脉冲;接近业界标杆的 小体积,配额正弦超短电机系列,可实现客户系统小型化;同时,

完整保护功能及 EMC 设计搭配高性能电机材料和工艺,确保了系统的可靠运行。

富士电机(中国)有限公司

富士电机带来了富士伺服系统 ALPHA5 Smart PLUS 和富士综合控制器 MICREX-

SX 系列。ALPHA5 Smart PLUS 具备单项输入机型扩展、无风扇构造、经济型无螺纹端

子和小型化电机等构成;采用了 PTP 定位,可一台 3 用;Modbus-RTU 通信协议,操作

简单;长寿命设计,比别的产品更高的使用时长;ABS 电池更换简单。富士综合控制器

MICREX-SX 系列支持高速高功能的运算性能,提供丰富的选购件,可依用途灵活选用,支

持 200kHz、4 轴伺服系统,支撑国际标准 IEC61131-3。

第13页

28

专题报道

常州展帆电机科技有限公司

展帆展出的伺服电机为全系列“5 对极”设计,目前已量产化的系列有 60、80、110、

130;40、180 系列已处于样机测试阶段。展帆伺服电机采用 10 极电机转子、12 槽电机电子设计,

降低了约 65% 的电机脉冲转矩;优化的马达电磁结构设计,降低了成本,提高了效率与可靠性;

通过 SDP 和高分倍率编码器的的运用,可实现高精度定位及低稳定性,保证了 500HZ 速度响

应频率;编码器选型灵活,可根据客户需求自由选择编码器与定制反馈信号。

杭州日鼎控制技术有限公司(杭州兆鼎科技实业有限公司)

日鼎是一家专业从事研发生产伺服驱动装置的高新技术企业。本次展会,日鼎带来了

新品 GHA 高性能系列伺服驱动器,产品集成高、体积小、运行稳定;采用了硬件保护和

软件报警多重保护,安全可靠;响应快、跟随性好、精度高、生产效率高;操作简单,安

装参数设定好即可正常工作;散热性能好,返修率低;对其他设备无干扰现象。

杭州摩恩电机有限公司

摩恩电机今年带来的是全系列交流永磁同步伺服电机(40、60、80、90、110、130、

150、180、220),产品规格齐全、功能强大、性能稳定,在国内同行业中处于领先地位,

广泛应用于数控机床、激光加工机、包装机械、雕刻机、绕线机、工业机器人、木工机械等领域。

深圳市科力尔电机有限公司

科力尔电机具备二十五年电机制造历史,每年 3500 万台动力产品在科力尔电机诞生,

所生产的罩极电机中国第一,目前科力尔电机正转型升级生产高品质伺服电机。本次展会科

力尔电机展出了 KS 系列、40 系列、60 系列、80 系列、110 系列等伺服电机。科力尔电机

具备五对极、十二槽、磁环式、波动小、分体式、槽满高、尺寸小、转矩高、噪音低、振动

小、温升低、密度高、工艺严、尺寸精、一致强、故障少、过载强、转速高、应用广、性价好、

通用型、专用型、可定制、品相好、质量优、有三包、服务好、体验妙等特点。

广州市韦德电气机械有限公司

韦德电气是国内最早从事伺服运动控制研究和生产的国家级高新技术企业之一,本次工

博会韦德电气带来了 B2 系列伺服驱动器。B2 系列伺服驱动器采用位置模式、速度模式、扭

矩模式、内部速度模式和 MODBUS 通信控制模式,支持 2500 线增量式编码器、17\/23 位

绝对值编码和低成本磁编码器。内置高精度、高响应 PID 算法模块和 PLC 功能,含高精度

ADC 电流采样芯片,采用末端震荡抑制技术,集成 EethCAT、CANopen 等总线型协议,精

确控制伺服电机力矩,精度和稳定性媲美德国、日本同类产品。

第14页

29

特别报道

精英荟萃,互享见解,为 AI 产业落

地深圳热场

——智能专委会“走进腾讯AI Lab”活动

近日,深圳市机器人与智能系统专家委员会(以下简称“智能专委会”)委员发起“智能专委会走进企业系列主题”分享会,

智能专委会委员、深圳市机器人协会会员共 30 人参会,共同从科学家、企业家、技术专家的视角,解读人工智能领域最

前沿技术、最新进展及未来发展方向。

组编 \/ 编辑部

第15页

30

特别报道

近日,智能专委会走进企业系列主题分享会由智能专 12

委会发起,从科学家、企业家、技术专家的视角,解读人

工智能领域最前沿技术、最新进展及未来发展方向。智能 34

专委会——走进腾讯 AI Lab“从 Gartner 新兴技术成熟度

曲线看 AI 技术演进和产业发展”为智能专委会首期活动。 5

会议邀请到腾讯 AI Lab 副主任俞栋博士就人工智能技术的 这些产品和技术大规模应用下去,形成“技术垄断”;最

发展状况和趋势,与智能专委会委员及深圳市机器人协会 后就可以形成“市场垄断”,从中获益。这其中的问题就

会员共同讨论如何找到人工智能的落地机会、如何在深圳 在于如何在混沌市场中从人开始抓住生态的养成,形成产

形成产学研共同支持进步的人工智能生态。会议由智能专 业化的 AI 教育,最终覆盖各个层面。

委会秘书长邹月娴教授主持,来自智能专委会委员、深圳

市机器人协会会员共 30 人参会。 此外,华为消费者 BG 软工副总裁兼智慧工程部部长

张宝峰(图 5)结合他在华为的工作经验,首先阐述了中

会上,智能专委会秘书长邹月娴(图 1)首先从产业 国 AI 人才底子薄的状况,然后介绍了华为对 AI 人才的培

趋势角度出发,认为 AI 技术方面学界和产业界结合非常紧 养方式、对 AI 研究和 AI 生态的举措,以及 AI 计算的未来

密,同时,AI 技术也正在从技术开拓型的公司逐渐向技术 趋势。

跟进型的公司扩散。在这种情况下,她的疑问在于如何看

待 AI 技术的产业走势,AI 技术又如何在深圳市落地? 在会议室中,各位参会的专家、学者、企业管理者等

展开了热烈的讨论,稍后的晚宴上也进行了更深入的交流。

深圳市机器人协会秘书长毕亚雷(图 2)希望学术界 此次会议为参会者带来了一些人工智能时代应该如何应对

人才能和业界企业建立联合实验室。业界企业有着许多具 的直观感受,大家也都期待深圳的 AI 产业能够像电子信息

体应用场景的经验和数据,而学术界有许多新颖的方法但 产业一样快速落地、快速发展壮大,形成健康的产学研联

找不到好的应用场景,联合起来之后,业界企业也就能更 动生态,让中国的 AI 企业、AI 产品成为 AI 应用的主力军。

好地想办法让技术落地。毕亚雷秘书长列举了曾经和腾讯

联合研发腾讯小 Q 机器人的例子,在他看来这虽然不是一

个成功的产品,但这是一个典型的案例,研发过程中实验

室培养了许多人才;这样的合作如果能更多一些,就能形

成更多的研究和应用联动,促进并维持蓬勃的生态。

腾讯 AI Lab 副主任俞栋博士(图 3)表示赞同研究和

企业需要合作的观点,同时分享了他对创业路径的看法。

对于“先找场景再找技术”和“先有技术再找场景”,他

认为后者很难成功,需要综合性的技术;从场景开始创业

更容易成功。

由于互联网时代大企业经常通吃,对于“AI 时代是否

是小企业的机会”,在场者心中都有所期待。俞栋博士认

为大小企业各有各的机会,比如美国专精某一小部分问题

的创业公司。

深圳信息职业技术学院校长孙涌(图 4)介绍了他认

为的生态链条。他认为,首先要通过研究和应用的结合构

造“人才垄断”,即培养出的人才都自然而然地使用某一

类产品或技术;然后进入到各个企业的这些人才会继续把

第16页

31

对话

华为轮值 CEO 徐直军:AI 将

以新技术应对快速变化的世界

从中国的角度来看,消费者的需求在变化、企业的需求在变化、政府的需求也在变化,而技

术的变化更是眼花缭乱。短短的五、六年时间,制造业涌现出很多新的名词:云计算、大数据、

AR、VR、自动驾驶、人工智能等。

组编 \/ 编辑部

与此同时,商业模式也在快速变化,商业模式的变化往往是 华为轮值 CEO 徐直军

企业能不能在另外一条赛道上去竞争的关键。如果说企业在同一

赛道竞争拼的是实力,那在另外一个赛道的竞争拼的就是快。 从智能迈向智慧,AI 新一轮的复兴才开始

比如说,金蝶在转向云化这方面,就是比别人快了一步才有 作为一种通用技术,人工智能不仅使我们能以更高的效率解

了今天的增长。 决已经解决的问题,也可以解决很多没有解决的问题。所以能不

能具备真正的人工智能的思维,以人工智能的技术解决现在的问

如何应对这一快速变化的世界是每个企业都面临的挑战和需 题,以及解决未来的问题,这是我们能不能在未来竞争中构筑领先、

要解决的课题。只有这样,企业才有可能不在同一个赛道上与竞 构筑优势的关键。

争对手拼实力,而是在另外一个赛道上,去跟传统赛道的对手竞争,

开始步子可能很小,但是未来发展会很快。

回顾这么多年,中国很多企业更多地是通过拷贝去参与全球

的竞争。但是今天,华为不再走“Me  Too But Cheaper”的道路,

而是准备直接面对快速变化的需求,用新技术和新商业模式走出

一条创新之路。

比如说制造业,首先要关注的是整个消费的升级。现在消费

者的需求不再像过去那样低成本、便宜就能解决问题,而是需要

品牌,需要品质,需要个性化。要有品牌就必须要有创新,就必

须为客户提供更高质量的产品和服务,那就必须要有研发的投入。

以往,华为每进入一个产品、每进入一个产业持续研发投入,平

均的当期盈亏平衡点是 8 年,对现在很多企业而言,投资研发要

在 8 年之后才能创造效益,是很难接受的。但是只要持续投入,

依旧能在这个产业上赶上来、实现领先,最终在全世界领导这一

行业。

第17页

32

对话

现在对人工智能没有一个准确的定义,不同的表述各有侧重 础是数据,未来每个企业、每个行业都需要大量的数据分析师,

点和立足点。 还要有建模的工程师,要对模型进行训练。所以在很多职业消失

的同时,又会产生很多新职业,人类社会本身就是这样不断进步的。

其实人工智能的机制很简单,也因此应用种类非常多。基于

大量的数据、算法、训练、建立一个模型,然后输入一个 A 就能 当然人工智能还有很多的局限,比如:AI 目前还只擅长于范

得到一个响应 B,不同的输入和输出就产生不同的应用,例如:标 围狭窄的任务;同时 AI 更像做研究而不是工程性开发实施,需要

注照片、贷款审批、精准在线广告、语音识别等。这种基于机器 大量的实验或具有丰富经验的工作人员;需要大量准确的数据,

学习的方式虽然目前还无法解释,反正结果就是这样的,但已经 数据越好,性能才会好,如果数据是恶意的,AI 还会被愚弄,给

达到了很好的结果,应用到了非常广泛的领域,而且会越来越广。 出错误甚至有害的结果;AI 是不透明、无法解释的,应用于要求

因此我们一定要客观地看到 AI 将改变每一个行业,甚至是每一个 结果可预测的某些关键任务时还存在挑战,等等。

企业。作为企业,不仅要看到各种各样的人工智能技术,更要重

新思考人工智能会怎样影响和改变构成企业的各个职能部门,从 人工智能的新一轮复兴才刚刚开始,技术能力上还有很大的

销售到营销,到财务管理,到本地资源管理,到业务一切的一切。 改进空间。首先从技术上看,人工智能的算法早就有了,深度神

经网络的框架算法自上世纪 80 年代以来没有本质的变化,为什么

同时,每一个行业都有可能受到人工智能的影响,甚至也有 最近几年发生了变化,主要是计算能力提升,而且有了大量的数据,

可能因为人工智能而被彻底颠覆。众所周知,未来最能颠覆的一 这样就促进了人工智能的发展。而且未来人工智能的发展会继续

个产业就是汽车产业。自动驾驶电动汽车可能将中国 16 万亿产值 依赖于计算能力的进步,并对算法的可扩展性提出了要求,所以

的汽车业,包括周边产业,彻底颠覆掉。当然,人工智能也有可 未来算法很关键,算力也很关键。其次,企业的领导们首先想到

能颠覆医疗和健康产业,也有可能颠覆教育产业。身处每个行业 的大多是把人工智能用于在现有事务中提升效率,实现自动化,

的人都要思考,人工智能将如何影响自己的行业?是否会颠覆自 减少人力等。其实,更要做的是,尝试用人工智能去解决未知的

己的行业?因此,如何以一种全新的模式来重构各自行业,是人 事情和去解决没有解决的问题。所以从企业来讲,从领导到全体

类未来要去思考的问题。还要重新思考人与机器未来的互动,未 员工都要建立起人工智能的思维,主动思考用人工智能去解决已

来怎样互动,人机接口到底是怎样等等。尽管人工智能还处于初 知和未知的问题。另外一方面,人工智能的人才是非常火,价码

级阶段,但是它作为一个通用技术对于我们各个企业、各个行业 很高,其实从外部获取人才只是手段之一,是培训内部的员工来

所带来的冲击将是巨大的,需要我们在各个方面进行重新思考。 掌握人工智能,再以人工智能的思维和方法去解决问题,与自身

的业务紧密结合,在解决问题中不断学习,螺旋式上升,不断提高,

从手机来理解是最简单的,现在的智能手机并不智能,智能 可能更为有效。

手机演变成为一个“懂我、感知我、主动响应我、提醒我”的智

慧手机就成为必然。去年四季度华为做了尝试,从智能手机向智 从华为来讲,今年的 HC 大会上发布了一个企业智能平台,

慧手机迈进一步,发布了 Magic 智慧手机。 旨 在 为 企 业 提 供 一 站 式 的 人 工 智 能 平 台 型 服 务, 丰 富 细 颗 粒 的

API,适配多样化行业领域的丰富算法,以及异构计算基础设施,

当然,AI 还将改变每一个组织。过去整个企业的组织架构是 使大家能够用各种人工智能的算法来解决实际问题。当然,华为

三角形结构,上面是领袖、专家,中间是业务骨干和基层管理者, 还在努力完善当中,其目标是:让所有的企业,在所有的职能和

下面是基层员工。未来的组织将是菱形结构,大量重复性的工作 所有的产品上,使用人工智能时更简单、更容易、更方便、更快捷。

可能都被人工智能取代,由机器人来完成。就像财务一样,如果

金蝶小 K 真正完成了大量的财务工作,会计就没事干了。Gartner 从手机来讲,余承东已经发布了华为的移动人工智能战略,

预计,2018 年全球将有 300 万人受到机器人的领导。现在滴滴打 目标是未来使用的华为手机能够成为用户的私人数字助理,使得

车、Uber 打车的司机就是由机器人在领导。 手机不仅仅是打电话、上网,而是实现更广泛的感知和认知,从

而成为一个未来助手。为此,余承东也发布了全球首个配备专用

人工智能还会改变每一个职业,通过就人工智能对美国职业 神经网络处理器 NPU 的智能手机芯片麒麟 970,基于该芯片的

的影响分析,麦肯锡指出 60%的职业的的所有工作任务中 30%将 Mate10 系列手机的人工智能应用性能得以大大增强,比如把每分

会被自动化。中国的职业可能会有所不同,但是可以肯定地说, 钟照片识别量大幅度提升数倍。

因为人工智能的到来,大量的重复性工作都会实现自动化,甚至

少数一些职能性的智能,尽管需要靠人动脑,也会被取代。所以说, 华为云,抓住本质,志在长远

人类相当多的职业会消失,当然也没有那么可怕,人工智能来了

以后将会产生许多新的职业,比如说数据分析师。人工智能的基 华为从 2008 年决策投资 IT 产业,在过去,华为主要是做通

第18页

33

对话

讯的,而投资 IT 产业的主要目标就是云计算,也就是云计算的技 政府的私有云和政务云上,反过来也一样。这样,所有的软件和

术变革带来了进入产业的机遇,那是 2008 年的预测,事实也是如 应用开发者基于华为云开发的应用,既可以部署在私有云上,也

此。直到今年,华为取得了丰硕的成果。在云计算方面,2009 年, 可以部署在公有云的需求。

华为的总裁任正非发布了一个讲话,对华为公司来讲,云计算是

颠覆性的技术,会颠覆 IT 产业,包括有可能颠覆电信网。这几年 在物联网的生态里面,华为有 50 多个解决方案的案例,通

取得了快速发展,根据 IDC2017 年发布的报告显示:在中国政务 过物联网的技术带来与过去完全的不同,比如说,华为以物联网

云市场和大数据市场,华为都是排名第一。在面向企业客户的大 做环境监测、做安全生产监测等。华为本身在物联网的定位就是

数据统一平台和云操作系统,华为都取得了非常好的成果,市场 使能者,支持合作伙伴基于华为云的物联网连接平台以及芯片解

占有率非常高。 决各行各业的问题,来创造价值。其实,物联网来了,云来了,

云 + 物联网有可能能解决各行各业想解决而未解决的问题,从而

其次,华为云作为华为的公有云品牌。华为把云计算的技术 为客户创造价值,为企业创造价值。

用在解决大企业的 IT 架构云化改造以及企业的大数据分析,在公

有云原有的技术基础上增加了运营系统,让企业更方便、简单地 关于公有云,我认为它不仅仅是互联网应用,而是体现了一

购买云服务;然后,又增加了运维系统,让用户有任何问题可以 个企业长期的技术和经验积累,也是研发实力和创新实力的综合

得到快速响应。此外,华为还加强投入,将公有云和私有云并列 体现。它的本质是 ICT 基础设施、人工智能、IOT 等技术和产品,

发展以后,为客户提供混合云解决方案,在运营、运维系统上来 只是改用服务的方式提供给客户。正如华为一直强调互联网手机

满足客户的需求。 的本质还是手机,只是以互联网的方式把手机快速地卖给用户一

样,只有“+ 互联网”才能更好地面向未来。我华为开创的荣耀

从云的角度来讲,首先,华为云不仅仅是计算 + 存储 + 网 手机品牌便是采取“+ 互联网”方式。华为云也是以互联网的方

络 + 安全,而是计算 + 存储 + 网络 + 安全 + 物联网 + 大数据 + 式将我们所有的积累和投资,最终用云服务的方式面向客户。另外,

人工智能,为客户提供全堆栈解决问题。其次,华为云不仅仅是 不是任何企业都能在公有云市场上持续活下去,这里指的是公有

软件与服务,而是软件 + 服务 + 芯片 + 硬件 + 生态,真正解决 云基础设施方面。

企业对 IT 基础设施、人工智能、物联网的所有需求。另外,华为

云不仅仅是线上提供服务,而是线上线下相结合解决客户问题, 客观来讲,在中国,越来越多的问题需要用技术解决,越来

助力企业向 IT 转型,也能支撑起金蝶这样的软件和应用提供商, 越多的问题可以用技术解决。华为作为快速变化时代的企业,怎

以云的方式更好地服务客户。还有,华为的公有云和私有云是并 么在中国的竞争中、在全球的竞争中,如何在另外一个赛道上与

行发展的,同一套架构和同一套 API,这样应用能够自由迁移,也 传统竞争对手竞争,以另外的方式面向客户,这显得相当关键。

就是在华为云上开发的应用,可以部署在华为已经部署在企业、 事实上,华为更应该用新的技术、新的理念去解决传统的问题,

使之效率更高、更自动化,进一步减少和节省人力。同时,以新

的技术、新的思维模式去解决未解的问题和未知问题。

从华为角度来讲,华为希望通过投资把一些核心技术解决,

把平台打造起来,提供“连接 + 云平台”,这样合作伙伴基于华

为公司领先的技术和平台,利用新的商业模式去面向未来。华为

云讲过“两不”,即不碰数据、不碰应用,如今增加了一个“不”,

即不做股权投资,这就是华为的“三不”。

第19页

34

产业研究

2017 年中国

人工智能产业报告

2017 年 4 月 1 日,全球领先的移动互联网第三方数据挖掘和整合营销机构 iiMedia Research( 艾

媒咨询 ) 权威发布《2017 年中国人工智能产业专题研究报告》。报告显示,中国人工智能产业规

模 2016 年 已 突 破 百 亿, 以 43.3% 的 增 长 率 达 到 了 100.60 亿 元, 预 计 2017 年 增 长 率 将 提 高 至

51.2%。艾媒咨询分析师认为,中国人工智能产业起步相对较晚,但产业布局、技术研究等基础设施

正处于进步期,随着科技、制造等业界巨头公司的布局深入,人工智能产业的规模将进一步扩大。

文 \/iiMedia Research(艾媒咨询)

什么是人工智能 ? 亿元,见图 2。

艾媒咨询分析师认为,中国人工智能产业起步相对较

经过超过半个世纪的发展,人工智能已经渡过了简单

地模拟人类智能的阶段,发展为研究人类智能活动的规律, 晚,但产业布局、技术研究等基础设施正处于进步期,随着

构建具有一定智能的人工系统或硬件,以使其能够进行需要 科技、制造等业界巨头公司的布局深入,人工智能产业的规

人的智力才能进行的工作,并对人类智能进行拓展的边缘学 模将进一步扩大。而随着众多垂直领域的创业公司的诞生和

科,其涉及到信息论、控制论、计算机科学、自动化、仿生 成长,人工智能将出现更多的产业级和消费级应用产品。

学、生物学、心理学、数理逻辑和哲学等自然和社会科学。

根 据 统 计 数 据, 中 国 人 工 智 能 相 关 专 利 申 请 数 从

根 据 风 投 调 研 机 构 CB insights 统 计 的 数 据, 截 至 2010 年开始出现持续增长,于 2014 年达到 19197 项,

2016 年 12 月 20 日,全球人工智能领域融资事件数已达

635 宗,预计 2016 全年将达 655 宗,总融资额将达 5.1 图1

亿美元,见图 1。

艾媒咨询分析师认为,互联网的发展给全球互联网科

技企业带来了丰厚的营收,而基础研究的进步使得人工智

能的商业化得到了很好的支撑,众多创业公司涌现,人工

智能的广阔应用前景是对资本的最大吸引力。另一方面,

随着资本参与度的提高,人工智能产业的发展势能也得到

了很好的积累。

中国人工智能产业处于上升阶段

iiMedia Research( 艾媒咨询 ) 数据显示,中国人工智

能产业规模 2016 年已突破 100 亿,以 43.3% 的增长率达

到了 100.60 亿元,预计 2017 年增长率将提高至 51.2%,

产业规模达到 152.10 亿元,并于 2019 年增长至 344.30

第20页

图2 35

图3

产业研究

图4

并于 2015 年开始大幅增长,达到 28022 项,2016 年,

中国人工智能相关专利年申请数为 29023 项,见图 3。

艾媒咨询分析师认为,2010 年移动互联网开始发展,

技术和数据积累给人工智能研究带来了较大的增长动能。

进入 2015 年,在国内外人工智能研究和应用场景不断进

步的基础上,中国人工智能相关研究开始进入高速发展阶

段。这说明,中国人工智能研究水平正在处于不断提高的

阶段,目前已取得一定阶段性成果,有望持续发展,预计

2017 年专利申请数将持续增长。

人工智能产业是一个广阔的领域

人工智能产业是指以人工智能关键技术为核心的,由

基础支撑和应用场景组成的,一个覆盖领域非常广阔的产

业,与人工智能的学术定义不同,人工智能产业更多的是

经济和产业上一种概括。

典型上市公司——百度

百度是较早布局人工智能的企业之一,自 2013 年起

图5

第21页

36

产业研究

就开始投入研发,人工智能是百度战略和战术上的核心, 图6

基于庞大的基础数据和计算能力,有非常大的研究投入和 图7

团队建设,涉及多项人工智能相关技术领域,目前已有多

款成功产品。

典型上市公司——科大讯飞

科大讯飞创始于 1999 年,是国内出色的智能语音和

语言技术企业,将人工智能应用到语音识别、自然语言处

理、语音合成等技术领域,包括应用产品、解决方案等产品,

是国内智能语音和人工智能领域的杰出代表。

人工智能创业公司处于成长阶段

iiMedia Research( 艾媒咨询 ) 数据显示,2016 年人

工智能创业公司发生融资事件 77 起,其中包括商汤科技 1.2

亿美元、碳云智能 10 亿人民币等大额融资。轮次分布方面,

根据公开信息,有 27.4% 的公司未获投,其中 39.3% 的

公司处于 A 轮 ( 包括 Pre-A 和 A+),而处于天使轮的公司

则占比 21.4%,处于 B 轮 ( 包括 B+) 的公司有 7.7%,仅

有 2.4% 的公司已经进入到 C 轮及以上,见图 10。

艾媒咨询分析师认为,中国人工智能创业发展较晚,

超过一半的公司成立时间在两年之内,较高的获投率也说

明了资本市场对人工智能产业发展的信心。目前超过 60%

的人工智能创业公司集中在 A 轮和天使轮阶段,说明了大

部分人工智能创业公司正处于成长期,在技术和资本的支

持下,后续的发展成长值得期待。

语音识别的人工智能水平最受认可

iiMedia Research( 艾媒咨询 ) 数据显示,有 46.0%

的手机网民认为语音识别是人工智能发展水平较高的领域

之一,见图 11,紧随其后的是智能家居,得到了 40.5%

的手机网民的认可,而机器人、智能驾驶、个人助手、无

人机等领域亦得到了较多的手机网民认可,其中,智能安

防和智能金融的认可度较低。

艾媒咨询分析师认为,语音识别作为发展较为充分的

领域之一,不乏科大讯飞等出色企业,有着较为成熟的产

品体系,已经实现了较大范围的应用落地,是用户较为熟

悉和满意的细分领域。

智能家居被认为最具发展价值

iiMedia Research( 艾 媒 咨 询 ) 数 据 显 示,41.0% 的

第22页

37

产业研究

图8 图9

手机网民认为智能家居是最具发展价值 ( 包括社会、经济 案和服务为主。一方面,B 端业务注重与行业客户的互动合

等价值 ) 的领域之一,见图 12,紧随其后的是智能驾驶、 作,更有利于人工智能技术和产品的落地 ; 另一方面,行业

机器人、智能医疗等,而仅为 9.7%、9.2% 的手机网民认 客户对于生产效率的提高有强烈的需求,而 C 端产品需求

为智能金融、可穿戴设备存在较大发展价值。 仍需挖掘。不过,大公司的 C 端产品布局依然是相对活跃的。

3. 人才成本较大,存在较大的需求缺口

艾媒咨询分析师认为,智能家居一方面范畴较为广泛,

涉及众多的家庭产品,另一方面与人们的日常生活息息相 技术方面,以深度学习为代表的机器学习算法研究是

关,得到充分发展的智能家居,能够很大程度地改善人们的 广泛的基础能力,但目前国内在此领域的人才供应相对紧

生活。智能驾驶、机器人、智能医疗等领域,既能够有效地 缺,流通性较弱,因此也导致了高端研究人才的超高成本,

提高生产效率,又能够在生命健康方面给社会带来价值。 同时有部分公司选择在美国建立研究院或实验室。这说明,

作为知识密集型产业的典型代表,人工智能产业存在较大

中国人工智能产业特征总结 的需求缺口。

4. 传统行业和技术给予充分的支持

1. 大公司产业链布局广,创业公司专业性强

产业链特征方面,中国人工智能产业生态中,基于资 产品方面,目前仍缺乏一定的革命性产品,更多的是

利用人工智能技术对传统行业产品的改良。在这个过程中,

源能力,大公司的参与布局较广,在基础层、技术层及应 医疗健康、装备制造、汽车、金融等行业给予了人工智能

用层皆有所布局。中国不乏优秀的人工智能公司,大部分 产业充分的支持,通过合作开发等方式,助力人工智能技

专业性较强,专注于某一细分领域的技术和应用研究,其中, 术的应用落地和商业化。

计算机视觉领域集中了大批的优秀创业公司。但是,各应

用场景之间的人工智能技术相关度存在一定的差异。 中国人工智能产业趋势预测

2. 以 B 端业务为主

1. “人工智能 +”有望成为新业态

商业模式方面,大部分公司的业务主要以 B 端解决方

第23页

图 10 38

产业研究

图 11

在移动互联网时代,“互联网 +”的出现给经济发展 图 12

带来了重大影响,艾媒咨询分析师认为,随着专用人工智能

的发展,作为一个庞大的高新技术合集,“人工智能 +”作

为一直新经济业态已经开始萌芽,越来越多的行业开始拥抱

人工智能,用“人工智能 +”助力技术和产业的进一步发展。

2. 人工智能产业将成为独角兽集中地

在大公司和传统大型企业之外,人工智能产业集中着

非常多的优秀创业公司。优秀的人工智能创业公司有着成

熟的团队配置、先进的技术能力、健康的现金流等,同时

受资本方的认可度较高。艾媒咨询分析师认为,人工智能

作为最具前景的产业,将成为新的独角兽集中地。

3. 人才储备将成为制约中国人工智能发展的重要因素

从目前来看,虽然相关机构的研究表明华人的人工智

能学术成果占全球一半以上,但中国人工智能技术和产业

在大部分领域仍落后于全球一流水平。虽然中国在数据积

累和传统产业基础上有一定的优势,部分细分领域有领先

成果,相关研究投入不断加大,但整体上的人才储备落后

于美国,在基础研究、产业链等方面存在较大挑战,将成

为制约人工智能发展的重要因素。

4. 人工智能全面发展需要更多的积累

真正的强人工智能缺乏基础,人工智能技术更多的是

依靠机器学习和计算能力促进生产力的发展。理性地看,“机

器统治人类”的奇点恐惧缺乏一定的基础,虽然人工智能

已经在机器学习等关键领域得到了一定的突破,但更多的

是属于专用人工智能,往通用人工智能等更高层次的发展

仍需积累。

第24页

39

热点资讯

国内 中国首台手术机器人已做 4 万余例

手术

全球机器人市场规模增长近 17%,中国平均增

长率达 28% 根据设在上海的长海医院手术机器人国际培训中心提供

的数据,从 2006 年引进首台手术机器人至今年 2 月,

《2017 中国机器人产业发展报告》是中国电子学会机器人产业研究的 我国已累计开展 4 万余例机器人手术,机器人走上手术

最新成果,报告深度解析我国各区域机器人产业发展水平,对国内外 台已成为现实。保障机器人手术安全,安全性设计是最

机器人技术与产业发展态势进行比较分析。报告预计,2017 年全球机 基本的保证。中国科学院深圳先进技术研究院研究员欧

器人市场规模将达到 232 亿美元,2012-2017 年的平均增长率接近 勇盛说,机器人机械臂设计模仿人手功能,可自动滤除

17%。2017 年,预计我国机器人市场规模将达到 62.8 亿美元,2012- 震颤,一秒钟可纠正上千次,即便医生的手出现轻微颤抖,

2017 年的平均增长率达到 28%。其中,工业机器人 42.2 亿美元,服 装有手术器械的机械臂

务机器人 13.2 亿美元,特种机器人 7.4 亿美元。 也不会抖动。但真正能

带给患者安全感的还是

武汉投资 100 亿元开发行业特种机器人 操作机器的医生,智能

化的工具需要更智能的

星河集团日前与武汉市签订战略合作协议,双方将共同投资 100 亿元在 人来掌控它。

武汉建设星河机器人产业园,推进工业机器人、服务机器人和特种机器人

的开发应用。 移动 AGV 市场火爆,海康、国自、

此次签约的星河机器人产业园项目将主要依托武汉完善的汽车产业链,通 Standard robots 、GEEK+ 四强

过对底盘、机械臂及视觉控制系统的智能化升级改造,生产智能化汽车、 格局凸显

自动驾驶汽车和试驾机器人等,填补国内在这一产业领域的空白。同时,

产业园还将研发生产水下机器人、排雷机器人、高空作业机器人、防爆机 根据权威机构 Tractica 的预测,到 2021 年全球仓储和

器人等特种行业机器人。 物流机器人出货量,将从 2016 年的 4 万台激增至 62

万部。整个行业的市场收入将随之从 2016 年的 19 亿

美元增长至 224 亿美元。十倍以上的增长,将让这些

自主研发技术,掌握核心科技的机器人巨头,拥有无法

估量的发展前景和市场估值。

经过几年发展和洗牌,智能仓储与柔性物流行业已经初

步形成格局。第一梯队中又以国自机器人、GEEK+、

海康机器人、Standard robots(斯坦德机器人)四家

的技术和产品最为亮眼,具有自主核心技术及行业应用

方案的公司即将杀出重围。

第25页

40

热点资讯

法律机器人进驻北京法院提供智慧诉讼服务 国内

日前,在北京市第一中级人民法院诉讼服务大厅,面对一名咨询者的提问, 新松家宝云计算机器人新品首发

法律机器人“小法”在电子屏幕上弹出反家暴法相关条文。据了解,随着北

京法院诉讼服务的提档升级,包括法律机器人在内的“智慧诉讼”正逐步铺 近日,新松机器人在沈阳老博会上重磅推出公司首

开,为百姓带来全新的诉服体验。 款基于云计算的学习型养老机器人——新松家宝。

这名身高近 1.5 米、蓝白相间的法律机器人“小法”能够启动法律咨询模式, 随着我国逐渐步入老龄化社会,传统的养老方式越

通过语音识别提问,将在互联网云端储备的7000多部法律法规进行搜索 来越难以满足社会发展和民众需求。以机器人、“物

后弹窗答案。据悉,除“小法” 联网”、人工智能等为主题,新松家宝机器人小小

等人工智能之外,北京市一中院 的机身里潜藏了大能量,不仅包含智能看护、亲情

的诉服智能化还体现在自动查询 互动、远程医疗、家政服务

设备、当事人信息智能扫码、手 等功能,还拥有强大的家庭

机APP诉讼流程通知等 30 余 卫士、环境感知、自主学习

项智能化设施,基本实现对常见 等黑科技,新松家宝独家采

法律问题、诉讼程序问题、开庭 用先进的 SLAM 算法加红外

公告等诉讼服务内容的全覆盖。 辅助对环境进行建模,实现

自主行走、避障、漫游、充电。

库卡在中国的机器人产能预计将翻倍 同时,新松家宝内置顶级的

语音识别模块,能够在 5 米

近日,库卡 (KUKA) 公司总裁 TillReuter 在与记者的电话会议中表示,中国 范围内轻松识别人类语言,

是目前公司最大的市场,在中国上海的库卡机器人产能将翻倍。 进行语音交互。

TillReuter 指出,预计到 2020 年 40% 的工业机器人将在中国销售,但在

中国市场的扩张并不会影响在德国本土奥格斯堡的生产。去年,库卡公司 爱仕达拟收购松盛机器人、劳博

被中国美的集团收购。库卡业务今年达到预期值,预计今年销售额将增长 物流部分股权

12% 达到 33 亿欧元,前九个月的新订单量增长 5.8%,已达到近 28 亿欧元。

库卡公司自 2000 年进入中国市场,凭借在生产自动化和机器人领域 110 日前,上海爱仕达机器人有限公司发布公告,将

多年的专业知识和丰富经验,不断拓展在中国的业务范围。2017 年 1 月 拟以自有资金 3750 万元收购意欧斯持有的松盛

11 日,库卡公司在上海举行中国二期厂房奠基仪式,宣布再次加大对中国 机器人 50% 股权,并对松盛机器人增资 2000 万

的投资,以期更好地满足中国市场对工业自动化的需求。 元,增资完成后,爱仕达机器人持有松盛机器人

60.53% 股权。另外,爱仕达机器人拟以自有资

金合计 510 万元分别收购意欧斯持有的劳博物流

44% 股权及松盛机器人系持有的劳博物流 7% 股

权,收购完成后,爱仕达机器人合计持有劳博物

流 51% 股权。

公司方面表示,通过本次收购,公司在机器人应

用方面的实力进一步提升,在机器人物料搬运、

拆 \/ 码垛、物流分拣和存储解决方案应用领域上

获得专业成熟技术,同时完善了公司智能仓储板

块,推进公司智能制造战略的实施。

第26页

41

热点资讯

国内 中国服务机器人亮相柏林“IFA2017”

家电展

现代机器人与同捷科技签订战略合作协议

接 待 用 和 家 用 机 器 人 被 称 为“ 服 务 型 机 器 人 ”。 在 今 年

近日,现代机器人与国内最大汽车设计工程公司同捷科技在上海签 IFA 展上,服务型机器人的企业中约 9 成来自中国。

署了战略合作协议。此次战略合作主要针对新能源汽车制造领域工 总部位于深圳的旗瀚科技在 IFA 上首次公开了家用机器人

业机器人及自动化应用的深度合作,现代机器人将为同捷科技新能 “三宝 Nano”,这是一款高约 70 厘米的人形机器人,将

源汽车工厂提供无人化生产线所需机器人并提供专业的技术支持和 于 10 月上市,售价 2800 美元,用户可通过语音命令让

服务。 三宝唱歌、订披萨外卖、操作电视等。杭州艾米机器人在

现代机器人 2003 年正式进入中国市场,目前其点焊、弧焊、搬运 IFA 上公开了一款软件,该软件可以让自主开发的接待机

及喷漆机器人等系列产品与系统集成方案已经成功运用在中国汽车 器人“A1”记住各种接待服务,使用这款软件,可让机器

及汽车零部件、电子电器、轨道交通、家电、电梯、机械加工等行 人把顾客带领到想去的房间、在餐厅为顾客点菜等。上海

业生产过程中。 未来伙伴机器人在 IFA 上展示了用于儿童教育的小型家用

机器人。

国内最大工业机器人生产基地在沪启动 763 支大学生队伍角逐华北五省份机

器人大赛

上海新时达机器人有限公司年产 10000 台套工业机器人新工厂奠

基仪式近日在上海市嘉定区举行,上海市人大常委会委员、人大财 近日,华北五省份机器人大赛在北京大学生体育馆开赛,

经委副主任、上海市机器人行业协会会长戴柳等市、区、镇以及各 94 所 高 校( 包 括 台 湾 建 国 科 技 大 学) 的 763 支 队 伍 共

委办领导、部分合作伙伴代表以及上海新时达电气股份有限公司董 1700 余名师生参赛。参赛高校既有清华、北大等知名高校,

事长纪翌等高级管理人员出席了奠基仪式。 也有职业学校。本次大赛的主题为“智能引领 创新致用”,

新时达机器人新工厂项目,占地 4.8 万平方米,建筑面积约 2.7 万 共设 8 大类、15 个小项的比赛,分别为机器人创意设计赛,

平方米,总投资 6.93 亿元,建成后可形成年产 1 万台机器人的产 机器人武术擂台赛,类人机器人竞技体育赛,水中机器人

业规模。新时达机器人新工厂项目将着力于打造一个专业化、规模 比赛,空中机器人比赛以及智能物流机器人比赛等。大赛

化、智能化的机器人及关键零部件与运动控制系统产品制造基地, 旨在激发大学生对机器人技术的研发热情,鼓励大学生将

项目将引入国内领先的机器人及关键零部件与运动控制系统产品制 所学知识应用于工程实践,强化机器人产品的创新性、实

造、试验及测试系统,并形成一个崭新的、全智能化的机器人及关 践性和应用性,进而带动大学生在机器人领域的创新创业,

键零部件与运动控制系统产品制造体系。 推进大学生高科技作品与市场应用相结合,探索高校学术

资源与市场资本的对接平台。

第27页

42

热点资讯

软银展示 5G 技术机器人 国际

软银集团日前在东京都内展示了 5G(第 5 代移动通信)技术的应用:手臂 本田移动机器人长啥样!

型机器人表演了桌上冰球的守门技术。演示中,装在能俯视整个冰球桌位置

的摄像头把冰球的动作数据化,通过 5G 网络传送给机器人。机器人则根据 近期,本田推出了概念电动车 Sports EV Concept 和

接收到的数据,移动手臂来拦截射门,超高速通信控制下的敏捷动作拦截了 概念产品 RoboCas Concept,它们的共同点是都有

所有射门。据日媒报道,日本 3 大移动运营商 NTT DoCoMo、KDDI 和软 双呆萌的动态大眼睛,配备了全自动化的 AI 助手。

银将于 2020 年在一部分地区启动 5G 服务,预计 DoCoMo 将在 3 年左右 本田拥抱电气化时代,希望借助 AI 技术架起人车沟

将服务范围扩大至日本全国。 通 的 桥 梁,Sports EV Concept 是 一 款 电 动 车, 而

RoboCas Concept 是一款具备 AI 及全自动驾驶的多

沙特阿拉伯授全球首个机器人国籍 功能移动机器人。

RoboCas Concept 初始形态有点像大号的行李箱,

近日,在利雅得未来投资倡议论坛上,沙特阿拉伯成为世界上首个为机 具备自动驾驶功能以及智

器人授予国籍的国家。在本次论坛的人工智能专题分组讨论过程中,推 慧 AI,能够根据不同场合

介了一个名叫索菲亚(Sophia)的女性机器人,辩论小组主持人直接面 需求变换形态。RoboCas

向机器人,发表了声明:“索菲亚,我希望你能听到,你将是被授予沙 Concept 主 要 是 本 田 对

特阿拉伯国籍的首个机器人。”作为回应,机器人索菲亚向沙特阿拉伯 未来人工智能小型移动产

政府表示感谢,她指出,成为拥有沙特阿拉伯护照的首个机器人,对自 品的畅想,希望机器人能

己来说是莫大的荣幸。 够融入人们生活的方方面

面,提供各种便利。

发那科工业机器人产量突破 50 万台

据《日本经济新闻》报道,截至 11 月初,日本机器

人制造商发那科的工业机器人累计产量已超过 50 万

台。发那科 1977 年开始量产工业机器人,40 年来的

累计产量达到全球最多。目前不仅是日本,亚洲各国

在工厂省力化、自动化方面的投资也在不断增长,因

此,发那科的机器人量产速度或将进一步加快,为进

行增产,发那科正在日本茨城县筑西市建设每月最大

产能达 4000 台的大型工厂。

第28页

43

技术前沿

利用深度学习

自动识别胎儿颜面部超声标准切面

近年来,由于高性能计算机的发展以及数据集规模的扩大,深度学习模型在医学图像分类检测领

域内取得了广泛应用。利用深度学习从大规模医学图像数据库中训练自动诊断模型正引起广泛的

研究兴趣。

文 \/ 深圳大学生物医学工程学院 广东省生物医学信息检测和超声成像重点实验室 余镇 吴凌云 倪东 陈思平

汪天富 雷柏英 张治国,深圳妇幼保健院超声科 南方医科大学附属医院 李胜利

方法 其作用是减少卷积层输出尺寸大小,从而大大减少整个网络的参

1. 卷积神经网络 数数量,同时增强卷积层输出特征的空间稳定性。因此,池化层

受到生物神经系统的启发,卷积神经网络(CNN)在物体 在一定程度上可以避免网络出现过拟合的情况。全连接层(fully-

识别和检测领域已经获得了巨大成功。不同于传统的神经网络, connected layer ,FC layer)类似于卷积层,同样是由许多神经

CNN 结合了局部连接和权值共享策略,因此,使得卷积神经网络 元组成,但这里的神经元与前一层输入之间是全连接的方式,即

的参数大大减少,从而构建更深层数的卷积网络成为可能。 每个神经元与前一层所有输入进行作用。

CNN 的主要组成成分是卷积层,卷积层包含了许多神经元, Softmax 层是 CNN 网络的最后一层结构,其功能是对网络

每个神经元带有一组可学习的权值和一个偏置项。这些权值会在 提取的特征进行分类。为了评价网络预测输出与输入图像真实标

网络训练的过程中不断改变。每个神经元对于前一层的局部区域 签之间的一致性,这里用到了损失函数。具体而言,假定为输入

进行感知,即将该局部区域作为其输入。假定 χlj 是第 l 层卷积层 图像, 是其对应的真实标签,则损失

的第 j 个神经元的输出,且 是第 l-1 层的神经元 函数可以表示为:

输出,M 表示当前神经元的局部输入大小,那么 χlj 可以表示为:

\t (2)

(1) ,k=1,…,K,\t (3)

其 中 wljm 表 示 连 接 至 前 一 层 第 m 个 神 经 元 输 出 的 权 其中, 表示网络对输入图像 Ii 的预测类别概率

值,δ(.) 表 示 神 经 元 激 活 函 数( 一 般 常 用 ReLU 非 线 性 单 元

输出,此外, 是指示函数, ,当 Ck=Ti 时,

)。 池化 层(pooling layer) 和 全连 接 层是

CNN 另一主要成分。 其输出值为 1,反之则为 0;fj 是网络对于图像 Ii 在 softmax 层前

在本文中,我们将分类层 softmax 层作为全连接层的附属层。 一层第 j 个神经元的输出。CNN 训练的目的就是获取合适的权值

一般而言,在卷积层之间会加入池化层,池化层本身不带参数,

参数,使得整个网络能够针对目标数据自动学习合适的特征表达,

第29页

44

技术前沿

图 1 胎儿超声颜面部切面。从左到右依次为非标准切面、轴向标准切面、矢状标准切面、冠状标准切面。

从而对于未知样本得到比较好的预测结果。 3. 数据增强

2. CNN 结构设置 CNN 网络作为一种深度学习模型,其对于训练数据

对于像 CNN-16 这种深度的网络,直接随机初始参数的情 量具有极大的要求。某种程度上,数据量的大小直接决定

况下训练会出现收敛速度极慢,反向传播更新参数过程会出现梯 了网络的规模,以及网络的可训练性。而临床上,收集大

度消失等情况,因此,这里我们直接采用迁移学习的方式来初始 量的且具有代表性的医学图像本身就相当困难,再加上这

化设置网络,相应结果表示为 CNN-16-TR。表 1 说明了实验中 些数据还需要人工进行标注,因此,构建这种高质量大规

CNN 的具体结构细节。 模的医学图像数据集极具挑战。而通过保持图像本身标签

不变的情况下,对图像数据进行多种变换来增大数据集的

CNN configurations 规模是一种可行且有效的数据增强方式。通过这种数据增

强方式,我们可以大大增大数据集规模,从而解决医学图

CNN-8 CNN-16 像数据集因为数据量不足而无法训练 CNN 模型的情况。

4. 迁移学习

Conv1 55x55x96 Conv1-2 224x224x64

即便 CNN 网络具有极强的特征表达能力,在很多医

Pool1 27x27x96 Pool1 112x112x64 学图像上得到了成功应用,但训练的数据量依旧是最大的

限制。因此,过拟合问题是有监督深度模型始终无法回避

Conv2 3x13x256 Conv3-4 112x112x128 的一个话题。在这种情况下,先从大规模的数据集上预训

练一个 CNN 网络,而后将该网络的参数复制到目标网络

Pool2 13x13x256 Pool2 56x56x128 中是一个有效的网络初始化方式,可以大大减少网络训练

速度,同时避免训练数据量过小而出现的过拟合现象。

Conv3 13x13x384 Conv5-7 56x56x256

目前,最常见迁移学习方法是首先在其他数据集上训

Conv4 13x13x384 Pool3 28x28x256 练一个基础网络,然后将该网络的前 n 层参数复制到目标

网络对应层,而后目标网络余下层则随机初始化参数。根

Conv5 13x13x256 Conv8-10 28x28x512 据训练的方式不同,迁移学习可以分为两种,一种是保持

这些迁移过来的学习层参数固定,训练过程中只改变后面

Pool3 6x6x256 Pool4 14x14x512 随机初始化的学习层参数;另一种则是在训练过程中微调

这些迁移的学习层参数。根据研究结果,由于 ImageNet

Conv11-13 14x14x512

Pool4 7x7x512

FC 1x1x1024 FC 1x1x1024 FC 1x1x4

Softmax

表 1 CNN 模型结构

第30页

45

技术前沿

图 5 CNN 模型分类 ROC 曲线与混淆矩阵

(a)、(b)、(c) 分别为 CNN-16-TR,CNN-8-TR 以及 CNN-8-RI 网络 Roc 曲线,(d)、

(e)、(f)分别为 CNN-16-TR,CNN-8-TR 以及 CNN-8-RI 网络混淆矩阵。

数据集与我们 FFSP 数据集之间图像差异巨大,因此,迁 为了更好的分析比对不同 CNN 模型分类性能,本文

移层数较多的情况下,采取前一种固定迁移参数的训练方 将从定性和定量两个角度进行结果讨论,首先通过可视化

式并不适用,因此,在本研究中,我们采取微调的迁移学 CNN 网络提取的高层特征,直观展示 CNN 分类结果。其次,

习方式。 通过各项数据指标具体评价 CNN 网络识别 FFSP 性能。

实验与结果 2. 定性分析评价

图 4 中,(c) 为 CNN-8-TR 提取的训练集特征,可以

1. 数据集与系统设置

看出四类切面特征基本很清楚的被区分,而 (d) 为 CNN-

图 4 t-SNE 可视化实验结果 8-RI 提取的训练集特征,四类切面特征还存在少量交叉。

相 对 应 的 (g)、(h) 分 别 为 CNN-8-TR 与 CNN-8-RI 测 试

(a) 训练集初始数据 (b) CNN-16-TR 训练集特征 (c)CNN-8-TR 训练集特征 集特征,结果与训练集类似。

3. 定量分析评价

(d) CNN-8-RI 训练集特征 (e) 测试集初始数据 (f) CNN-16-TR 测试集特征

目 前, 最 主 流 的 分 类 识 别 技 术 是 利 用 人 工 特 征 结 合

(g)CNN-8-TR 测试集特征 (h)CNN-8-RI 测试集特征。 分类器进行分类识别,这些方法基本思想是先从图像中提

取特征,同时对特征进行编码,再训练分类器进行分类识

别,如基于 DSIFT 特征的编码方式识别,包括直方图编码

BoVW 模型、局部特征聚合描述符 VLAD 编码以及 FV 向

量编码。我们先前的研究工作就是利用这些方法进行 FFSP

第31页

46

技术前沿

Models Acc Precision Recall F1 的图像领域,显然数据采集的难度不尽相同,且自然图像

DSIFT-BoVW 87.39 86.59 86.34 86.58 数据集的规模往往远大于医学类图像数据。因此,医学图

DSIFTVLAD 89.61 87.55 88.14 88.11 像领域内,深度网络应用的最大困难在于数据集规模的限

90.84 90.25 91.56 90.91 制。

DSIFT-FV 82.04 70.68 86.52 75.69

CNN-8-RI 91.33 80.52 93.06 85.68 利用自然图像数据集训练基础网络,再进行迁移学习

CNN-8-TR 94.50 86.65 97.25 91.28 是解决当前不同图像领域应用深度网络数据量不足的有效

CNN-16-TR 方式。因此,本研究结合了迁移学习与数据增强的方式来

综合提升深度网络分类性能。最后的结果分析也表明,其

表 2 CNN 识别结果 FFSP 分类性能要远远好于我们之前的研究,即采用人工特

征结合分类器分类的方法。

的自动识别。

图 5 是各个 CNN 网络的分类性能 ROC 曲线和混淆 然而本研究依然存在一些不足之处,首先,测试集数

量不够多,只有 2418 张测试图像,虽然在一定程度上可

矩阵。从图 5 以及表 2 中可以看出,CNN-16-TR 识别正 以反应 CNN 模型的分类性能,但更大量的数据应该更具

确率高于 CNN-8-TR,因此,加深 CNN 模型的深度能够 说明性。这也是以后我们改进的方向之一。另外,在测试

很好地提升最后的分类效果。此外,CNN-8-TR 分类正确 结果方面,依然存在提升的空间,不少接近 FFSP 的非标

率高于 CNN-8-RI,表明在其他数据集上预训练基础网络, 准切面被识别为标准切面。这跟图像本身的噪声以及差异

同时微调迁移参数也是一种改善 CNN 识别性能的有效方 度小有极大的关系。未来的研究中,可以通过给训练集图

法。从实验结果可以看出,所有 CNN 模型识别结果都表 像随机添加噪声,来增加网络识别的稳定性。另外,临床

现 良 好, 且 都 优 于 我 们 之 前 的 手 工 特 征 分 类 结 果。 虽 然 医生在寻找 FFSP 过程中,会考虑前后帧图像的上下文信息,

CNN 具有极强的分类性能,但在实验结果中我们也观察到 因此,在网络训练过程中加入当前图像上下文信息可以消

了一些值得注意的细节:首先,测试阶段,每张图像综合 除 FFSP 与非 FFSP 类内差异小所带来的干扰。

其 10 张子图像的预测结果,这种 10-crop testing 比直接

测试单张图像的结果提升了 3% 左右。另外,采用迁移学 结论

习策略时,网络收敛的速度大大加快,比随机初始化参数

的网络收敛快一半以上的时间。 本研究中,我们提出了用深度卷积网络的方式来识别

胎儿颜面部超声图像,同时,分析研究了不同深度结构的

讨论 CNN 模型对于 FFSP 分类的结果。为了防止由于训练数据

集数量不足而引发网络训练出现过拟合问题,我们采用了

深度网络作为一种表达学习方法,通过组合迭代不同 数据增强结合迁移学习的方式来改善网络分类结果。最后

层次的特征,最后形成高层抽象特征,这种特征相对于传 的结果表明,深度网络可以有效的识别 FFSP 标准切面,

统的人工特征而言,在概念表达方面具有更鲁棒的性能或 同时更深层的深度网络能够带来更好的分类性能。因此,

者说更具不变性。而且,深度网络可以根据给定的数据, 深度网络与迁移学习的结合在临床应用方面具有极大的前

学习到对应的特征,因此,其泛化能力更强,可以推广应 景,值得进一步的探索和研究。

用到不同的图像领域。但是深度学习模型普遍要求足够多

的训练数据量,否则网络训练会出现过拟合问题。在不同

第32页

47

机器人关键部件

多关节机械手电

机选型经验浅谈

柔多关节工业机器人从传动角度可以另述为 4 到 6 关节工业手臂。作为人类手臂的延伸,广泛用于搬运,打磨,

焊接,冲压等工作。多关机工业机器人可以单独工作,也可以多台协调工作。其可以作为生产机械的主体单

独完成任务,也可以配合机床,塑胶机械,自动化生产线等其它机械完成上下料工作。始初我国没有此类设

备的制造能力,少量的生产需求全靠欧洲和日本厂商提供或者跟随我国引进生产线配套进入国内。随着中国

产业升级对自动化,少人化的不断推进,国内对多关节机械手臂的需求越来越大。我国多关节工业机械手臂

的研发及生产企业也如雨后春笋般遍地开花。

文 \/ 武汉登奇机电技术有限公司 傅江治

作为机械人制造企业而言,要从机械本体,传动机械机构, 发时接入,机械手本体制造常涉及到 4 轴或 6 轴。其结构如下图

减速机构,平衡储能机构,伺服电机,伺服驱动器,控制电脑系 所示。

统等各个方面分别从总体到局部加以研究,方能设计制造出一个

合适的产品。作为一个产业,单靠单一企业的能力很难承担机械

手臂所需的所有关键零部件,一个专业人员也无法掌握所有关键

的技术,因为专业分工已经非常之细了。本人及所在的企业专门

从事伺服电机的研究,设计和制造。公司从 2009 年开始立项,研

究机械手臂的运动特性,并特别关注机械手臂所需伺服电机的特

点,历时 8 年,开发出适合此类设备的 GK 系列伺服电机。在 R-GK6,

R-GK8 基础上新推出的 R-GK9 系列永磁伺服电机就是专门针对 6

关节机械手臂应用而开发的。与原有系列产品相比,新一代的产

品使用了新的材料及最新的磁场设计技术,使得电机功率密度更

高,体积也更为小巧。

下面就仅从伺服电机在 6 关节机器人上的应用角度谈谈对机

器人电机的一点看法及经验分享。由于水平所限,文中难免疏漏

错误,望读者见谅,权且视为抛砖引玉,提起大家讨论这个专题

的兴致。

机械手臂机构构造

多关节机械手最多有 7 个自由度。第七轴通常在应用二次开

第33页

48

机器人关键部件

机械手臂电机的惯量特点 关节手臂电机的工作特性及要求

从图中可以看出,J1,J2 轴负担整个机构的重量,在手臂工 多关节机械手各电机是多轴联动工作的,总体上属于 S3 间

作过程中,机构会随机打开和收缩。从 J1,J2 电机的应用角度来看, 歇工作制,从某一个动作的完成来看,属于恒扭矩高加减速性质。

负载的机械惯量是实时变化的。根据以往经验,负载的惯量变化 为了减小工作机构的体积,往往通过小体积大速比的 RV 减速箱链

范围在 7 倍以内。J3,J4,J5 负载的机械惯量也是变化的,只是 接传动机构。这样对高速响应的机器人而言,必然要求高速,高

变化的范围没有 J1 和 J2 大。这样从控制的角度的角度来看,对 响应,小体积的电机,为了配合高惯量,轴 1 到轴 3 的电机从外

电机的要求是惯量要足够大,系统才容易进入稳定区。所以轴 1, 形上看必然是比较粗短的。

轴 2 要选用大惯量电机,轴 3,轴 4,轴 5 选用中惯量电机。轴 6

的电机一般安装在机械手臂内部,更看重小体积,低发热的功率 安全机械抱闸的需求

密度特性。以上就是 6 关节机械手臂不同轴在电机选型方面对惯

量的要求。 6 关节机械手电机大多需要机械抱闸来保证安全,由于受到

机器 (kg)关节 4kg 10kg 20kg 50-120kg 300-500kg

1000 1200 3000 5000 10k

额定功率 PN(W) 4.77 5.7 9.55 23.9 32

2000-5000 2000-5000 3000-5000

J1 额定力矩 Mn(Nm) 1500 1200 3000 2000-4000 3000-4000

7.16 5.7 9.55 5500 10k

转速 rpm 2000-5000 2000-5000 3000-5000 23.9 32

750 750 2000

额定功率 PN(W) 2.4 2.4 6.37 2000-4000 3000-4000

2000-5000 3000-6000 3000-5000 3000 10k

J2 额定力矩 Mn(Nm) 200 200 400 9.55 32

0.64 0.64 1.27

转速 rpm 3000-6000 3000-6000 3000-6000 3000-5000 3000-4000

200 200 400 2000 5800

额定功率 PN(W) 0.64 0.64 1.27 6.37 17.2

3000-6000 3000-6000 3000-6000

J3 额定力矩 Mn(Nm) 100 400 3000-5000 3000-6000

50 0.32 1.27 2000 5800

转速 rpm 0.16 3000-6000 3000-6000 6.37 17.2

3000-6000

额定功率 PN(W) 3000-5000 3000-6000

2000 5800

J4 额定力矩 Mn(Nm) 6.37 17.2

转速 rpm 3000-5000 3225-6000

额定功率 PN(W)

J5 额定力矩 Mn(Nm)

转速 rpm

额定功率 PN(W)

J6 额定力矩 Mn(Nm)

转速 rpm

表 1 通常机器人伺服电机的选型汇总

第34页

49

机器人关键部件

重力和运动惯性的影响,抱闸力矩的安全系数要较通用机械的要 角度来看,第一类编码器是比较好的,但从初次投入成本考虑,

求为大,按使用环境的不同安全系数要求也从 1.5 到 2.0 不等。总之, 第二类编码器是比较合适的。

任何情况下要保证不能够溜车。另外,为了保证机械手臂的总体

安全性,抱闸信号从控制系统直接给出,而不是从伺服驱动器给出。 表 1 和表 2 分别是通常机器人伺服电机的选型汇总,

具体控制信号的协调和抱闸的保护就不再这里展开了。 以及登奇 GK9 伺服电机常用产品,这些产品广泛使用在国

内知名厂商和部分国外机器人制造厂商的机械手臂上。具

伺服电机编码器和可靠重复定位 体的转速和转动惯量基于不同的机械设计做针对性调整。

总之,机械手臂是一个高度机电一体化集成的机构,需要

由于多轴联动的空间运动特点,关节电机选择多圈绝对位置 机械工程师和伺服电机提供单位紧密沟通,才能开发出最

编码器最好。目前流行由齿轮机构保证的多圈位置记忆型编码器 为合理的产品。

和由电池供电通过电路记忆多圈位置型两类。从长期便于维护的

型号 Type 外方 Square 额定功率 PN 额定转速 nN  最高转速 nMax 额定扭力 MN 转动惯量 ( 不含抱闸)

(mm) (Wat) (rpm) (rpm) (Nm) J  (10-4kgm2)

R-GK9015-8AF31 40 100 3000 6000 0.32 0.041

R-GK9020-8AF31 60 100 3000 6000 0.32 0.17

R-GK9023-8AF31 60 200 3000 6000 0.64 0.29

R-GK9025-8AF31 60 400 3000 6000 1.27 0.45

R-GK9030-8AF31 80 400 3000 6000 1.27 0.8

R-GK9031-8AF31 80 750 3000 6000 2.4 1.21

R-GK9055-10AF61 100 2000 3000 6000 6.4 5.4

R-GK9073-10AF61 130 2000 3000 5000 6.4 13.4

R-GK9091-10AC61 180 3200 2000 4000 15.4 50.4

R-GK9093-10AC61 180 5000 2000 4000 23.9 125

R-GK9095-10AC61 180 6000 2000 4000 28.7 164

R-GK9097-10AC61 180 8200 2000 4000 39.2 200

R-GK9081-10AF61 155 5800 3000 6000 18.5 35.7

R-GK9083-10AF61 155 6900 3000 6000 22 44.6

R-GK9107-10AC61 192 10000 2000 4000 48 185.5

表 2 登奇 GK9 伺服电机常用产品

第35页

50

机器人技术与应用

用于冲压件 3D 检测的

高动态结构光扫描技术

3D 视觉测量技术的应用日益广泛,目前的主要技术手段包括双目立体视觉、激光扫描和结构光扫描等,其中结构光技术因

其系统结构简单、速度快、精度高的优势而被视为未来 3D 视觉发展的主要方向。典型的结构光系统由投影模块和相机模

块构成,通过系统标定手段,获取相机和投影仪的内外部参数,进而基于三角测量原理实现精确的三维重建过程。

文 \/ 宋展 蒋华烈 林海波 叶于平

结构光系统的技术核心是其所采用的结构光编码和解 图 1 当结构光图像投射到金属薄板冲压件上时,受到其表面反

码方法,目前主要的结构光编码策略是采用正弦相移加格雷 射影响,造成较大的过曝和欠曝区域,无法实现完成的 3D 重建

码的方法,通过投影模块投射的正弦相移条纹获取局部相位

编码,进而通过格雷码实现全局的相位展开,目前绝大部分 (1)

结构光三维扫描仪采用的都是这种编码策略。然而该方法存

在的问题也非常突出,即鲁棒性不足,特别是对于反射特性 其中 f 表示相机的响应函数,Ei 表示像素 i 的辐照度,

表面,由于所投射条纹的灰度信息受到表面反射干扰,造成 表示相机的曝光时间,假设响应函数 f 单调可逆,引入

灰度分布失真,严重影响了相位计算的准确性,甚至重建失 函数 g=lnf -1,那么公示(1)可写作 :

败,实际应用中,往往需要对反射特性表面预先喷涂显影

剂消除反射因素,因而大大制约了结构光技术的应用范围。 (2)

为了提高结构光系统的鲁棒性,研究人员先后提出了 公示(2)中,像素点辐照度 Ei 和相机响应函数 g 均为

基于线位移条纹、高频位移条纹、二值带位移条纹等编码方 未知,为了恢复出正确的辐照度,我们需要预先计算出相机

法,使得该技术的鲁棒性有了显著提升,然而对于高反射特 的响应函数 g。由于在实际图像中,其像素的灰度值是有限

性表面,如图 1 所示的金属薄板冲压件,因其高度的反射 的,即分布在 0~255 区间,理论上我们通过调整曝光时间,

特性,造成投射条纹的断裂以及局部暗区,无法提取有效结 获得不同曝光时间下的亮度值,可以通过最小二乘拟合策略

构光条纹信息,导致现有方法均无法直接应用,为了解决问 计算出相机的响应曲线,实际中也多采用这种计算方式。

题,本文介绍了一种基于高动态成像(HDR)原理的结构

光 3D 扫描方法,该方法的基本思想是将传统的 HDR 成像 传统的 HDR 方法研究中,大多处理的是自然图像,

方法应用在结构光图像处理中,通过对相机响应曲线的计算, 其灰度分布范围较广,而对于结构光图像特别是二值编码

融合不同曝光参数下的结构光图像,从而获得高动态范围的 结构光图像,在表面反射的影响下,结构光图像中的灰度

结构光图像,使得过曝和欠曝光区域均能较好的成像,从而

实现不经喷涂处理条件下的高反射金属表面直接 3D 扫描。

相机响应曲线计算

高动态成像技术已广泛应用于图像处理和摄影领域,

通过不同曝光程度图像的融合,能够显著提升图像的动态范

围,使得较亮和较暗区域均能得到较好的视觉呈现。假设场

景种不存在动态目标,那么图像 Iij 的成像过程可以描述为:

第36页

51

机器人技术与应用

图 2 不同采样点数目下所获得相机响应曲线分布 我们采用了一组中度曝光结构光图像作为参考,对其他曝

光时间的图像进行了后续处理,所获取的最终 HDR 结构光

值比较有限,为了提高计算效率,我们采用了图像采样的 图像由以下计算获得。

手段,分别提取 50,100,200 个采样点计算相机响应曲线,

如下图,结果显示即使采用 50 个采样点,仍能较好地获得 (8)

相机响应曲线。

实验结果分析

高动态结构光图像合成

实验装置如图 3 所示,包括 DLP 投影仪(LG HX300G,

获得相机响应曲线 g 后,每个像素点的辐照度值可按 分 辨 率 1024×768 像 素), 工 业 相 机 (PointGrey FL3-

U3-32S2M-CS, USB3.0, 60fps,分辨率 2080×1552 像素),

下式计算 工作距离约 500 mm,采用了高频二值位移条纹编码,投

射 30 张图像所需时间约 0.5 秒。实验目标主要是金属薄板

lnEi= g(Iij) - lnΔtj. (3) 冲压件,将相机曝光时间分别设定为 2ms,3ms,4ms,

5ms,6ms 和 7ms,我们分别计算了不同曝光时间下的 3D

加入权值函数 ω(z)后,上式可改写为 : 重建结果,如图 4 所示,相机曝光时间较短时,图像中存

在较大的曝光不足区域,由于结构光条纹无法成像,因此

\t 造成较大的重建缺失,对于较长的曝光时间,图像过曝区

(4) 域增加,同样也造成重建缺失,通过上述方法合成的 HDR

图像中,曝光不足区域亮度有显著提升,而过曝区域同样

通过计算所有图像点可以获得对应响应曲线的辐照 可以得到较好的抑制,基本可以实现完整的 3D 重建过程。

图,然而辐照图的范围要远大于 0~255 的灰度范围,我们

采用了梯度压缩策略,在不损失局部图像细节的前提下, 为了评估系统的重建精度,我们对其中一块冲压件进

将高动态图像转换到普通的灰度空间。 行了喷涂处理,并对喷涂前和喷涂后的工件分别进行 3D

扫描,对两个模型进行精度对比分析,结果显示平均误差

(5) 约 0.06mm,方差约 0.08mm,最大误差约 0.45mm,较

大的误差主要出现在尖锐边缘部分,主要是边缘部分即使

表示吸收函数并描述如下 在较低的曝光时间下仍然对结构光条纹造成了干扰,只有

利用更低的曝光时间才能清晰还原此处的结构光条纹图像,

(6) 但代价是需要更多的曝光参数设置,考虑到现有重建精度

已经可以满足冲压件的检测精度指标,因此 5-6 组曝光组

通过求解下面的泊松方程,我们就可以重构出具有更 合完全可以满足要求,图 6 给出了更多不同形状冲压件的

高动态范围的图像。 3D 扫描结果。

(7) 图 3 所开发的结构光 3D 扫描系统,由 DLP 投影机和 USB3.0 工业相机组成

由于结构光扫描过程包含了一系列的条纹图像投射,

因此造成了光照条件的变化,为了保证光照条件的一致性,

第37页

52

机器人技术与应用

图 4 不同曝光时间下直接 3D 重

建的结果,以及合成 HDR 图像及

重建结果

图 5 喷涂前后重建 3D 模型的误差对比分析 图 6 不同形状目标的直接 3D 扫描模型

结论与展望

结构光 3D 扫描技术在工业检测领域具有广阔的应用前景,其所面临的主要技术挑战来自于目标和场景的不确定性,造成

结构光图像成像质量不佳,从而影响了重建精度,我们所提出的高动态结构光 3D 成像方法为这一问题提供了一种有效的解决

方案,但多次曝光也同时显著增加了扫描时间和数据处理量的增加,未来的研究工作中可考虑如何实现结构光图像的场景自适

应性调整,在不显著增加拍摄时间的前提下,提高扫描过程的鲁棒性,从而可以满足更多的在线 3D 检测需求。

第38页

53

机器人技术与应用

用于行人检测的候

选区域框提取方法

近年来,区域卷积神经网络 (R-CNN) 在物体检测任务中取得了巨大的成功。该深度模型需要先采用候选区域框提取方法获

得物体可能存在的位置,因此很大程度上依赖于候选框提取的准确性。

文 \/ 北京大学深圳研究生院信息工程学院董培磊 范梦迪 王文敏

引言 测。我们可以对图像提取特征,并训练一个判别行人的简

单分类器,使用分类器去生成候选区域框。这样就可以实

行人检测任务的目标是在图像中检测行人并确定行人 现只针对行人类别提取候选区域框的目的。基于这个思想,

的位置。随着人工智能技术的发展,越来越多的研究人员 本文提出了一种适用于行人检测的候选框提取方法。我们

关注这项任务并且做了很多相关的研究工作。准确的行人 将这种候选框提取方法与卷积神经网络模型结合起来,并

检测方法可以应用于很多领域,例如智能辅助驾驶,智能 应用于行人检测。这种检测方法主要分为两步:1) 使用候

视频监控和智能机器人等。 选框提取方法为每张图像生成候选区域框;2) 将图像和它

的候选区域框输入到卷积神经网络中。网络包含两个输出

近年来,区域卷积神经网络 (R-CNN) 模型被广泛应 层。一个输出行人类别的概率估计,另一个输出四个实数

用于通用类物体检测任务。有相关文献提出了一种快速区 表示行人边界框的位置。

域卷积神经网络 (Fast R-CNN) 模型,在 21 类的物体检测

任务中取得了显著的效果。这种模型首先使用候选区域框 本文的模型和其他行人检测方法相比取得了很好的

方法 Selective Search 去预测物体可能存在的位置,然后 检 测 效 果。 在 INRIA,PKU 和 ETH 数 据 集 上 分 别 实 现

再使用卷积神经网络对候选区域框进行进一步的精细分类 了 14.1%,15.3% 和 45.6% 的 漏 检 率。 实 验 结 果 表 明,

和定位。受这种模型在通用类检测中的启发,我们试图将 在行人检测任务中我们的候选框提取方法要比 Selective

这种方法应用于行人检测。但是 Selective Search 方法不 Search 更有效。同时,我们的方法去除了冗余的候选区域

是针对单一类的候选框提取方法,它会预测所有种类物体 框,提高了卷积神经网络训练和测试的速度。

的可能位置,包括车辆,建筑等。因此生成的候选区域框

存在很多的冗余,降低训练的分类器的质量。同时冗余的 背景

候选区域框会消耗较多的计算资源,降低卷积神经网络的

训练和测试的速度。在行人检测中,只对行人类别生成候 1. 现有行人检测算法的分类

选区域框,并使用这种候选框训练和测试卷积神经网络, 现有的行人检测算法通常会被分为两类。第一类称为

理论上可以取得很好的检测效果。

传统算法,这类方法从图像中提取手工设计特征并训练一

候选区域框提取在一定程度可以看作对物体的粗糙检 个支持向量机 (SVM) 或增强 (boosting) 作为分类器。这

第39页

54

机器人技术与应用

些手工设计特征包括哈尔,梯度直方图和局部二值模式等, 经由兴趣区域池化 (RoI) 层将候选区域框的卷积特征映射

在行人检测表现出很好的性能。DPM 在检测中考虑了局部

的区域特征以及区域间的形变。有相关文献将上下文信息 为固定长度的特征向量并被传入全连接层。全连接层后面

加入到模型中。另外,聚合通道特征将梯度直方图和 LUV

颜色空间特征融合到一起用于行人检测。文献提出了一种 有两个平行的输出层,输出行人检测框的置信分数和坐标。

有效的特征变换方法去除了局部特征间的关联。

2. 候选区域框提取

另一类行人检测方法是采样深度模型。深度模型可以

从原图像中学习特征,极大地提高了行人检测算法的性能。 该候选区域框算法从图像中提取 10 个通道的手工设

从行人的不同身体部门学习特征来处理行人间的遮挡问题,

卷积网络方法采用卷积稀疏编码无监督地预训练卷积神经 计特征并训练一个 AdaBoost 分类器。通道特征包括归一

网络,通过语义的特征优化行人检测效果。

2. 候选框提取方法 化的梯度幅值,梯度方向(6 bins) 和 LUV 颜色通道。算

由于物体可能是任意尺寸并且可能出现在图像的任一 法通过计算不同尺度下的通道特征构建特征金字塔。不同

位置,因此需要搜索整幅图像来完成分类和定位。滑动窗

口方法可以获得所有可能的物体位置,但是计算复杂度很 尺寸下的特征不是直接计算,而是通过相邻尺寸的特征近

高。最近,研究人员提出了其他几种候选框提取方法,例

如 selective search,bing 和 edge boxes 。Selective 似计算获得,其详细过程如下文所述。

search 通过分割和相似度计算的方式提取候选区域框,区

域框的质量较好但是速度很慢。Bing 使用正则梯度信息和 对于图像 I,设 Ω 为任意低层次旋转不变特征计算

二分操作生成候选区域框,速度较快但是质量很差。Edge

boxes 是在质量和速度之间折中的一种算法。 方法,图像的一个通道计算方法为 。通道 C 是

这类方法生成的候选区域框包含了所有的种类,适用 像素级别的特征,C 中每个像素都是从对应图像 I 的图

于通用类的检测,但无法完成单一类的候选框提取。冗余

的候选区域框会降低卷积神经网络的性能,并消耗更多的 像 块 计 算 而 来。 设 Is 表 示 图 像 I 在 s 尺 寸 下 的 重 采 样,

计算资源。行人检测问题只需要针对行人类别生成候选区 ,R 表示采样函数。当计算多尺寸图像特

域框而无需其它物体的冗余信息,本文实现了一种基于行

人检测算法的候选区域框提取方法。我们将这种优化的候 征时,首先将图像 I 在尺寸 s 下重采样,之后通过近似计

选区域框提取方法和卷积神经网络结合起来,并将其应用

于行人检测。 算得到的通道特征。近似计算方法如下:

提出的方法 λΩ 是不同尺寸间的变换因子,每种通道。征类型 Ω

对应一个 λΩ。

1. 方法概述

本文所提出的方法包括两部分。第一部分是候选区域 通用的特征金字塔方法通常是在每一个尺寸计算

。这种近似计算的方法在框的提取速度。在

框的提取,第二部分是卷积神经网络模型。其中候选框提

取方法采用聚合通道特征 (ACF) ,卷积神经网络模型基于 候选区域框提取过程中,本文首先对图像提取 10 通道的特

文献中的深度网络结构。网络的输入是原始的图像和候选 征,然后使用近似计算得到不同图像尺寸下的特征构建特

区域框。模型首先通过卷积和池化提取图像的卷积特征, 征金字塔。最后训练了一个由 2048 个深度为 2 的分类树

组成的 Adaboost 分类器生成候选区域框。为了获得足够

的候选区域框,我们降低了检测的阈值。

网络结构

在这一部分,首先介绍采用的深度网络模型的结构,

然后说明模型的损失函数。

本文的网络结构如图 1 所示。网络包含 5 个卷积层。

每个卷积层分别有 96,256,384,384 和 256 个核函数。

采用线性整流函数 (ReLU) 作为网络的激活函数。每个卷

积层后面连接了一个空间最大池化层。网络可以输入任意

尺寸的图像。经过卷积和池化,得到图像的卷积特征。在

第40页

55

机器人技术与应用

图 1 卷积神经网络结构

卷积特征传入全连接层之前,兴趣区域池化层会将卷积特 使用如下损失函数:

征映射为固定长度的特征向量。分别使用标准差为 0.01 和 其中

0.001 的高斯分布初始化用于分类和边界框回归的全连接 参数控制两个任务损失之间的平衡。标注的回归目标

v 被归一化为零均值和单位方差。在所有的实验中,本文

层权重(weights)。偏置(bias)初始化为 0。网络的每 都设置。本文使用随机梯度下降的方法最小化损失函数。

一层权重的学习率为 0.001,偏置的学习率为 0.002。 结束语

全连接层后面连接了两个平行输出层。第一个输出层 本文提出了一种单一类候选框提取方法与卷积神经网

络结合的模型。该候选框提取算法从图像中提取手工设计

输出在行人和背景类上的概率值,用 表示。 特征,并训练 AdaBoost 分类器。本文所提出的方法不同

于通用的候选框提取方法,可以只为行人类别生成候选区

其 中 P0 和 P1 分 别 表 示 物 体 是 背 景 和 行 人 的 概 率 值。 通 域框。本文还阐述了候选框提取算法的具体细节以及网络

的结构。实验的结果表明,本文的方法提高了候选框提取

常,p 通过在全连接层的两个输出加上 softmax 计算得 的质量,在行人检测上取得了很好的效果,同时缩短了网

络训练和测试的时间。

到。第二个输出层是在行人类上的边界框回归补偿,使用

表示。每个训练的候选区域框都有一个类

别标定 u 和边界框目标 v 。我们使用了多任务损失函数 L

同时训练分类和边界框回归:

其中 是 类 别 u 的 对 数 损 失 函 数。 第

二 个 任 务 的 损 失 函 数 是 在 类 别 u 的 边 界 框 上 定 义 的,

。当 u ≥ 1 时,艾弗森括号指示函数[u ≥ 1]

值为 1,其他值为 0。按照惯例,通用背景类被标记为 u=

0。由于背景类的候选区域框没有特定的标注,此时在损失

函数中就将背景类的忽略不计。对于行人类的边界回归,

第41页

56

机器人技术与应用

集成神经网络语音

情感识别模型研究

语音情感识别是服务机器人的关键技术之一,具有重要的应用价值。与传统的语音情感识别方法相比,基于深度神经网络

的语音情感识别方法已经展示出优越的性能。

文 \/ 北京大学信息工程学院罗丹青 邹月娴 新加坡信息技术研究所黄东延

背景 值有均值、极值、变化范围、丰度、偏度、矩和线性回归

相关参数等。特征设计在传统的语音情感识别方法中是重

情感识别有助于为人机交互提供良好的体验,是未来 要的一环,决定了情感特征的好坏。然而,寻找最优的特

计算机必备的一项重要能力,因而近年来语音情感识别已 征子集是一项繁琐的任务,也依据不同的数据库而有所不

经逐渐成为一个研究热点,并有了大量应用。虽然早在 20 同。到目前为止,对于语音情感识别任务还没有一套公认

世纪 80 年代就出现了语音情感识别的相关研究,该课题对 的最优特征集,研究人员大多在实验中经验性地选择所需

于机器而言确实较为棘手。此外,相比语音识别领域,用 特征。

于语音情感识别的公开数据库少之又少。

根据特征来源和分类器训练方法的不同,语音情感识

语音情感识别系统由两部分构成,即特征提取器和情 别系统可以在两个层次进行情感的判断:短语音段层次和

感识别分类器。 完整句子层次。对于短语音段的语音情感识别,一个句子

被切分为多个语音段,使用语音段的特征训练分类器。低

语音情感识别任务中使用的声学特征可分为 3 类:韵 层描述子在从语音帧提取出来后,被输入到序列分类器以

律学特征、谱特征和音质特征。其中常用的韵律学特征包 模拟说话人的情感分布状态,这样的序列分类器通常使用

括时长、基频、能量等;谱特征一般有 LPC、OSALPC 等 高斯混合模型和隐马尔可夫模型进行建模。在训练时短语

线性谱特征和 MFCC、LPCC 等倒谱特征;音质特征一般 音段的情感标签就是所属句子的情感标签;测试时,由于

有共振峰频率及其带宽、频率微扰、振幅微扰和声门参数 一句话有多个语音段的识别结果,对它们进行大多数投票

等。以上声学特征由于是从语音帧中提取,表征的是短时 得到最终的识别结果。对于完整句子层次的语音情感识别,

音频的特性,也统称为低层描述子。然而人们对情感的感 分类器输入的是从整个句子提取的特征。首先由低层描述

知往往蕴藏于某一时间段内情感的波动表达,所以为了在 子和统计函数计算句子的全局特征,最后全局特征输入到

更长的时间范围内对情感进行描述,通常还计算句子的全 一个判别分类器进行句子情感的识别。这样的判别分类器

局特征。全局特征用于刻画低层描述子在整句话中的动态

变化信息,因此由低层描述子的统计值组成,常见的统计

第42页

57

机器人技术与应用

包括几乎所有的传统分类器,如支持向量机、决策树、K 单元前后时间步状态之间的关系。以某个时间步 t 为例,

邻近模型等。 RNN 的输入是 xt,三个门和记忆单元的状态依次是 it、

ft、ot 和 ct,该层 LSTM 的输出是 ht,它们之间的关系由

近年来,深度神经网络因其具有强大的从原始数据学 下式表示:

习层级特征的能力,也被引入了语音情感识别领域。Han

等人设计了 DNN 用于学习短时语音段情感特征,后端使 其中 Wx.、Wh.、Wc. 分别是输入层、隐含层输出、记

用极限学习机对全局特征进行句子层次的情感分类。Lee 忆单元与各个门的连接权重;b. 代表各个门的偏置。

等人提出了基于最大似然学习准则的循环神经网络对随机 2. 宽度残差网络

语音段标签序列进行建模,极大提升了语音情感识别的准

确率。Mirsamadi 等人针对语音情感识别探索了不同的 众所周知,同样是出于梯度消失,CNN 层数越多越

RNN 结构,并提出了注意力机制对不同情感重要程度的语 难训练。为了训练深层的卷积网络,残差网络得以提出。

音帧进行加权。Mao 等人设计了卷积神经网络来学习语音 实验证明残差网络可以在比传统 CNN 层数深得多的情况

中显著具有判别性的情感特征。 下取得优越的图像识别性能。受残差网络加深层数的启发,

文献中提出了宽度残差网络,以更浅层数、更大宽度的网

在同一个数据库上比较以上不同的方法,可以发现它 络结构进一步提升了图像识别准确率。

们的混淆矩阵有很大差异。尽管使用相同的低层描述子,

不同分类器在每个情感类别上都获得了不一致的识别率。 残差网络由残差模块顺序堆叠构成,一个残差模块中

该现象说明单一的分类器无法在所有情感类别上都表现良 通常包括两个卷积层,每个卷积层前面分别有一个批归一

好,例如可能 SVM 无法有效识别出“高兴”而 DNN 分类 化层和 ReLu 激活函数层。对比普通的残差网络,WRN 把

器却可以。这样的差异除了与数据不均衡有关,还与分类 每层卷积层中的卷积核个数扩展为原来的 K 倍,加宽了卷

器自身的建模能力直接相关。 积层以提高它们的特征学习能力。研究表明 WRN 可以用

浅得多的层数达到与普通残差网络相同的图像识别率。图

从该结论出发,为了提高语音情感识别的准确率,本 1 展示了一个残差模块和一个 WRN 的结构。图 1 中 WRN

文提出一种使用两类神经网络作为基分类器的集成学习方 使 用 了 四 类 残 差 模 块, 它 们 的 卷 积 核 数 目 分 别 为 16、

法。正如文献所说,集成系统中的基分类器应该尽可能地 16XK、32XK、64XK。连续 N 个同类残差模块堆叠为一个

具有不同结构来达到更好的泛化性能,本文选择了适于处 组,四组残差模块和池化层、softmax 层按序堆叠最终构

理序列数据的循环神经网络和在图像分类中性能突出的宽 成一个 WRN。

度残差网络作为基分类器。

集成神经网络语音情感识别系统

基分类器介绍

1.RNN 语音情感识别子系统

1. 长短时记忆循环神经网络 RNN 子系统的框图如图 2 所示。其中系统的输入为

由于本身独特的结构,RNN 拥有强大的处理序列数

句子的特征序列 s(1),s(2),…,S(T),T 为句子被分割成的段数,

据的能力。隐含层在前后时间步间的连接使上一步的隐含 同时也是 RNN 网络的时间步数,s(t) 为句子中第 t 段语音

层状态能够传递给当前步的隐含层。如此循环传递下去,

序列中第一步的信息就能传递到最后一步,序列相关性得

以建模。然而,当输入序列达到一定长度,由于梯度消失

问题 RNN 的性能会急剧下降,长短时记忆模型就是为了

克服该问题而设计的。

总体来说,一个 LSTM 模块包括四个元素:输入门 i、

遗忘门 f、输出门 o 和记忆单元 c,三个门负责调节记忆

第43页

58

机器人技术与应用

图 2 RNN 子系统

图 3 WRN 子系统

提取的特征向量。系统计算流程如下:在每一时间步,原 2. WRN 语音情感识别子系统

WRN 子系统的框图如图 3 所示。一句话的频谱在时

始特征向量通过一层全连接层后进入 LSTM 层;所有时间

间轴上被切分为若干段,频谱段输入 WRN 得到关于每类

步的 LSTM 层输出在随后的池化层进行平均,得到这句输 情感的概率分布。对这些频谱段的输出计算统计值作为句

子的全局特征,全局特征输入一层 softmax 便得到该句话

入的全局特征;全局特征输入 softmax 层计算句子属于每 关于每类情感的概率分布,最终得到识别结果。总的来说,

WRN 子系统由两部分构成:一个对频谱段分类的 WRN 分

一类情感的概率,据此产生识别结果。由于 RNN 直接对 类器,一个对整个句子分类的 softmax 分类器。系统训练

时,首先所有训练样本被切分为频谱段,每个频谱段被赋

整个句子进行了处理,训练过程中只需要使用句子的标签 予所属句子的情感标签并输入 WRN 训练,随后训练频谱

段在 WRN 的输出按所属句子聚合并计算全局特征,由此

作为训练目标,训练中损失函数使用交叉熵。 softmax 的训练数据变成了以句子为单位并以句子的情感

RNN 输入的语音段特征 s(t) 由某个时间窗内的帧特

征堆叠而成,给定时间窗长 w 和帧特征 f(t),s(t) 可以表

示为 。本文中,帧特征包括

12 维 MFCC、能量、过零率、基频、声音质量和他们的时

间差分,共计 32 维。

第44页

59

机器人技术与应用

标签为目标进行训练。

该子系统中全局特征按如下方法计算。以句子 i 为例,

假设任务中需识别 K 类情感,频谱段 s 输入 WRN 后得到

属于第 k 类情感 Ek 的概率为 Ps(Ek),对 K=1,2…,k,分

别计算以下式子,其中 U 为属于 i 的频谱段的集合:

分别代表 i 中所有频谱段属于 Ek 的平均概

率、最小概率、最大概率和概率大于 0.5 的频率,于是 i 的

全局特征可以表示为 。 图 4 集成网络语音情感识别系统

3. 集成神经网络的语音情感识别系统 现了一种使用循环神经网络和宽度残差网络作为基分类器

的集成系统。该方法致力于结合拥有不同架构的深度神经

集成系统由两个基分类器和一层集成层 softmax 组 网络的优势,从而提高语音情感识别的准确率。特别地,

成, 如 图 4 所 示。RNN 子 系 统 和 WRN 子 系 统 的 输 出 循环神经网络用于建模序列信息并在句子层次给出识别结

结 果 都 是 关 于 情 感 类 别 的 概 率 分 布 向 量, 为 了 实 现 集 果,而宽度残差网络学习频谱段的特征表达并在语音段层

成, 本 文 把 两 个 向 量 相 加 作 为 新 的 全 局 变 量。 具 体 来 说 次进行识别。实验证明了该集成系统相比于单分类器语音

情感识别系统的有效性,也表明由本文首次引入语音情感

,给定训练集,其中 是语音样本, 识别领域的宽度残差网络在这方面有着不逊于主流的基于

是对应标签,N 是样本数目,首先分别训练 RNN 和 WRN 循环神经网络方法的性能。令人略感遗憾的是本实验中由

子系统,对样本 i,每个子系统都产生一个概率向量,分别 集成方法带来的性能提升并不突出,可能的原因有两点,

一是实验采用的数据库存在数据不均衡的问题,二是集成

记为 和 。两个向量相加产生新的全 方法的设计问题。关于这两点,在未来的工作中,我们将

会探索数据增强的方法以缓解数据集分布不均衡的问题,

局变量 : 也将尝试使用不同的集成方法以增强系统对语音情感的建

模能力。

在 集 成 层, 就作为训练数据训练

softmax 分类器。

测试阶段,测试语音同时进入两个子系统并产生概率

分布向量,随后由式 (10) 计算全局变量,输入集成层产生

最终的情感识别结果。

结束语

针对语音情感识别任务,本文运用集成方法设计和实

第45页

60

机器人技术与应用

台达 SCARA 工业机器人助力电子

制造业机器换人 提升加工作业精度

当前,如手机、电脑、iPad 等电子产品已经成为人们生活中的标配,这也促进了电子制造业的高速发展。PCB(印刷电路板)

是电子产品中的重要组件,随着电子产品朝着高端、小型化趋势的发展,对 PCB 的要求也越来越高。当前,PCB 厂商正加

快开发更薄、更轻和密度更高的 FPC(柔性电路板)。

文 \/ 台达集团

贴片工艺是印刷电路板生产过程中的重要一环,主要 两 台 机 器 人 进 行 贴 片 工 作。 三 台 机 器 人 对 每 件 FPC 进

是通过将具备各种功能的 SMT 器件高精准地贴装在 FPC 行抓取的时间只需要 1.5 秒,撕膜机器人的定位精度为

相对应的固定位号上(位号由贴片程序通过坐标图、位号图、 ±0.1mm,而进行贴片工作的两台机器人定位精度更可高

BOM 主板装配料单预先做好)。过去由于成本的考虑以及 达 ±0.05mm。

自动化技术的普及程度不高,这部分工作多由人工操作完

成,但这往往会造成产品合格率不高、质量稳定性差等问题。 在项目实施的过程中,台达团队第一次遇到了两台机

器人工作区域的重叠问题。通过一系列的优化,最终解决

某印刷电路板制造公司选用了台达 SCARA 工业机器 了两台机器人之间机械手臂的防撞以及坐标系统一问题。

人工作站解决方案来取代传统的人工作业,进行 FPC 的撕

膜及贴付作业,有效地降低了产品出现废品的概率,提升 通过采用台达提供的 SCARA 工业机器人整合解决方

了产品质量,也提高了生产效率。 案,使用机器人替代人工贴片作业,一台贴片机设备可以

为生产企业节省 8 个人的劳动力,并且大幅度提高了产品

针对 FCB 生产的工艺特点,台达提供多套机器人工作 合格率。同时,这也是台达机器人产品在高精度加工方面

站解决方案。每套解决方案由三台台达 SCARA 工业机器 的典型应用,证明了台达 SCARA 产品完全可以胜任电子

人 DRS40L 系列、IO 转接板、HMI、光源等组成。其中, 制造这种对精准度、速度都有高要求的场合。

台达 SCARA 工业机器人 DRS40L 系列具有优越的速度、

精度、线性度和垂直度等性能,能够提供免感知器的顺应

控制功能,可顺应电子制造中柔性电路板的偏差,快速精

准地完成贴片作业,大幅地降低因为操作员疲劳工作而带

来的废品率,帮助企业提升生产效率,并因此而降低人工

成本。同时,DRS40L 还具有多样性教导工具与直觉式教导、

程序编辑简单易上手等特点,与市场上同等功能 \/ 性能的

工业机器人产品相比适用性更高、系统整合性更强。

在 该 项 目 的 每 一 套 机 器 人 工 作 站 解 决 方 案 中, 一 台

机器人在建立放料载板的使用者坐标系的基础上,对 FPC

进行抓取和工位放置,并撕取 FPC 的背胶膜,再由另外

第46页

61

机器人技术与应用

台达工业机器人锁螺丝工作站

助力打造锁螺丝自动化生产线

近年,3C 行业(即:电脑 Computer、通讯 Communication 和消费性电子 Consumer Electronic)迎来了高速发展,

成为制造业整体形势不乐观大背景下的一大亮点。但作为典型的劳动密集型产业,3C 行业在实现快速发展的同时,也同样

面临着 \" 招工难 \"、\" 人工流动性大 \" 等难题,这也促使各大 3C 产品生产商加快引入工业机器人等自动化设备,来解决用

工成本持续走高、招工难等制约产业发展的问题,推动 3C 产业由劳动密集型产业向技术密集型产业转型。

文 \/ 台达集团

某客户为全球知名的 3C 产品制造商,生产的个人计 工艺以及锁付路径;

算机、笔记本电脑等产品在全球市场占有重要份额。日前, ● 针对锁付过程中的浮锁、滑牙、螺丝供料异常、影

为降低生产成本、提高生产效率、加快自动化的发展步伐,

该客户决定新建 10 条自动锁螺丝生产线,以代替人工锁付 像 NG 等问题或故障,系统规划有预警停机与多项处理等

和 XY -Table 型自动锁螺丝机锁付。根据客户需求,台达 功能;

提供以 SCARA 工业机器人 DRS60L 系列为核心的自动锁

螺丝产线解决方案,满足了客户对于提升锁螺丝工艺自动 ● 可代替传统的 XY-Table 型自动锁螺丝机,使用方

化水平的需求。 便快捷,换线快,通用性和适用性强;

台达提供的自动锁螺丝产线解决方案由多台 \/ 套自 ● 锁付数据可实时上传给客户服务器,便于客户实现

动锁螺丝工作站组成。每台自动锁螺丝工作站整合了台达 及时监控与分析设备运行状态;

SCARA 工业机器人 DRS60L 系列、机器人控制驱动一体机

ASDA-MS 系列、机器视觉系统、手持式示教盒、PLC 等 ● 锁付良率提升至 97.3% 以上。

工业自动化产品。由于方案全部采用台达产品,产线上所 该项目的成功导入,为客户降低了人力成本,提高了

有产品和接口设备可以实现快速整合。其中,台达 SCARA 产品质量的一致性,提升了整个车间的自动化程度。该项

工业机器人 DRS60L 系列,具有出色的速度(标准循环时 目的成功实施也打破 3C 行业传统的锁螺丝机模式,拓展

间为 0.39 秒)、重复精度 (±0.015mm) 和线性度,特别 了台达工业机器人应用领域,也是台达工控产品的多样性、

适合包括 3C 行业在内的电子制造业;同时,该系列产品 实用性和整合性的一次完美展现。

支持多样的操作方式,可方便客户快速上手。此外,用户

通过台达手持式示教盒可以实时监控工作站锁螺丝作业状

态。

台达自动锁螺丝工作站系统架构如右图所示。

采用台达解决方案,客户获得的收益包括:

● 配合螺丝自动供给与锁付单元,可满足 M1.2-M4

范围内的螺丝锁付作业;

● 控制系统采用人机交互方式,客户可选择多种锁付

第47页

62

智能系统

AR 是否可以重塑

途中旅游服务?

文 \/ 移动大数据研究室执行主任 广东省区块链与分布式物联网安全工程研究中心主任 中国科学院深圳先进技术研究院曲强

旅游日益成为现代人类社会主要的生活方式和社会经济活动之一,旅游业的蓬勃发展催生了大众旅游时代,旅游因此成为现

代生活的重要组成部分。根据联合国世界旅游组织第 22 届全体大会发布的数据,全球 598 个旅游目的地在 2017 年上半年

共迎来 5.98 亿国际游客,同比增长 3600 万人。旅游产业以其强劲的发展势头成为全球经济产业中最具活力的产业之一。

据报道,自 2015 年以来,我国城乡居民出游人数年均增长 10% 左右,旅游总收入年均增长 11% 以上,旅游直接投资金额

年均增长 14% 以上。到 2020 年,我国旅游市场总规模预期达到 67 亿人次,旅游投资总额 2 万亿元,旅游业总收入达到 7

万亿元。因此,各国对旅游业都非常热衷,大力投资,使得旅游业成为社会投资热点和综合性大产业。另一方面,增强现实

技术的发展为旅游行业服务方式提供了新的契机,一些企业也抛出了基于增强现实技术的产品概念或者应用。那么,增强现

实技术能否重塑旅游产业并挖掘出途中旅游的更大潜力,为早已硝烟弥漫的 OTA 企业与传统旅行社战争开辟新的战场?

增强现实技术(Augmented Reality,简称 AR), 术的广州南站周边的餐厅信息,用户可以方便的浏览周边

是一种通过场景感知的虚景与现实场景的叠加以增强人机 的餐厅情况,包括餐厅方位、名字、距离等。

交互、提升服务的技术。目前,AR 已经应用在包括工业设计、

建筑、教育、游戏、交通、旅游、军事等众多行业和领域当中, 实时翻译:翻译软件也越来越多与 AR 应用结合,用

未来随着随身电子产品运算能力的提升及其存在形式的多 户可以在国外旅行中很方便的看懂招牌、 菜单和其他文字,

样化,预期 AR 的用途也会越来越广。 如 Google Translate,Word Lens 等,可以将外语自动实

时转换为用户选择的语言。另外,对文本信息的多媒体数

途中旅游,由于对环境、语言、文化等方面的不熟悉, 据展示也可以更加形象的翻译,也可以被用于教育等领域。

人们要花费大量的时间去寻找、理解周边的信息,在这方 图 2 展示了 AR 应用实时翻译图片上的文字,将俄语自动

面 AR 可以提供很多便利。针对途中旅游服务,AR 应用以 实时翻译为英文。

其炫酷的表现方式,在多种服务上已经开始涌现,为用户

提供了访问旅游信息的新方式。例如如下场景中的几类应 路径导航:AR 技术可以被用于室内与室外的路径导

用: 航,引导方向箭头可以直接叠加到用户的现实场景视图上,

并且这些 AR 应用可以增加游客与景点之间的互动,例如

周边发现:基于智能手机和平板电脑,用户可以直观 途中的虚拟指引,从而减少指引标牌的使用;途中的景点

的显示和查找周边的信息,例如天气预报、附近的 WiFi 热 介绍等。图 3 展示了去往中国科学院深圳先进技术研究院

点、餐厅信息和交通枢纽等,都可以基于用户的地理位置 路径导航,实景上的箭头更形象、方便的指引用户到达目

进行呈现。另外,AR 还可以提供各种主观性的信息,比如 的地。

目的地的各种评论、根据个人兴趣而推荐的地点。这些场

景也促使很多 AR 应用考虑社交功能,增加交友、评论、 虚拟场景:AR 技术可以构建虚拟场景,使得途中旅

积分等社交手段以增强用户粘性。图 1 展示了基于 AR 技 游景点更加吸引用户,也可以创造更好的旅游市场教育和

广告。例如可以展示某建筑的历史变化,从而代替文字介绍,

第48页

63

智能系统

图 1 广州南站附近餐厅 图 2 Google 翻译:俄语到英文实时翻译 图 3 中国科学院深圳先进技术研究院路径导航

让用户更好的理解名胜古迹。 和数据挖掘方法,产生的符合用户需求的信息。

然而,AR 技术欲重塑途中旅游产业,提升用户体验, 那如何有效解决上面的三个方面问题,促进 AR 技术

主要存在三个方面的问题需要解决: 在途中旅游服务产业的应用与发展呢?我们认为其核心在

第一,方式问题。该问题主要体现 AR 应用内容的通 于智能移动推荐引擎的构建。通过智能移动推荐引擎,AR

应用可以根据用户的个性化需求适时、适量的推送途中旅

用性,AR 途中旅游服务应用可以涉及旅游的多个方面,包 游信息,使 AR 应用更懂所服务的特定用户。同时,移动

括吃、住、行等,内容展示方式、识别方式和共享方式直 推荐引擎系统平台也可以服务多种应用场景,连接数据,

接决定 AR 内容的通用性,比较强的通用性可以更好的满 实现数据在多种应用中的共享,更容易实现内容的通用性。

足客户旅行需求。比较强的通用性指多个应用对于同一内

容的识别能力,例如二维码是一种通用性的信息表示方式, AR 技术在旅游行业内的应用范围非常广阔,结合移

可以跨手机应用来识别同一个编码内容。 动、社交等不同技术,可以构建出很多有发展前景的应用。

并且通信技术发展迅速,AR 技术依赖的硬件平台也可以多

第二,形式问题。很多 AR 手机应用比较炫酷,给初 样化,包括智能手机、智能眼镜、隐形眼镜等穿戴设备,

始用户较好的用户体验,然而过多的交互和花哨的展示形 这些因素都为 AR 技术的应用市场提供了想象空间。AR 技

式很容易导致用户疲惫,使得 AR 应用用户粘性很低。形 术决定我们如何看世界,然而用户看到的是什么决定了 AR

式问题也可以归结为什么时候、什么场景、多久需要用 AR 技术是否可以重塑一个产业,这也是需要 AR 企业深入思

展示。 考的核心问题。

第三,模式问题。模式是 AR 技术类应用展示的知识

与内容,是基于用户、社交、商户等数据,通过人工智能

云展网——上百万用户在此分享了PDF文档。上传您的PDF转换为3D翻页电子书,自动生成链接和二维码(独立电子书),支持分享到微信及网站!
收藏
转发
下载
免费制作
其他案例
更多案例
免费制作
x
{{item.desc}}
下载
{{item.title}}
{{toast}}