微软推出新一代全双工语音交互技术 可预测人类即将说的内容



微软(亚洲)互联网工程院宣布率先推出新一代的语音交互技术:全双工语音交互感官(Full-duplex Voice Sense),并已完成产品化落地。与既有的单轮或多轮连续语音识别不同,这项新技术可实时预测人类即将说出的内容,实时生成回应并控制对话节奏,从而使长程语音交互成为可能。





此外,采用该技术的智能硬件设备,将不再需要用户在每轮交互时都说出唤醒词,仅需一次唤醒,就可以轻松实现连续对话,将语音交互的自然度推进到一个新的层次。

7d0476a5770f6ba

 

目前,该技术已首先在微软小冰全球产品线中落地。其中在中国市场,除落户中国科技馆的小冰电话亭外,微软还与小米公司进行合作将该技术应用于米家生态链Yeelight语音助手的市售硬件产品上。这是全球首个搭载全双工语音交互感官的智能设备,也是内置微软小冰的首个“双AI”智能设备。在日本市场,小冰凛菜已通过该技术实现在直播平台中的落地,首个车载智能项目也已开始路试。微软计划于未来六个月内,完成该技术在更多产品线中的覆盖。

语音交互是对话式人工智能及智能硬件设备的基础之一。对此,微软小冰全球研发负责人周力博士表示:“从已落地的产品数据和用户反馈中,我们观察到一个普遍现象:用户一旦使用过微软小冰的全双工语音交互感官之后,再与其他语音助手交互时,他们普遍会开始感到不习惯,甚至会频繁忘记要对其他语音助手说唤醒词——新技术促进拟人自然度的显著提升,使人们对过去单轮或多轮连续语音交互体验的满意度迅速下降。这种新老交替的现象,符合我们的研发预期。”


© 推荐 for 互联网的那点事. |
猛击下载:iPhone客户端 猛击下载:Android客户端

DJI最大的商用无人机订单来自于日本的建筑行业



大疆今天宣布其最大的单一商业无人机订单,配备美国创业公司Skycatch机器视觉软件的1000台大疆无人机将全部出售给日本建筑巨头小松。这些无人机都是同一种型号:Skycatch Explore1。这是一款基于DJI Matrice 100企业无人机的半自动四轴飞行器,它使用机器视觉来调查和监控施工现场。




它可以生成精确到5厘米的地图,并且可以帮助完成诸如监测库存等任务(例如,剩下多少水泥或沙子)。在小松公司的案例中,无人驾驶飞机产生的数据也将用于控制目前正在开发的机器人施工车辆。

Skycatch首席执行官Christian Sanz在接受The Verge采访时表示,该公司的无人机已经在日本的一万多个建筑工作中使用。Skycatch帮助调查了未来的迪士尼主题公园,Facebook的数据中心网站,并且最近为库比蒂诺的一家无名公司承担了特别大的工作。

e2ba9572d86d621 efac11c5a438408

Skycatch的无人机直接销售给客户或与技术人员一起租用。虽然公司拥有自己的一套机器学习算法,可以识别施工现场以及人员和车辆的基本材料,但客户可以提供自己的数据来训练新的算法。Explore1无人机还配备了基站Edge1,该基站负责图像处理而不需要互联网连接。 Sanz说,它基本上是一台“云计算机”,在全球1500万个活跃的建筑工地中,30%左右的工作站没有互联网连接。






© 推荐 for 互联网的那点事. |
猛击下载:iPhone客户端 猛击下载:Android客户端

亚马逊申请快递交付无人机新专利 可以理解用户语音和手势



亚马逊已经提交了一份交付无人机的专利,当你打电话给它时,它会作出响应。 GeekWire发现了这项专利,而无人机的概念旨在识别人类的手势,然后做出相应的反应。例如,无人机会识别的姿势包括挥动手臂,指向,灯光闪烁和讲话。




该专利最初于2016年7月提交并于本周发布。该专利称:“人类接收者和/或其他人类可以使用人类手势与无人机进行通信,以帮助无人机沿着其途径到达交付地点。”该专利显示无人机会识别人类手势,包括欢迎和危险的手势,如果一个人以欢迎的方式挥手,无人机可以将手势解释为交付包裹的指令。

该专利详细介绍了无人机的几个组成部分,包括通信,导航,手势确定和交付组件。该无人机还将具有一个或多个光传感器,深度传感器,可见光相机,红外相机,听觉传感器和深度感知相机。虽然无人机的概念令人印象深刻,但它仍然只是一项专利,并且目前尚不清楚该无人机是否会生产。亚马逊还提交了其他尚未转化为产品的专利,其中包括一款自毁式无人机和一面镜子,可让用户穿上虚拟的服装。

 

43364e647468bdc

1e40eab2ebec6c7

可以响应人类交互的无人机概念并不新鲜。三星还拥有一种类似的无人机专利,能够检测到人的脸部和手势,DJI的Spark无人机也可以响应人类手势。






© 推荐 for 互联网的那点事. |
猛击下载:iPhone客户端 猛击下载:Android客户端

Google Assistant新技能:用语音来向好友收付款



Google Assistant迎来一项新的技能:使用语音和Google Pay向好友收付款。这项新技能不仅面向Android平板和智能手机开放,而且已经登陆iPhone端,并且承诺未来多款智能音箱也会获得这项功能。




caa583db5b1d7e3

自然想要通过Google Assistant用语音方式来进行收付款,用户首先需要在Google Pay上登陆Google账号。假如用户没有注册过Google Pay账号,那么当用户尝试首次向某位好友付款的时候,Google Assistant会推荐用户进行注册Google Pay账号。如果对方也激活了Google Pay服务,整个转账过程几乎可以说是实时到账的。如果对方没有Google Pay,那么系统会以短信等方式推荐对方安装和设置Google Pay。

如果想要通过Google Assistant实现收付款,那么只需要说:“Hey Google, request $20 from Sam for the show tonight”或者“Hey Google, send Jane $15 for lunch today”,接下来Google就会处理接下来的事情。

df45dcc5cf5508b

不过在实际转账过程中依然需要进行认证,用户可以通过指纹或者Google账号密码方式来进行支付。这项新技能已经免费向Android和iPhone用户开放,而且Google在新闻稿中表示这种收付款Google不会收取费用,但是这项新技能目前仅在美国地区上线,相信未来会在国内等其他国家和地区上线。


© 推荐 for 互联网的那点事. |
猛击下载:iPhone客户端 猛击下载:Android客户端

美国科学家开发出新设备 能从干燥的沙漠空气中造水



据《每日邮报》网站北京时间3月23日报道,美国麻省理工学院(MIT)科学家已经开发出一种新技术,可以从干燥的沙漠空气中生成水分,从而拯救那些生活在恶劣的沙漠气候中的生命。根据MIT研究人员发表在《自然通讯》(Nature Communications)上的最新报告,这项技术可以将空气中的湿气转变为水。因此,该技术将可以在全世界得到普及应用,因为地球每个地方的空中都至少含有一定的湿气。




197d7beeaed20a7

MIT科学家开发的新设备可以将沙漠干燥的空气变成水

MIT研究团队称,最新研究可以帮助人们在地球上最干燥的气候下生存下来。这项技术最早是在去年《科学》杂志的一篇论文中被提到,但在科学界既有人对该技术充满乐观,也有人持怀疑态度。

伊芙琳·王教授是原始论文的作者之一,同时又参与了最新发布的研究,她说:“这项技术当初既受到了大量关注,也遭到了一定的批评。在最新论文中,上一次提出的所有问题此次都获得了清楚展示。我们验证了那些观点的有效性。”

新产品曾在亚利桑那州坦帕市进行测试,测试结果证明它具有帮助人们在沙漠中抵御干燥的潜力。研究报告写道:“这一系统是使用名为金属有机框架(metal-organic framework,MOF)的特殊类型材料造出来的,可以从相对湿度只有10%的最干燥的沙漠空气中提取出饮用水。当前从空气中提取水分的方法要求更高——雾气收集方法要求湿度为100%,基于冷却处理的露水收集系统则要求湿度为50%,同时还需要大量能量进行冷却处理。”

伊芙琳·王教授表示,该设备在测试期间放置在亚利桑那州立大学建筑物的屋顶上,可以让研究人员“在具有代表性的干旱地区观察该技术,并且表明我们甚至可以在零度以下获取水分。”此外,该系统的维护成本也低于同类产品。研究人员萨米尔·拉奥(Sameer Rao)说:“它没有活动的零部件,可以在低湿度但阳光充裕的地方以完全被动的方式运行。”

“现在我们已经证明这确实是可行的,”伊芙琳·王教授还指出,下一步便是提高这一技术的效率。“我们希望造出一种能够生成几升水的系统。我们想要看到有水倒出来,”她说。研究报告写道,“这些小型的初始测试系统只能造出几毫升水,以证明该概念在现实条件下是有效的,但其想法是制造足以为个别家庭供水的设备。”科学家在测试过程中产生的水中未检测到杂质。


© 推荐 for 互联网的那点事. |
猛击下载:iPhone客户端 猛击下载:Android客户端