语音识别新突破:微软AI小胜人类专家

语音识别新突破:微软AI小胜人类专家,第1张

将人类之间的对话转录成文字一直是机器的噩梦。即使语音文件质量很高,没有任何背景噪音,算法依旧要努力区分不同的声音,中断,犹豫,纠正,以及冗长会话中的细微差别。

微软研究院的一篇新论文宣称他们的语音转录技术已经能小胜人类对话转录专家,即使人类专家的文本已经接受了另外一个人的复核。研究团队并没有将此成就归功于算法或者数据上的突破,而是对现有的AI架构进行调整。

为了测试他们的算法能否跟人类分出胜负,研究者们首先要确定一个基线。微软找来一个第三方,他们有一个确认100%正确转录的音频。测试分两个阶段:一个人听写音频,第二个人听音频并纠正转录的错误。比照正确的文本后,专业人士的错误率为59%和113%。

在学习完2000小时的人类讲话后,微软的系统也听写了同样的音频,错误率为59%和111%。这02%的差距就是少了12处错误。

微软的下一个挑战就是让这一水平的语音识别在更加嘈杂的环境里工作,比如在车内或者在趴体上。视线这个对微软而言极为重要,而且它也远远超出了转录本身。

这项研究是微软力图让人机对话更加流畅和轻松的重要一步。如果电脑无法理解一个人的画,那么它完成指令或者回答问题就会更加困难。微软要想取得其他方面的突破,这是基础。今年早些时候,微软CEO萨提亚纳德拉说人工智能是该公司的未来,而会话能力则是它的基石。

尽管它取得了成功,但是人工智能系统跟人类转录员还有一个巨大的区别:它不能理解对话中那些细微的变化,比如“嗯”。出现“嗯”的时候,往往是一个人在对话中正在思考,或者是让对方继续说话,比如“嗯哼”。专业的人类转录员可以注意到这是犹豫还是确定,但是机器就会忽视这些微小的线索,它们无法理解其中的含义,也不知道为什么会发出这样的声音。

文:许叔/煎蛋网

关于煎蛋:资深新鲜事推送鸡。网站 Jandannet,公众号:煎蛋(公众号ID:jandancom,并没有i

日前微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士在接受《商学院》专访时如此表示。

“微软的Bing搜索是全球两大搜索引擎之一,这需要更多的AI来支撑这一工作。”微软人工智能及微软研究事业部全球资深副总裁Andrew Shuman说道。

然而,由于近期人工智能的发展已经让行业形成了抢滩态势,每一家科技公司,包括微软,似乎更倾向于通过机器学习和认知计算来完成更多的工作。

去年,关于AI的认知和讨论的重点都集中在聊天机器人上。在微软Build 2016大会上,微软CEO纳德拉还承诺,将把重点从Skype向Hololens转移。该公司甚至还自研了一款聊天机器人——Tay。然而,在微软放出Tay的短短24小时之后,该公司就不得不对其发表的一些涉及种族歧视的煽动性评论进行了公关处理。

而现在离微软Build 2017大会开始已经不足3天,业界不免猜测微软将在今年大会上瞄准哪些重点,以及相关的硬件新品发布等。据行业人士分析,此行AI将不会作为重点被强调,微软或将重点放在挖掘有用的数据,以及对人工智能的“智慧”洞察等方面。

微软高级经理Gregersen认为,向云转变将进一步有助于微软的加速创新。“更重要的在于,云还能搭载大量的数据和信号。”根据微软财报显示,2016 财年微软共有 920 亿美元的收入,其中云计算和企业事业部商业云业务贡献了超过 120 亿美元。从微软今年Q3财报来看,Azure云服务销售额更是同比增长了93%。

与其他科技公司布局AI不同的地方在于,微软AI有了云服务的助攻而显得更加“润物细无声”。具体可从Microsoft Office服务和智能助理Cortana来体现。

Office的“AI”触手无处不在

事实上,微软的Office软件服务遍布“AI”触手。

任何使用过Microsoft Office软件套件的人应该都知道,它现在拥有的功能比以前多得多。

据Gregersen介绍,目前Microsoft Office软件套件中加入了许多深层的AI功能。如,在PowerPoint中,Quick Starter可使用AI来帮助用户找到正确的模板,用户只要在PPT中输入一个单词, 幕后就能呈现Bing关于这个单词的搜索结果。

同时,还能在智能云上进行 PPT 编辑,AI 可以帮用户给这张图起名等等。Designer服务也可以查看演示图像,找到可以影响模板设计选择的面孔和颜色。

Gregersen说:PowerPoint的大部分“智能”设计的用意在于打破“空白页综合征”。很多大学生上课需要做不同的Presentation,但苦于PPT的制作。微软对PowerPoint的大量AI设计将有助于他们克服这一难题。

值得注意的是,微软的AI还能以大部分用户做不到的方式来丰富PowerPoint制作的演示文稿。里边内置一项认知视觉系统,可分析照片并自动生成Alt-Text。虽然依据目前的智能程度尚不能得到高频次的正确结果,但Gregersen表示,该过程的反馈结果将有助于提高AI识别未来图像的能力。

目前,微软正在进一步精炼Office的AI功能,当用户制作与流程相关的Presentation时,可主动建议用户以图表的方式来演示这一流程。

此外,Outlook的 “Focused Inbox”功能也使用了基于云的机器学习来提供支持,它能够优先显示重要的邮件而并非显示所有信息。

据Gregersen介绍,目前在Outlook的Andriod和iOS版本中,Focused Inbox功能非常尤为受欢迎。

同一层面上,Word用户多年来一直在使用基于微软AI的服务,这点主要体现在书写助手方面,如拼写检查和语法等方面。现在的Word已修复了多处明显错误,还能提供多项风格改变等服务。

“过去由于没有大型语言模型和机器学习,很难做到这一点。“Gregersen说。

“当然,最终所有的控制都掌握在用户手中。”Gregersen补充表示。最终用户控制也是微软所有AI工作的一个常见主题,微软希望这些Office工具都能为用户实现个性化操作。比如,用户经常在Word中拒绝的修改可能不会再后续写作中被标记。

智能助理Cortana

另一方面,微软的AI工作还有一项有力的支撑——智能助理Cortana。虽然Cortana目前看来有点不瘟不火,但微软从未减少对它的投入和关注。

说起Cortana,比起微软其他的AI版块,大家对它可能更为熟悉。但是,在全世界数亿计的台式机上,仍然很少有人使用Cortana的语音助手服务。相反,大多数的Windows用户更习惯通过文字输入以获得问题的答案。

Andrew对此表示,人们还是不习惯于和自己的电脑说话。对Andrew来说,“每次当我谈论Cortana时,都要记住先把她关掉。”

即使这是赤裸裸存在的事实和难题,但这并未影响微软将Cortana定位为其布局AI的一大利器。在最近的Windows Creators Update中,微软尝试将Cortana插入安装程序,并植入竞争平台,并为此构建iOS和Android版本的APP应用。

在移动端方面,虽然微软的Windows Phone的市场份额微乎其微,但这并不意味着就没人在iPhone手机上安装Cortana应用,特别是在他们已经拥有苹果Siri语音助手的前提下。Andrew对此非常乐观。

“有相当数量的公司在缺乏移动市场份额的情况下依然取得了成功。微软可以通过智慧化、智能化和自然趋势流动来引领这个市场。”Andrew向外表示。

一直以来,除PC以外,Cortana一直没有专用的硬件主体,因而很难成为家喻户晓的AI产品。不过,业界猜测微软或有可能在Build 2017大会上发布一款基于Cortana的扬声器产品。

Andrew还表示,在Cortana上微软已经投入了大量的研究成果,并在Azure上开放了大量的编程接口。一言以蔽之,第三方开发人员可利用微软的认知服务API和大量云服务,在自己的应用程序中构建语音、图像和语音智能等功能。

如雷锋网此前报道,日前微软放出了一项“Chatbots on Bingcom”议程,开发者可以使用微软的Bot Framework将自己的聊天机器人整合到Bing中,以帮助用户找到附近的餐馆、**播出时间等等。据雷锋网了解,这项议程将在三天后的微软Bulid 2017大会上宣布。

当被问及微软为何不去巩固Cortana背后的AI功能时,Andrew表示,他不认为这是正确的做法。对Andrew来说,Cortana应该专注于一整套能力的开发,而非逐步挖掘。“毫无疑问,微软一直以来对所有产品都采取共享和开源的态度。”

能用。根据查询微软官方可知,截止到2022年11月19日微软的ai语音可以正常使用。微软AI语音 是一款在线文本转AI真人语音工具/文字转语音,使用强大的微软AI语音库,合成独具特色接近真人语音的朗读音频,支持一键下载语音文件,格式为mp3。

软件巨擘微软近日宣布,将投放2500万美元发展人工智能(AI)项目,鼓励业界开发AI程序协助残疾人士。主席史密斯称,期望项目可使全球近10亿名残疾人士通过AI改善生活。

微软行政总裁纳德拉在软件开发者周年大会上,公布名为“无障碍AI”的为期5年计划,鼓励软件开发者研发有益社会的AI,以消除外界对科技高速发展损害个人私隐的疑虑。

纳德拉警告没有道德原则而研发新科技会带来严重后果,他称,“不应只思考计算机能做什么,更要思考计算机应做什么”。

据悉,无障碍AI计划主要对象为创业人士、非牟利机构及学术研究人员,除金钱援助外,微软也会提供专家协助。史密斯表示,计划能协助残疾人士在AI的帮助下,过上独立生活及获得受雇机会。

纳德拉在会上还公布,微软AI助理Cortana将通过亚马逊智能家居助理Alexa使用,并会在未来引人办公室模式,扩展Cortana的影响力。

导出画板点击保存。

电脑打开AI软件。打开AI后,新建一个画板,并且编辑好内容。编辑好内容后,点击AI左上角的文件选项。打开文件后,点击文件中的导出选项。点击导出后,进入导出页面,把使用面板打上勾,然后再选择范围,输入要导出那个画板,然后点击保存就可以了。

能用。

1、微软在中国力推Ai新战略,使微软ai在中国得以更加迅速推行,因此微软ai在中国能用。

2、为了打造一套能够快速适配、复制到不同区域市场的全球化AI系统,微软和中国达成合作,因此微软ai在中国能用。

若能让电脑更容易理解人类自然话语诠释内容,意味将可推动更自然的人机互动体验,例如让数位助理服务能进一步理解使用者需求,并且做出正确判断,或许就能让人工智慧能具体协助使用者实际所需服务。

微软稍早展示旗下人工智慧技术,显示已经能从纯粹的文字叙述「画」出实际图像内容。

根据微软研究人员表示,目前所研发的人工智慧已经足以就单纯文字描述内容,从无到有地建构一组影像。从此次举例内容「具有黑色双翅与短喙的黄鸟(yellowbirdwithblackwingsandashortbeak)」来看,电脑系统便借由人工智慧理解语意,进而从一个画素、一个画素建构出符合文字描绘的影像内容。

在此之前,微软便曾利用电脑视觉与自然语意识别技术,让电脑能依据影像情境自动生成合适标语,接着则是透过SeeingAI技术,使得电脑能协助盲人「看见」眼前景象。而此次展示技术则是以反向模式运作,透过让人工智慧理解语意,进而建构电脑理解后所能呈现影像。

若能让电脑更容易理解人类自然话语诠释内容,意味将可推动更自然的人机互动体验,例如让数位助理服务能进一步理解使用者需求,并且做出正确判断,或许就能让人工智慧能具体协助使用者实际所需服务。例如此类应用将可套用在自动驾驶技术,让自动驾驶车辆能容易分析前方路况,以及可能发生事项,借此让电脑能进一步协助使用者避免意外发生。

欢迎分享,转载请注明来源:表白网

原文地址:https://h5.hunlipic.com/biaobai/4080762.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2024-04-14
下一篇2024-04-14

发表评论

登录后才能评论

评论列表(0条)

    保存