随着技术的发展,AI智能语音的表现力与拟真性也在不断提升,从一开始僵硬的机械音逐渐发展到了能够识别语句结构,将文本富含情感的念出来。
现在,Microsoft认知服务官方宣布,微软的智能语音技术再次获得升级,在语音合成上实现了多种方言的支持。
目前,微软智能语音除了标准普通话外,还支持吴方言、粤方言、西南官话、东北官话、冀鲁官话、中原官话在内的多种方言,并能够流畅进行朗读古诗、语音播报等交互行为。
同时,在语音识别上,该技术目前已经支持了三种方言,扩宽了用户群体。
据悉,微软智能语音基于Azure Neural TTS(text-to-speech,语音合成)与 STT(speech-to-text,语音识别)两大技术,支持的语音区域已经超过140个,并支持超过400多个音色。
该技术的语音具有丰富细腻的情感,能够做到与真人不分伯仲。
智能语音产业观察:微软小冰建半开放生态 AI创造与商业化已至?
有别于过去五次,7月26日举办的微软小冰第六代发布会,首次走出了微软亚太研究总部的一层报告厅,搬到了798区域大型会场。“发布会规模也从过去的几十家媒体,扩张到数百家、覆盖全国范围的规模。”一位接近微软方面的人士告诉21世纪经济报道记者。
这是一种信号。在过去,微软从未给过小冰任何商业方面的压力,甚至直到近日接受包括21世纪经济报道等媒体采访时,微软小冰负责人李笛依然强调,小冰并没有盈利指标。
但就像发布会本身一样,小冰也在不自觉地走出实验室和研究机构,逐渐尝试商业化。这是小冰发布会首次搬家的底气所在。而经历了过去五代,从小冰萌芽到成长,从拥有二维框架图到二维图像,再到如今三维立体全息影像的展现,小冰正在愈发接近一个人类。
其背后的技术在持续迭代,生态也开始成型。据微软方面介绍,此次发布会是小冰情感技术框架所有部分的全面升级,从首次完成落地时的情商+智商设定,到对话式人工智能、生成模型、全双工语音,如今的小冰开始迈入AI创造的阶段。生态方面,微软此次首次提出构建Dual AI半开放式生态系统,差异化融合合作伙伴优势,打造小冰的专属技能与能力。
“人工智能的最终目标是‘人机协同’,以数字智能帮助人类,但这个方向拥有不同的路线。”微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋表示,“小冰团队走出了不一样的道路。”
AI创造
自去年开始,微软小冰便在创作上拥有诸多尝试,甚至出了一本自己的诗集。如今,小冰将要走得更远。
在发布会现场,沈向洋宣布微软思考了AI创造的三原则:其主体首先必须是兼具IQ与EQ的综合体,而不仅仅是具有IQ;其次,人工智能创造的产物,须能成为具有独立知识产权的作品;第三,人工智能创造的过程,须对应人类某种具有创造力的行为,而不是对人类劳动的简单替代。
小冰的目标,就是成为一个高情商的机器人。“我们计划将AI创造当成一个新兴产业来操作。”在发布会现场,微软人工智能创造事业部总经理徐元春表示,“如果将AI创造当做内容产业、而非简单的文艺创作的话,仅有‘概念车’是不够的,从去年开始我们并行了‘量产车’的工作。”
据介绍,在过去12个月内,小冰主持了21档电视节目、28档广播节目,覆盖中国包括9大卫视在内的41家电视台和广播电台,如今,小冰每天主持的广播节目已经达到25档。在日本和中国,小冰累计生产了2878个小时的视听内容。
同时,小冰的有声读物已经覆盖中国超过90%的早教机器人和80%的线上播放平台。此外,与网易新闻客户端合作的读新闻小冰,已于两个月前突破1000万次新闻阅读评论。在金融等相关领域,小冰同样在进行着持续的内容创造。
这背后的技术支撑,来自于小冰的情感技术框架,而第六代小冰的核心对话引擎与交互感官也得到了进一步升级。微软在第六代小冰身上上线全新的共感模型,并公测一种融合了文本、全双工语音与实时视觉的新感官。
其中,共感模型是一种基于生成模型的对话引擎。据介绍,去年小冰完成的生成模型能够自创回应,而非在已有对话语料库中检索而得,如今的共感模型则进一步提升小冰对于对话内容、领域和节奏的控制力,即小冰可以自创回应来牵引对话的方向。
这一融合了共感模型的对话引擎、全双工语音和实时视觉三个类别的全新感官在测试设备中的公测,令小冰能够通过视觉、语音的实时连续交互,指挥用户完成面容检测,并在该过程中进行开放域对话。
此外,微软还发布了第四版AI歌曲DNN模型。据小冰首席语音科学家栾剑介绍,该版本模型能够快速合成与人类歌手质量相当的歌曲,还能够使小冰自由吸收人类歌手演唱技巧和特质,在模仿之余甚至代替人类完成新作品创作。
不过,尽管微软提出AI创造的原则并进行技术更新,但小冰的所为将只是真正AI创造的起步。“根据2017年Gartner技术成熟度曲线显示,虚拟助手仍需5-10年才能成为主流。”在评论AI创造能力时,Gartner研究副总裁蔡惠芬向21世纪经济报道记者表示,“该应用主要针对智能家居设备中的个人助理或语音控制等狭窄领域,但仍需要包括为不同领域构建知识图谱、自然语言理解与生成等技术的提升。它依然是新兴领域。”
Dual AI生态
除了技术能力升级之外,第六代小冰的最大特点,莫过于开始构建属于自己的生态——Dual AI。
“在微软之前,行业内已经出现多种不同的合作生态与模式,其中最重要的模式有两类,一类是开放赋能模式,通过对外提供SDK/API的形式构建生态系统。”小冰产品负责人彭爽分析道,“另一类是专注于自有的、封闭的平台,通过在平台上开放AI的应用商店形式构建生态环境。”
Dual AI则有所不同,更类似于半开放式生态。“在这样的生态环境上,一方面,微软会直接负责产品体验,把控最具体的、直接与用户接触的产品细节,另一方面,我们并不封闭在自有平台上,而是对外接触甚至直接融入到第三方平台上。”彭爽表示。
之所以如此选择,源于其他两类生态存在各自的问题。其中,封闭模式极大限制了数据之间的自由流通,与AI本质相悖。由于无法获得迭代所需的基础数据量,便难以快速迭代和发挥升级优势。
开放赋能模式中,无论赋能或被赋能一方,则均是相对松散的关系,“也就是说没有人真正对最终的产品体验负责”。例如当前大热的智能音箱之所以实际体验普遍低于预期,正是由于松散合作关系带来的问题。
与此同时,由于开放赋能生态中的API/SKD强调通用性,也就在一定程度上限制了最新最优技术应用的及时性,通过这类接口或工具包获取的数据也未必是最优质的。
而在合作过程中,小冰也在探索属于自己的盈利模式。目前,小冰已上线了包括金融、大众文化、传媒和出版四大商业化领域。“我们探讨过各种各样的AI盈利模式,最终发现为两大类,一类是利用AI技术用更低成本去替代人类低并发、AI高并发的工作,如内容生产,”李笛告诉21世纪经济报道记者,“其次便是AI与人类的协同,通过提升协同转化率实现分成。”
有哪些好用的APP?2018年最受欢迎的十大APP
有哪些好用的APP?2018年最受欢迎的十大APP
如今APP多的数不胜数,大家伙都玩得麻溜的,如果你想跟上时代的步伐,不想错过那些精彩有趣的APP,那么可以看看以下十款最受欢迎的APP,下面给大家带来2018年APP用户体验榜单!
具体如下:
一、WPS office
wps Office是一款最佳安卓办公软件,个人版永久免费,体积小、速度快;独有手机阅读模式,字体清晰翻页流畅;完美支持微软Office、PDF等23种文档格式;文档漫游功能,让你离开电脑一样办公。
功能介绍:
1、WPS文字
新建文字文档,并提供信纸、简历、合同等模板;
打开26种文字格式文档,包括加密文档;
智能适应手机屏幕阅读;
支持智能排版,文字段落、对象属性设置,插入图片等功能;
支持语音朗读,将文字转化为声音信息;
2、WPS表格
新建电子表格,并提供财务、课程表等模板;
打开13种表格格式文档,包括加密文档;
公式输入编辑器,解决手机输入法输入函数难的问题;
背板支持选择区域后快速查看计算结果,及选择电话号码可以直接拨号;
3、WPS演示
新建幻灯片,并提供商务、教学、论文答辩等模板;
打开和播放11种演示格式文档,包括加密文档;
新CPU,提供30项流畅动画的设置;
支持文字段落、对象属性设置,插入图片、音频视频等功能;
共享播放,支持多台设备同步播放;
4、PDF
打开和播放PDF格式文档;
手机拍照扫描文档,生成图片或PDF文件;
签名功能;
PDF一键转DOC;
二、讯飞输入法
讯飞输入法手机版来自国内顶尖语音识别团队——科大讯飞旗下的全球第一款支持中文语音的第三方输入法讯飞输入法手机版,讯飞输入法手机版不仅仅支持全国各地的地方语言、还支持手写、九宫格、全键盘、笔画输入等方式输入。
特色功能:
1、智能语音,个性化输入
讯飞输入法智能语音输入,识别准确率98%;语音智适应,知你所想懂你所说;语音口令修改,一次修改精准识别;支持离线语音,没有流量也能语音输入。1分钟400字,语音输入带你飞!
2、手写输入,挥洒自如
支持叠写连写,手写效率加倍提升;遇到人名、地名、生僻字等拼音难输入的字,直接手写输入更方便~
3、拼音输入,智能准确
拼音内核持续优化,百万超大词库及时更新,拼音云输入全面升级,输入候选更准确,让你彻底远离手癌烦恼!
4、英日韩随声译,满满国际范
随声译重磅升级支持英、日、韩三语种,说中文秒变外语,让你满满国际范儿;
5、方言识别,懂你乡音
支持22种方言输入,AI有温度,懂你懂乡音!
6、场景优化,输入更准确
新增游戏语音识别模型,自动优化识别结果;支持耳语输入,轻声说话也能精准识别;智能降噪,嘈杂环境也不怕!
三、交管12123
交管12123是公安部官方互联网交通安全综合服务管理平台的唯一手机客户端应用软件,交管12123 app由公安部交通管理科学研究所负责研发并提供技术支持。交管12123
app服务对象为全国机动车车主、驾驶人等广大用户。
功能介绍:
1、用户注册。
2、绑定本人机动车和驾驶证。
3、电子监控设备记录的违法行为处理。
4、机动车驾驶人考试预约。
5、新车预选机动车号牌。
6、补换领机动车行驶证、机动车号牌、机动车驾驶证,补领机动车安全技术检验合格标志。
7、机动车驾驶证延期换证、延期审验、延期提交身体条件证明。
8、机动车、驾驶证相关信息查询及告知提示。
9、交通管理相关业务办理地点导航。
四、B612咔叽
b612咔叽相机app是一款功能非常强大的拍照神器,结合了b612的滤镜和snow的滤镜,相当于一个拍照软件有两款美颜自拍功力,让你拍的更美,滤镜选择更多,让你变得更美更自信!
软件特色:
1、传说中的微整容神器,一秒变网红
还在为照片中那张小脸p来p去吗?
让我来为你设计最适合你的靓丽脸型和水汪汪的大眼睛~ 靓到每个朋友都羡慕你
美丽预警时刻开启!
2、无聊是什么?我不知道
超过1000个贴纸,从卖萌 、搞怪 、混血女神, 一秒钟带你变身!
AR技术为你制造梦幻般的白色雪花,五彩缤纷的奇幻气泡,神秘的欧若拉等亦真亦幻的背景~
每周都有更新贴纸啦!
3、专治选择困难症
拼图大乱斗~ 将你的貌美如花 、激萌瞬间 、傲娇表情,全都拼在一张拼拼图里!
一张一张地完成你的盛世美颜!拿起属于你的拼拼自拍和视频发到你的朋友圈~背景音乐千万不要忘记欧!
4、滤镜相机诞生啦
无论走到哪里,只要你需要,随时随地拿起B612记录那一刻!
从自拍到吃货,再到美景,只要你敢拍,我就敢把气氛给你up起来!
五、下厨房
下厨房是一款手机菜谱,自己做饭菜是一件很不错的事情,天天在外面吃容易把口味变复杂。这个手机端可以提供很多的菜式给你参照,喜欢美食的朋友可不要错过。
主要功能:
1、时令流行:根据不同节气,告诉你应该吃什么,三餐不重样;
2、榜单推荐:进来看看被两万多人做过的一道菜谱是什么?
3、人气社区:你尝试发布一道菜,会获得最真实的厨友点赞,交流心得提升厨艺;
4、活动奖品:定期与品牌联合发布线上和线下活动征集令,赢奖品,交朋友;
5、购买食材:联合达人推荐,帮你挑选最有品质的食材和厨具,瞬间成为身边人仰慕的美食专家。
六、邦富法务
邦富法务APP是一款以共享模式向企业及个人提供基础法律服务的互联网平台应用,提供线上法律咨询、案件办理进度查询、法律文书编写、线下预约律师面谈等多样化的法律服务,以“让每一个企业及个人都拥有自己的法律顾问”为使命,致力于为个人和企业提供专业的法律服务。
主要功能:
1、免费咨询:只要注册用户,即可享受终身免费线上咨询。
2、律师说法:内容分为劳动人事、企业管理、公司股权、合同相关、知识产权,房产相关、婚姻继承等方式,由专业律师对常见法律问题进行免费解答。可以看文章,公交上可以听录音,在家闲睱时可以看视频,多种阅读方式提供选择。
3、线下咨询:可以预约专职律师线下咨询,面对面解决法律问题。
4、法务商城:提供全面专业的合同编审服务,在线支付,线上完成,价格便宜,最低只要188元一份。包括股权合同、租赁合同、用工管理、借款合同、婚姻继承、工程管理、合作经营、还有起诉状、上诉状、刑事辩护词、管辖权异议书等等法律文书的代书服务。
5、法务套餐:预付2000元一年,即可获得当年度免费线下咨询,所有非特价商品一律8.8折,预存满一年余额可以提现,毫无压力,消费有折扣,不消费就白赚一年线下咨询服务。
6、企业家论坛:提供企业家交流的平台,可以发布与讨论企业经营管理的困惑或想法,可以发布产品供销信息、股权转让信息、公司收购信息、商标专利出让信息等。
7、会员现金红包:成为会员,把推荐码共享好友,邀请好友注册邦富法务的,好友消费即可以获得每笔不高于100元的可提现的现金红包。
七、有道词典
有道词典支持中文、英语、日语、韩语、法语、德语、西班牙语、葡萄牙语、俄语、藏语等多语种翻译。在线翻译、离线翻译、拍照翻译、语音翻译更顺畅。权威词典:完整收录《朗文当代高级英语辞典》、《韦氏大学英语词典》、《柯林斯COBUILD高级英汉双解词典》及《21世纪大英汉词典》等权威翻译词典,海量英汉、汉英词汇和例句,满足学习、翻译需求。
功能介绍:
1、热词翻译:囊括中文、英语、日语等互联网热词翻译。
2、拍照翻译:“摄像头查词”功能,拍摄英语即翻译成中文,无需输入也能查词翻译的词典。
3、语音翻译:即说即译,语音翻译让翻译更简单。
4、日语词典:海量中文日语双语词汇、例句,支持日语查词、日语翻译、日语发音、日语手写输入、日语罗马音检索等,不会日语、没有日语输入法也能查日语单词,完成日语学习、日语翻译。还有日语入门、日语口语等日语学习课程。
5、汉语词典:支持汉语拼音、手写、语音输入,中文读音、中文生僻字轻松查。
6、离线翻译:英语、日语、韩语、法语等9种语言的离线翻译词库,没有网络也能查词和翻译。
7、地道发音:支持英语、日语等的全球和本地发音。
8、发现频道:词典单词本、背单词、人工翻译等学习内容,搞定英语、日语等语言的翻译和学习。
八、航旅纵横
航旅纵横app来自中国国资委旗下的一款全球航班信息查询、机票订购等强大功能的商务必备应用,航旅纵横app提供行程管理、机票搜索、航班动态、机场信息、地图导航等功能,航旅纵横App是乘机、接机、旅游、旅行相关人士的必备。
功能介绍:
1、延误猜猜:猜猜出行航班是否延误,延误就有权益拿;
2、兑换商城:航班延误,航旅买单;延误权益等你来领;
3、出票提醒:任何渠道购买都会发送提醒,行程最先知晓;
4、票验真:机票真假一看便知,保障您的出行权利;
5、行李限额:全球航空公司相关航线的免费托运行李信息以及收费信息;
6、手机值机:提供国内、国际航线在线值机,随时随地,轻松愉快;
7、航班动态:航班动态、登机口信息等第一时间让您知晓,航班晚点即使知,官方数据任您查;
8、全程提示:提供机票详情、出发时间、机场航站楼、航班动态、登机口信息、目的地天气、机场地图导航、机场巴士线路等重要信息;
9、行程记录:全渠道行程一键自动提取的软件,无需添加,历史飞行记录自动导入,统计其实很简单;
九、飞常准
飞常准app这是一款可以精准查询国内所有航班信实时息的旅行出游应用飞常准App,飞常准app让网友们提前了解各路航班的实时信息,飞常准app获得航班的起飞、到达、延误、取消、返航、备降信息。
功能介绍:
1、预估起飞时间:精准预估航班起飞时间,便于您提前知晓航班最新动态,做好出行规划,让旅途更舒心。
2、延误分析:提供最专业的延误分析,深度剖析航班延误原因。
3、手机值机:提供国内、国际航线网上值机服务,让您提前选择心仪的座位。
4、为亲友关注:您的亲友乘机或接机的时候,他即使没有安装飞常准,你也可以通过短信的方式把航班动态分享给他,而且短信费用是由飞常准来买单的哦。
5、行程记录:航班信息自动导入,贴心管理您国内、国际的飞行记录,随时查看年度排名,与飞友一较高下。
6、机票购买:客户端直连携程机票,服务有保障。
7、出行服务:提供酒店预订和专车接送机服务,一款APP满足您所有出行需求,让旅途更省心。
8、覆盖全球航班:每天更新全球超过98万个航班,每秒钟更新近100个航班,提供权威、准确、及时的全球航班信息。
十、Keep
Keep是一款移动健身指导应用,Keep可以随时随地锻炼,每日记录你的训练进程,针对不同的人制定不同的健身减肥计划,通过Keep和好友对比每天的变化过程,Keep真是非常的棒的一款健身减肥应用,胖子们该行动了。
功能介绍:
1、热门课程:
HIIT燃脂
腹肌撕裂者
人鱼线雕刻
生理期舒缓
7分钟晨间操
2、种健身训练,供你选择
训练计划针对不同人群、各种器械和健身目标组合编排,适用广泛的健身场景。
3、真人同步训练,记录进度
全程语音督导,自动同步进度,无需自己背动作,记组数。
4、分享健身成果,一起进步
图片分享,社区互动,结识同样热爱运动的朋友,让坚持健身不再孤独。
相关推荐:
小米MIX Fold 2推送MIUI 14稳定版:系统大精简、支持光子引擎
怎么解决Win7系统卸载驱动后重启电脑会自动安装驱动的问题?
弘扬文化 规范书写 “阿尔法蛋AI练字笔”独家冠名这项赛事决赛!
Win7 64位旗舰版系统无法注册32位dm.dll文件如何解决?
声明:《微软智能语音大升级:方言念古诗无压力》一文由排行榜大全(佚名 )网友供稿,版权归原作者本人所有,转载请注明出处。如果您对文章有异议,可在反馈入口提交处理!