自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 步入“能听会说”的智能世界 ——专访科大讯飞王智国博士

前言:科大讯飞是国内顶尖智能语音与人工智能公司,在人工智能技术产品化方面有着成功的商业实践。王智国先生分享了科大讯飞在技术研发、人才培养方面的最佳实践,但身为人工智能专家的他预测,未来二十年内机器还不会全面超越人类。科大讯飞,这家成立于1999年的高科技公司,在技术产品化方面有着成功的商业实践。它一端依托国内顶尖研究资源,另一端联结着成千上万的产业应用和企业客户,这一独特定位使其技术创新能快速落地...

2016-07-22 14:54:19 1056

原创 基于讯飞"声纹识别"的本地登录的实现

一. 成果展示(以文本密码为例) 二. 具体操作步骤 1. 预备工作 ①导入声纹识别 sdk 并新建一个 andriod 工程。 ②将 IsvDemo 中 libs 目录下的 Msc.jar 和 armeabi 复制到新建的 Android工程的 libs 目录中,如下图所示: 2. 添加用户权限> <!--连接网络权限,用于执行云端语音能力 --> &lt...

2016-07-20 15:14:08 4056 8

原创 扒一扒智能语音交互的开放语义怎么玩?

开放语义平台是讯飞语音云平台的一个子平台,她的作用是为广大开发者提供语义理解的服务,语义理解其实包括了两个方面的功能:语义提取:就是提取出说话人要表达的意思,例如下图:开放语义平台的语义理解服务中的语义提取功能能够从内容为“打电话给张三”的一段语音或者文字中识别出两个关键的信息:operation:“CALL” name:“张三”开发者的客户端收到服务器返回的这两个关键的信息,就可以判断出说...

2016-06-28 09:27:27 683

原创 如何在APP中集成语音听写能力?

以科大讯飞为例。在科大讯飞开放平台众多的语音功能中,语音听写是非常基础的一项能力。它的作用就是把用户说的话识别成对应的文字,比较典型的应用场景就是语音输入法。和命令词识别的区别就是,听写引擎只负责将语音转换成文字,但是他并不去分析该文字是什么意思。就比如语音输入法在你说“我要听音乐”时会乖乖的把这五个字转化出来,但是它并不会悄然的放一首你喜欢的歌。听写分为在线听写和离线听写,目前Android、W...

2016-06-06 08:54:58 587

原创 分享一份科大讯飞智能交互能力大全

闲来无事,收集了一下国内语音技术龙头企业开放技术汇总,让刚刚开始入门的小伙伴快速了解目前科大讯飞开放平台提供的各项服务以及收费情况,各项服务也会有详细介绍的帖子链接。有些版本因为升级,在讯飞开放平台官网描述的有出入,请以官网内容为准。

2016-06-03 10:52:28 1656

原创 人工智能交互集成在线语音合成能力的Tips

在线语音合成就是在联网的场景下将文字转换成声音,实现机器向人的声音交互。这个概念应该是比较好理解的,下面就结合官网的Android在线合成的Demo讲解一下合成的流程以及大家经常遇到的一些问题。到官网SDK下载中心下载在线命令词识别SDK(这里以Android版本为例)后,可以发现压缩包里面的目录结构和听写的非常类似,这里告诉大家一个小秘密:在官网下载Android的这三个选项下载的SDK包是一模...

2016-06-03 09:23:11 435

原创 使用语音SDK开发:如何集成和使用语音库文件?

一、文档概述本文档是开发科大讯飞Windows语音程序的用户指南,提供工程创建、配置、编译、运行等相关信息的说明。其适用的读者为使用语音SDK进行开发的产品设计师、软件工程师,通过阅读本文档,读者可以掌握如何集成和使用语音库文件。二、新建项目1)打开Microsoft Visual Studio 2010,选择文件->新建->新建项目。 2)选择Visual C++ ->W...

2016-03-17 11:26:34 1176

原创 Java语音程序开发用户指南

1 概述本文档是开发科大讯飞Java语音程序的用户指南,定义了语音听写、语音识别、语音合成以及语义理解相关接口的使用说明和体系结构,如图1所示。 科大讯飞语音功能抢先体验: http://www.xfyun.cn/default/online_demo2 预备工作支持Java平台开发的操作系统为:Windows、Linux。由于Windows系统为开发者广泛使用的,这里将在Windows上的安...

2016-03-10 10:39:23 507

原创 Java语音程序开发用户指南

本文档是开发Java语音程序的用户指南,定义了语音听写、语音识别、语音合成以及语义理解相关接口的使用说明和体系结构。

2016-03-10 09:59:36 1029

原创 科大讯飞与IBM组队人工智能蓝蓝CP

3月1日,科大讯飞轮值总裁、研究院院长胡郁与IBM大中华区董事长陈黎明在北京“IBM论坛”上联合宣布双方将在人工智能领域展开合作。在技术方面,双方将致力于推动在认知计算算法、云平台架构等层面合作;在业务方面,推动医疗、教育和智慧城市等领域的合作发展契机。IBM论坛”是IBM中国最具指标性和影响力的活动。今年以“迎接认知时代, IBM与您智胜未来”为主题的论坛上,科大讯飞轮值总裁、讯飞研究院院长胡郁...

2016-03-09 10:58:18 551

原创 人工智能技术的黄金时代,真的来了吗?

“技术进步的黄金时代”——微软全球资深副总裁Peter Lee这样形容我们现在所处的时代。人工智能的发展在人类研究史上先后沉沦了四次,随着大数据、云计算等技术上的突破,越来越多的人相信人类这次人工智能的发展和研究,使得“奇点”临近了。前天,科大讯飞董事长刘庆峰做客央视《对话》栏目,与国内外众多的科技界大腕进行一场关于“机器好过人”的思考与讨论。 上演了机器人和人类的三轮巅峰对决——高级速录师...

2016-03-08 17:24:08 191

原创 估值10亿美元的网红机器人那些事儿

2月22日,在除夕夜中央电视台春节联欢晚会上大秀舞技的Alpha(阿尔法)机器人再次亮相央视。正月十五元宵晚会上Alpha机器人以”小红”、”小 蓝”的角色,和央视名嘴同台主持,完成了花海、花船、闹元宵、猜灯谜、舞狮子、舞麒麟等元宵晚会节目的串场,为全国观众带来了生动别致的表演。 Alpha机器人由深圳优必选科技有限公司制造,通过集成讯飞开放平台机器人解决方案,实现了机器感知和高级人机交...

2016-03-03 15:06:23 354

原创 业界首个多生物特征融合认证方案

【跟着小飞玩语音】年末岁初,是各类犯罪案件的高发时段,而其中不法分子通过倒卖、盗取他人身份信息后,利用身份认证漏洞可办理银行卡、电话卡,进而从事各种违法犯罪活动的案件近来尤为常见。从前不久微信H5链接盗取支付宝存款的谣言散播中可见广大用户对身份安全认证,尤其是金融领域的安全认证的一贯担忧。小飞得到消息称:讯飞开放平台刚刚上线多生物特征融合认证方案,免费向业界开发者开放,“声纹+人脸”验证护航全民信...

2016-01-23 16:18:54 536

原创 讯飞开放平台上线业界首个多生物特征融合认证方案

【跟着小飞玩语音】年末岁初,是各类犯罪案件的高发时段,而其中不法分子通过倒卖、盗取他人身份信息后,利用身份认证漏洞可办理银行卡、电话卡,进而从事各种违法犯罪活动的案件近来尤为常见。从前不久微信H5链接盗取支付宝存款的谣言散播中可见广大用户对身份安全认证,尤其是金融领域的安全认证的一贯担忧。小飞得到消息称:讯飞开放平台刚刚上线多生物特征融合认证方案,免费向业界开发者开放,“声纹+人脸”验证护航全民信...

2016-01-23 16:13:57 250

原创 讯飞开放平台上线业界首个多生物特征融合认证方案

【跟着小飞玩语音】年末岁初,是各类犯罪案件的高发时段,而其中不法分子通过倒卖、盗取他人身份信息后,利用身份认证漏洞可办理银行卡、电话卡,进而从事各种违法犯罪活动的案件近来尤为常见。从前不久微信H5链接盗取支付宝存款的谣言散播中可见广大用户对身份安全认证,尤其是金融领域的安全认证的一贯担忧。小飞得到消息称:讯飞开放平台刚刚上线多生物特征融合认证方案,免费向业界开发者开放,“声纹+人脸”验证护航全民信...

2016-01-23 15:51:23 173

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除