记录在linux上使用科大讯飞的语音识别的全过程

2月前作者：凹凸曼107（粤嵌--帖工）分类：Toy博客阅读(14) 违法举报

这篇具有很好参考价值的文章主要介绍了记录在linux上使用科大讯飞的语音识别的全过程。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、科大讯飞官网

1.网址讯飞开放平台-以语音交互为核心的人工智能开放平台 (xfyun.cn)。

2.登录上述网站。

3.点击控制台，创建应用。

4.再在网页中找到语音听写功能，就是本次需要使用到的语音转文字功能，有很多入口可以进入，进入后请自行查看相关介绍，有助于后面的程序开发，入口其位置如图1.1所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.1 语音听写

5.将网页拉到下面的开发者资源，将Linux的SDK文档打开，本次实验的相关步骤根据该文档进行，文档入口如图1.2所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.2 Linux的文档入口

6.下载Linux的SDK资源，找到SDK下载入口，如图1.2所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.3 SDK下载入口

7.进入页面口应用选择已经创建好的应用，平台选择Linux，ai能力选择语音听写，点击下载。如图1.4所示。

科大讯飞语音识别csdn,语音识别,人工智能图1.4 下载SDK

二、SDK包的处理

1.其处理过程根据上述的SDK文档进行，具体操作如下：

（1）、新建目录Demo，将SDK中bin,include,libs文件夹复制到新建工程“Demo”文件夹下，如图2.1创建demo文件夹，并复制文件。

科大讯飞语音识别csdn,语音识别,人工智能图2.1 demo文件夹

（2）、将sample文件夹的麦克风输入语音识别的文件拷贝到demo,sample中文件分别对应不同的ai能力。如图2.2所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.2 移动源码文件夹

（3）、打开文件夹iat_online_record_sample中的Makefile文件，修改相关路径。如图2.3所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.3 修改Makefile

（4）、打开文件夹iat_online_record_sample中的64bit_make.sh文件，修改相关路径。如图2.3所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.3 修改sh脚本

2、在测试之前，先检查自己的麦克风，以及虚拟机Linux的联网状态。

麦克风测试，可以声音输入，如图2.4所示。

科大讯飞语音识别csdn,语音识别,人工智能

图2.4 麦克风测试

虚拟机网络适配器选择NAT，联网测试，ping通百度，如图2.5所示。科大讯飞语音识别csdn,语音识别,人工智能图2.5 联网测试

3、在虚拟机中编译文件，并执行，详情如图2.6所示。

科大讯飞语音识别csdn,语音识别,人工智能图2.6 demo运行结果

三、温馨提示

1.麦克风的采样率要符合科大讯飞要求（官方文档：sdk目前支持的格式是 pcm 和 wav 格式、音频采样率要是 16k 或者 8k、采样精度16 位、单声道音频），本次测试电脑麦克风和外接麦克风都好使，配置及检测如图3.1所示。

科大讯飞语音识别csdn,语音识别,人工智能图3.1 麦克风配置及检测

2.程序执行时，看麦克风是否被当前的虚拟机占用（才是对的），如果被别的进程占用，测试会失败（可能会出现-77的错误），可以重启电脑解决，或和关闭对应进程。

科大讯飞语音识别csdn,语音识别,人工智能

3.语音文字并不是15秒后一次性转换，而是停止语音输入后，立马输出，可以多次输入与转换。文章来源地址https://www.toymoban.com/news/detail-850472.html

到了这里，关于记录在linux上使用科大讯飞的语音识别的全过程的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

科大讯飞语音离线命令识别

准备工作注册讯飞账号，做相关的认证，只有认证通过才能下载部分免费的资源。官网地址：https://console.xfyun.cn/ 创建我的应用后再在离线命令识别操作前先查看一下这个官方文档Android 语音识别(Recognizer) | 讯飞开放平台文档中心 (xfyun.cn) 1、必要文件包复制到自己的项目目录

2023年04月08日
浏览(20)
科大讯飞语音合成Java springboot集成

科大讯飞语音合成文本转语音一、引入依赖：二、下载响应的sdk，我这里是下载的java win版本的sdk SDK下载 - 科大讯飞api接口 - 讯飞开放平台三、具体代码：从下载的依赖里面找到对应文件，给代码里面替换成你的绝对路径，运行即可备注：这个地方需要你自己的账号下载

2024年02月15日
浏览(17)
vue 利用科大讯飞实现实时语音转写

1：新建js文件，该文件在科大讯飞api的demo种可以找到 2: 引入第一个文件在vue页面中 3：如果在引入的过程中有些关于worker的报错，可以参考以下方法在vue.config.js中加入

2024年02月12日
浏览(14)
技术解读 | 科大讯飞语音技术最新进展之二：语音识别与语音合成

这一篇内容将围绕语音识别与合成方向，继续为大家带来相关技术解析。 “风物长宜放眼量”。面向人机交互更加自然流畅的未来，智能语音技术进展如何？该走向何方？以下内容根据讯飞研究院杰出科学家潘嘉在NCMMSC 2022上的主题演讲《科大讯飞语音技术前沿进展》整理。

2024年02月07日
浏览(17)
GEC6818科大讯飞离线语音识别

在下载SDK时需要注意选择Linux的版本！！在官网下载离线语音的包，解压后可以得到下面的一些文件夹：解压后你需要知道自己命令放在下面的文件夹中关于Make file文件：关于asr_offline_sample.c文件： asr_offline_sample.c 文件是我们更改为自己的逻辑的文件，但是也不需要都了解

2024年01月17日
浏览(14)
微信小程序调用科大讯飞在线合成语音接口（文字转语音）

科大讯飞在线文档 https://www.xfyun.cn/doc/tts/online_tts/API.html 科大讯飞调用接口地址 https://blog.csdn.net/jinxi1112/article/details/122835386 微信小程序base64转ArrayBuffer替代方案 https://www.homedt.net/43939.html 注意点调用函数参考大佬的实例这里说一下注意的点微信小程序不支持在线的 base64

2024年02月10日
浏览(15)
C#调用科大讯飞离线语音合成实现文本转语音

文本转语音(Text To Speech)，简称TTS，在很多业务场景会用到，比如广播大厅，人机互动等。C#要实现TTS有不少选择，比如调用System.Speech，此处就不细说了，下面主要介绍一下C#调用科大讯飞的离线语音合成SDK来实现文本转语音。地址：[https://www.xfyun.cn/service/offline_tts] 一、创建

2024年02月12日
浏览(10)
UE4如何接入科大讯飞的语音识别

本文用的是UE4 4.27测试安卓版测试链接：链接：https://pan.baidu.com/s/1CsdJecfyMTdxNd6XfSECQQ 提取码：m122 B站视频连接：https://space.bilibili.com/449549424?spm_id_from=333.1007.0.0 GitHub地址：https://github.com/zhangmei126/XunFei 第一步新建一个VS的UE4 4.27项目工程（注意是UE4 4.27 VS项目）第二步新建一

2023年04月08日
浏览(14)
【人工智能】科大讯飞语音识别应用开发（第三集）

这次需要对科大讯飞语音识别接口进行语音识别应用开发，前两次都是通过WebAPI调用接口，这次换一下，通过SDK调用接口下面是开发的详细记录过程（基于前两次的基础上）网址：https://www.xfyun.cn/services/voicedictation 不领服务量为500且该包免费（貌似是不同应用都可以免费领

2024年02月13日
浏览(13)
科大讯飞新版AIkit 离线语音听写 Java 版本

前言：科大讯飞的新版离线语音听写，由于官网demo是kt语言开发的，咱也看不懂kt，搜遍了全网也没看到一个java版的新版离线语音demo，现记录下，留给有缘人参考！！！！！毕竟咱在这上面遇到了不少的坑。如果能留言指正，那就更好了。实测一点问题都没一、先把官网

2024年02月22日
浏览(14)