人工智能--语音入门 _学习笔记

首页免费课人工智能--语音入门笔记

人工智能--语音入门

                
                Markov_Xi
            算法工程师

                    查看讲师更多课程 
                    Markov_Xi讲师的其他课程
                
玩转机器学习之神经网络，系统入门算法工程师
实战·初级·461

                                                                                                                                    ￥389.00
                                            
                难度初级
            
                时长 4小时35分
            
                学习人数
            
综合评分10.00
                            5人评价
                        查看评价
                                10.0
                                内容实用
                            
                                10.0
                                简洁易懂
                            
                                10.0
                                逻辑清晰

最热最新

慕哥9020169 00:34

1111

查看全部

0 采集收起来源：课程概述
2021-06-15
慕用5255593 00:08

啊

查看全部

0 采集收起来源：本章介绍及知识点梳理
2021-06-09
Tracy小前端 10:55

语音技术范围及技术框架特点-技术范围
语音识别：语音到文本
命令词识别：关键词检测
语音合成：文本到语音
声纹识别：声音生物信息认证
声音时间检测：呻吟场景分类，稀有事件检测，现实场景中的声学事件检测
语音前端（降噪，增强，定位，回声消除。。。）
ASR（语音识别）：语音转录：实时转录（输入法），文件转录（病例，庭审记录）
KWS（关键词检测）：siri，小爱同学，车载命令词
TTS（语音合成）：TalkBot，有声书，泛娱乐
VPR（声纹识别）：司法认证，生物信息认证
DCASE（事件检测）：看护，咳嗽
FrontEnd（语音前端）：直播降噪，鸡尾酒会问题（盲源分离）

查看全部

1 采集收起来源：语音技术范围及技术框架特点
2021-06-09
Tracy小前端 13:50
语音基础知识介绍-发声机理
人的发声范围： 100 - 10kHz
男性的基音频率（Fo）： 50 - 250 Hz
女性基音频率： 100 - 500 Hz

语音基础知识介绍-听觉原理
外耳：声源定位（DOA）、放大器（AGC）
中耳：保护耳蜗
内耳：梅尔滤波器组
人声听声范围： 20 - 20kHz

语音基础知识介绍-音频示例及参数
1. 格式：无损/有损
2. 无损： WAV/PCM/FLAC
3. 有损： MP3/ogg/AAC
4. 幅职：多种表示方式
5. 采样值： short（-32768～ + 32767）
6. 标准化值：采样值的归一化
分贝： 10log[(x/xo)^2] = 20log|x/xo|
长度：音频持续时间，一般单位是s，精确到ms
采样率：每秒钟采样的个数8k，16k，22.05k，44.1k
通道：单声道（mono），多声道（混音），立体声（stereo）
位宽：分辨率
16bits：幅值的范围用两个字节的short表示（-32768～32767）
32bits：幅值的范围用四个字节的long short表示（-65537～65536）
查看全部

0 采集收起来源：语音基本知识介绍
2021-06-09
Tracy小前端 03:13
语音相关基础知识：
1. 语音基本知识介绍
2. 语音技术范围及技术框架特点
3. 语音技术历史演进
明确语音的基本概念技术范围和现在一些应用，并确定接下来我们选择的框架
查看全部

0 采集收起来源：本章介绍及知识点梳理
2021-06-09
Tracy小前端 00:10

语音技术现状：
语音社交
极度稀缺
智能家居

课程的主要目的：
语音基本概念、处理方法
掌握语音特征工程
获得语音入门相关经验

课程概述：
1. 基础知识讲解：语音的概念；语音的技术栈；框架及对比选择；语音技术的当前现状
2. 特征工程：语音特征；语音特征抽取；相关神经网络组件
3. 项目实战：数据处理；模型搭建；模型部署

技能储备：
熟悉Python基础语法
了解Pytorch基础用法
了解深度学习基础

查看全部

0 采集收起来源：课程概述
2021-06-09
慕用5255593

第一次学习

查看全部

0 采集收起来源：课程概述
2021-06-09
宝慕林8513509 00:59

这是我的第一次笔记

查看全部

0 采集收起来源：课程概述
2021-06-15
weixin_慕容0506667 13:27

11111111111111111
22222222222222222
33333333333333333333

查看全部

0 采集收起来源：mel特征提取
2021-06-05
WE_Xing 00:29

发声机理。

查看全部

0 采集收起来源：语音基本知识介绍
2021-05-23
qq_小破孩儿_2

t

查看全部

0 采集收起来源：本章介绍及知识点梳理
2021-05-16
WE_Xing 01:34

语音相关基础知识

查看全部

0 采集收起来源：本章介绍及知识点梳理
2021-05-11
WE_Xing 03:29

人工智能--语音

查看全部

2 采集收起来源：课程概述
2021-05-09