为了账号安全,请及时绑定邮箱和手机立即绑定

人工智能--语音入门

难度初级
时长 4小时35分
学习人数
综合评分10.00
5人评价 查看评价
10.0 内容实用
10.0 简洁易懂
10.0 逻辑清晰
  • 1111

    查看全部
    0 采集 收起 来源:课程概述

    2021-06-15

  • 查看全部
  • 语音技术范围及技术框架特点-技术范围

    语音识别:语音到文本

    命令词识别:关键词检测

    语音合成:文本到语音

    声纹识别:声音生物信息认证

    声音时间检测:呻吟场景分类,稀有事件检测,现实场景中的声学事件检测

    语音前端(降噪,增强,定位,回声消除。。。)

    ASR(语音识别):语音转录:实时转录(输入法),文件转录(病例,庭审记录)

    KWS(关键词检测):siri,小爱同学,车载命令词

    TTS(语音合成):TalkBot,有声书,泛娱乐

    VPR(声纹识别):司法认证,生物信息认证

    DCASE(事件检测):看护,咳嗽

    FrontEnd(语音前端):直播降噪,鸡尾酒会问题(盲源分离)


    http://img1.sycdn.imooc.com//60c0583f000199fe11960758.jpg

    查看全部
  • 语音基础知识介绍-发声机理

    http://img1.sycdn.imooc.com//60c03a2b000133d606380472.jpg

    人的发声范围: 100 - 10kHz

    男性的基音频率(Fo): 50 - 250 Hz

    女性基音频率: 100 - 500 Hz



    语音基础知识介绍-听觉原理

    http://img1.sycdn.imooc.com//60c03a3a00016b5605880434.jpg

    外耳: 声源定位(DOA)、放大器(AGC)

    中耳:保护耳蜗

    内耳:梅尔滤波器组

    人声听声范围: 20 - 20kHz



    语音基础知识介绍-音频示例及参数

    1. 格式: 无损/有损

    2. 无损: WAV/PCM/FLAC

    3. 有损: MP3/ogg/AAC

    4. 幅职: 多种表示方式

    5. 采样值: short(-32768~ + 32767)

    6. 标准化值:采样值的归一化

    分贝: 10log[(x/xo)^2] = 20log|x/xo|

    长度:音频持续时间,一般单位是s,精确到ms

    采样率:每秒钟采样的个数8k,16k,22.05k,44.1k

    通道: 单声道(mono),多声道(混音),立体声(stereo)

    位宽: 分辨率

    16bits: 幅值的范围用两个字节的short表示(-32768~32767)

    32bits: 幅值的范围用四个字节的long short表示(-65537~65536)

    查看全部
  • 语音相关基础知识:

    1. 语音基本知识介绍

    2. 语音技术范围及技术框架特点

    3. 语音技术历史演进


    明确语音的基本概念技术范围和现在一些应用,并确定接下来我们选择的框架

    http://img1.sycdn.imooc.com//60c038dc00010e9609260696.jpg

    查看全部
  • 语音技术现状:

    语音社交

    极度稀缺

    智能家居


    课程的主要目的:

    语音基本概念、处理方法

    掌握语音特征工程

    获得语音入门相关经验


    课程概述:

    1.  基础知识讲解:  语音的概念;语音的技术栈;框架及对比选择;语音技术的当前现状

    2.  特征工程:   语音特征;语音特征抽取;相关神经网络组件

    3.  项目实战:   数据处理;模型搭建;模型部署


    技能储备:

    熟悉Python基础语法

    了解Pytorch基础用法

    了解深度学习基础

    查看全部
    0 采集 收起 来源:课程概述

    2021-06-09

  • 第一次学习
    查看全部
    0 采集 收起 来源:课程概述

    2021-06-09

  • 这是我的第一次笔记

    查看全部
    0 采集 收起 来源:课程概述

    2021-06-15

  • 11111111111111111

    22222222222222222

    33333333333333333333

    查看全部
    0 采集 收起 来源:mel特征提取

    2021-06-05

  • 发声机理。

    查看全部
  • t
    查看全部
  • 语音相关基础知识

    查看全部
  • 人工智能--语音

    查看全部
    2 采集 收起 来源:课程概述

    2021-05-09

首页上一页12下一页尾页

举报

0/150
提交
取消
课程须知
如果同学们有一定的 python 语法基础,懂一些 pytorch 的基础应用,了解基本的深度学习概念,学习本课将会更加得心应手。
老师告诉你能学到什么?
1、语音的基本原理和基础知识 2、语音的基本代码、软件操作 3、语音特征工程 4、语音相关基本神经网络组件 5、语音算法模型的构建 6、语音项目的开展流程

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!