分享地址:https://edu.csdn.net/huiyiCourse/detail/804
时长:67min
时间:2018.06.21 20:00 - 21:00
笔记:
上下文理解:
1、补全与指代消解
2、对话主题式补全
3、利用主题作上下文对话控制
竹间智能现已标注200w张照片的情绪判断,每张3个人标注,意见不一致的由心理学家判断
多模态情绪识别:人脸表情、语音情绪、文字情绪,三者打分
深度学习模型,扔进去,基于大量数据标注,算出一个情绪总分数
知识库范围外的部分,30-50%的回答正确率。
deep learning, machine learning, language model, rule base关键词,都无法解决全部的问题
比较好的是混搭的模式,有好几种模型,同时计算
深度学习打开第一层,置信程度超过阈值就出答案。如果没有,就下一层用词向量句向量。再没有就关键词。再没有就回到深度学习,把阈值从96%降低到70%。如果还没有,那就是没有答案了。
知识图谱需要多大?
金融领域,12-18w条的数据量就够了。
聊天领域,加起来要800-1200万。
做搜索引擎的大概有8亿到20亿的数据量。
一语双关的问题,现在都解决不了。目前的NLP还做不到这个地步。
需要有足够的社会知识才能理解。“以前我喜欢一个人,现在我喜欢一个人。”
对机器人编程怎么看?觉得现在机器人还没有创造力,没有看到什么好的产品。
电视场景下,语义分类下来只有60-100个意图。
这种场景下语音识别不准确时,可以做模糊匹配去提升整体效果。
聊天的场景下,语音识别不准确的话,效果要提升很难。
对大学生的建议?
TensorFlow+代码可以github下载,可以做demo
但是要去解决一个真实的问题,解决到什么程度是人类可以用的,知道人工智能实际的技术边界
什么是花哨的东西,什么是真实可以用的
人工智能最终是要帮助人,帮助各个行业
机器人能否思考?可能还要很遥远。现在都还只是一大堆的规则。
TensorFlow在文本领域还不错。图像可能caffe更好。
不同的场景会有不同的模型的选择。
NLP的复杂度,不是DL能够解决的。至少DeepLearning是没有希望的,看以后有没有新的技术出来。
人工智能火的程度超过了它现在的实力。新闻90%都是假的,辨别看是否能够给出测试。Duplex是现场视频,暂不可测试。
作者:团子同学
链接:https://www.jianshu.com/p/bf2188b3f087
共同学习,写下你的评论
评论加载中...
作者其他优质文章