您的位置:首页 > 活动

台大李宏毅:生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

时间:2019-10-01

台湾李洪义:生成的对抗网络GAN在语音自然语言处理中的应用|共247页PPT昨天我要分享新智慧元 [新智慧指南] InterSpeech是语音领域的顶级会议9月15日至9月20日,奥地利国立台湾大学李洪义教授在奥地利格拉茨市发表了题为“生成对抗网络及其在语音处理和自然教学处理中的应用”的报告。主要内容和共享报告PPT。对抗网络(GAN)的生成是训练模型的新思路,生成器和鉴别器相互竞争以提高生成质量。最近,GAN在图像生成方面取得了惊人的成绩,并在此基础上开发了许多新的思想,技术和应用。尽管只有少数成功的案例,但是GAN在克服传统方法的局限性方面在文本和语音领域具有巨大的潜力。

内容说明

本教程分为三个部分。在第一部分中,我们将介绍基于网络的生成(GAN),并提供对该技术的全面介绍。在第二部分中,我们将专注于GAN在语音信号处理中的应用,包括语音增强,语音转换,语音合成以及说话人识别和唇读中的领域对抗训练。在第三部分中,我们将描述GAN生成句子的主要挑战并回顾处理它们的方法。同时,我们将提出使用GAN而不进行数据配对的文本样式转换,机器翻译和摘要汇总的算法。讲者简介李洪义教授分别于2010年和2012年在国立台湾大学获得硕士学位和博士学位。 2012年9月至2013年8月,他在中国科学院信息技术创新研究中心担任博士后。从2013年9月到2014年7月,他是麻省理工学院计算机科学与人工智能实验室(CSAIL)语言系统小组的客座科学家。他目前是国立台湾大学电气工程系的助理教授,并在大学计算机科学与信息工程系任职。他的研究专注于机器学习(尤其是深度学习),口头理解和语音识别。曹瑜副教授分别于1999年和2001年在国立台湾大学获得电气工程学士学位和硕士学位。他获得了博士学位。曹博士于2008年获得佐治亚理工学院电气与计算机工程专业的博士学位。2009年至2011年,曹博士是日本国立信息与通信技术研究所(NICT)的研究员,从事自动语音研究和产品开发,多语言语音到语音翻译。目前,他是台湾台北中央研究院信息技术创新研究中心(CITI)的副研究员。他于2017年获得了《中央研究院职业发展奖》。曹博士的研究兴趣包括语音和说话者识别,声学和语言建模,音频编码和生物信号处理。目录GAN的基本思想和一些基本理论知识-GAN的三类-GAN的基本理论-一些有用的技巧-如何评估GAN与强化学习之间的关系

GAN在语音中的应用

-语音信号生成-语音信号识别-自然语言处理中的GAN结论-GAN序列生成

-原始链接的无监督条件序列生成:

预览的一部分:GAN GAN的三个基本概念类别

GAN自2014年以来取得了长足进步

条件GAN,可以按图像生成图像,生成图像,生成图像等

收集报告投诉

[New智元导读] InterSpeech是语音处理领域的顶级会议。它于9月15日至9月20日在奥地利格拉茨举行。国立台湾大学李洪义老师作了题为“创生”的演讲。对抗网络及其在语音处理和自然租赁处理报告中的应用,该报告组织了报告的主要内容并共享了报告PPT。对抗网络(GAN)的生成是训练模型的新思路,生成器和鉴别器相互竞争以提高生成质量。最近,GAN在图像生成方面取得了惊人的成绩,并在此基础上开发了许多新的思想,技术和应用。尽管只有少数成功的案例,但是GAN在克服传统方法的局限性方面在文本和语音领域具有巨大的潜力。

内容说明

本教程分为三个部分。在第一部分中,我们将介绍基于网络的生成(GAN),并提供对该技术的全面介绍。在第二部分中,我们将专注于GAN在语音信号处理中的应用,包括语音增强,语音转换,语音合成以及说话人识别和唇读中的领域对抗训练。在第三部分中,我们将描述GAN生成句子的主要挑战并回顾处理它们的方法。同时,我们将提出使用GAN而不进行数据配对的文本样式转换,机器翻译和摘要汇总的算法。讲者简介李洪义教授分别于2010年和2012年在国立台湾大学获得硕士学位和博士学位。 2012年9月至2013年8月,他在中国科学院信息技术创新研究中心担任博士后。从2013年9月到2014年7月,他是麻省理工学院计算机科学与人工智能实验室(CSAIL)语言系统小组的客座科学家。现任国立台湾大学电气工程系助理教授,并任职于该大学计算机科学与信息工程系。他的研究重点是机器学习(尤其是深度学习),口语理解和语音识别。曹昱副研究员分别于1999年和2001年获得台湾大学电子工程学士学位和硕士学位。他于2008年获得佐治亚理工学院电气与计算机工程博士学位. 2009至2011年,曹博士是日本国家信息与通信技术研究所(NICT)的研究员,从事自动语音研究和产品开发,识别多语言语音到语音翻译。目前,他是台湾台北中央研究院信息技术创新研究中心(CITI)的副研究员。他于2017年获得了中央研究院职业发展奖。曹博士的研究兴趣包括语音和说话人识别,声学和语言建模,音频编码和生物信号处理。目录GAN的基本思想及一些基础的理论知识- GAN的三种类别- GAN的基本理论- 一些有用的技巧- 如何评估GAN- 与强化学习的关系

GAN在语音方面的应用

- 语音信号生成- 语音信号识别- 结论GAN在自然语言处理方面的应用- GAN序列生成

- 无监督条件序列生成原文链接:

附部分PDF预览:GAN的三个类别 GAN的基本思想

GAN从2014年发展至今,有了很大进步

条件GAN中,可由图片生成图片,声音生成图片,图片生成标签等应用

  • 友情链接:
  • bogou博狗 版权所有© www.shangmao5.com 技术支持:bogou博狗| 网站地图