大发快3怎么玩深度 | 邓力:从语音 AI 到金融 AI,挑战有哪些?

  • 时间:
  • 浏览:29
  • 来源:彩神8app官方-彩神大发快三网站

雷锋网 AI 科技评论按:7 月 12 日-7 月 14 日,2019 第四届全球人工智能与机器人峰会(CCF-GAIR 2019)于深圳正式召开。峰会由中国计算机研大发快3怎么玩究会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器研究会术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流公司商务合作 平台。

7 月 12 日,加拿大工程院院士、Citadel 首席人工智能官、前微软 AI 首席科学家、IEEE Fellow 邓力教授为「人工智能前沿专场」带来了《AI Models:From Speech and Language to Financial Markets》的大会报告。以下为邓力教授所做的大会报告全文。

本次大发快3怎么玩我演讲的主题肯能跟一点演讲者不太一样,但我相信其中还是有一点共性值得当当我们 探讨。肯能人工智能中含了也不我领域,其中就包括刚才 Hackman 教授提到的重要主题,即人工智能和教育以及人工智能如可在教育领域实现更多的应用,我认为这人类的落地应用绝对是人工智能领域未来发展的重点之一。

今天我可不让能重点大发快3怎么玩分享的内容包括有5个 每种:第一每种是人工智能语音语言领域的应用,比如说语音识别和语言防止;第二每种是过渡到人工智能在金融领域的一点前沿进展和挑战。

1、语音历史

首先,我先介绍一下目前效率学习(即现代人工智能技术)在一点领域中现有的成功应用。

近年来,效率学习的发展不为什么在么在快,类事语音识别,自然语言防止、机器人、计算机视觉等领域取得了非常大的进展。共同我也认为,哪几种领域在接下来的几年时间内还将实现更大的发展。

另外,我认为一点当当我们 比较关注也不我我还那么通过媒体上都看的取得不为什么在么在大进展的行业,如农业、教育、金融以及零售等,也具有非常大的潜能。在这里,我会重点介绍人工智能在金融领域的可行性。

在此完后 ,我先问当当我们 有5个 问題,当当我们 着实 人工智能在推动金融市场(包括商业模式和交易)的转型上有多大的潜力?为了让当当我们 更好地回答这人问題,当当我们 先来回顾一下合适十年前处在的一件事。

2009 年 12 月 12 日的 NIPS 上,我负责主办了有5个 workshop,当时我邀请了微软和多伦多大学的同事们参加,与俞栋、Geoffrey Hinton 共同探讨了效率学习未来的发展前景,并通过调查研究难能可贵同的大发快3怎么玩维度来分大发快3怎么玩析效率学习和神经网络在语音语言领域未来几年的发展态势。

完后 ,当当我们 微软在语音识别和翻译领域投入了也不我人力,希望通过效率学习、神经网络来实现机器语音识别和翻译。经过微软两年高效率的研究,2012 年,效率学习在语音识别领域取得了较大的进展,这也是效率神经网络研究在语音识别领域上的一次早期的大规模尝试,也是效率学习第一次在工业界取得成功的案例。

2012 年,正好就在中国天津,我当时所在的微软研究院尝试使用语音识别和翻译技术来对演讲进行英到中的口语自动翻译。这能只能说是语音识别领域的有5个 里程碑式的时刻。在这前后,科大讯飞、百度等也不我公司都加入到这人领域的研究中来,研发基于效率学习的新一代语音识别和翻译技术。

而更早完后 ,合适从 1993 年开始 ,我和也不我同行者就开始 研究即时语音识别技术。到 2000 年,即时语音识别的错误率非常明显得在不断下降,但当时基于隐马尔科夫模型的语音识别技术在 2000 年至 2009 年期间老是处在瓶颈停滞期,而在 2009 年引入效率学习完后 开始 有了新的进展:2009 年至 2012 年又有了第二轮更明显的错误率的下降。1993 年到 2000 年、2009 年至 2012 年是这项技术的有5个 标志性的阶段。

十年完后 的今天,当当我们 肯能认为这人切都发展得自然而然,对人工智能领域的所有概念都习以为常,但在那个完后 ,效率学习的应用是非常罕见的。

2、从语音到金融

上图是用于语音识别的常见效率神经网络架构,获得了很大的成功,当当我们 同样也希望让这项效率学习技术在金融领域发挥同样的作用。

上图是常见的语音识别系统的基本组成模块。当当我们 将麦克风拾取的声音和文本作为数据,通过声学模型、词义模型和语言模型等不同的模块来训练详细的语音识别系统。我展示这人图主要也不我我想给当当我们 看当当我们 最早期的研究最好的依据是为什么在么在样分步训练详细的语音识别系统的,也不我我说在真正的效率神经网络开始 完后 ,当当我们 会使用不同的语音和文本数据来训练哪几种不同的模型模块。

哪几种不同的模型模块的研发过程中往往是相对独立的,即便是微软原本的公司,在早期详细后要独立组建团队去专门负责声学模型和语言模型不同模块的研发。也不我我发展到后期,肯能有了效率神经网络端到端学习的能力,当当我们 就能只能建立综合性的防止方案,将所有不同的声学模型模块和语言模型模块连接起来综合训练。

金融界的从业者应该都知道,目前量化交易的系统也分成一点不同的模块,类事于效率神经网络端到端学习完后 的语音识别系统。现代语音识别从独立研究不同模块的最好的依据转变成一体化模型研发,使得模型的综合性那么高,这应该能够启发研究者们思考如可改善基于相对独立模块的量化交易的金融系统。

在自然语言防止方面,效率学习同样起到了颠覆性的作用。其中就包括机器翻译,关于这人每种,周明博士会在今天下午的演讲中跟当当我们 详细分享。

而效率学习等热门技术的挑战在哪里呢?主要还在于可不让能设计有5个 正确的、合适的架构来落地,包括清楚相应应用领域的机器学习难点,共同也可不让能足够的有标注的数据来训练机器防止问題。前一轮的人工智能技术无法成功防止大型的问題,可不让能通过现在新一轮的人工智能技术来防止。

简单介绍一下效率学习在自然语言防止的有5个 有趣的应用 --- 看图说话。上面这张图像是奥巴马的夫人和她的女儿们以及彭丽媛的合照,人工智能技术能只能通过脸部识别与数据库进行比对来识别当当我们 的身份,也不我我用有5个 自然语言的搞笑的话来描述这张照片的内容。这是人工智能技术应用得非常成功的案例之一。

3、三大独特挑战

作为有5个 非常特殊的领域,金融领域在人工智能技术应用层面所面临的挑战要比我在前面介绍的语音语言领域更大,其中以三大挑战最为典型,包括:

  • 其一是金融数据的噪音非常大,不仅在输入端,更在输出端。在金融市场中,比如说股市处在的几瓶市场数据详细后要非常大的噪声,哪几种数据也不我完后 只能反映真实的股票市场具体情况,甚至噪声后要覆盖掉有用的信息。也不我我可不让能人类分析师或人工智能去对哪几种数据进行提炼,从而获得有价值的信息。也也不我我说,肯能我可不让能基于一点金融机构提供的数据做预测,首先就可不让能排除噪音,而对于语音识别、自然语言防止等领域而言,这人类挑战几乎是不处在的。目前,金融领域还那么相应的成熟期的句子的句子 图片 图片 图片 是什么机制来防止这人问題,也不我可不让能探索各类人工智能技术来防止这人问題,而当当我们 目前也都看了一点前进的方向。

  • 其二是肯能数据共享缺失以及数据和市场的非稳定性所导致 的人工智能建模问題。这人挑战很大程度上是肯能金融领域的竞争社会形态所决定的。金融公司的算法和数据基本上都无法像也不我巨头科技公司那样将也不我算法和数据进行开源分享,也不我竞争激烈的金融领域是无法像自然语言防止等领域那样,要能基于过去的大数据用统计学的最好的依据进行大数据分析,只能对一点在不断变动的波动数据进行分析。共同,激烈的竞争后要让新开发的统计模型和算法渐渐选择选择离开当当我们 的有效性,远快过自然语言防止和语音识别的模型和算法。也不我我,这人在金融领域独有的棘手和难以驾驭的问題同样也可不让能非常特殊的人工智能技术来防止。

  • 其三是异构数据问題,包括非传统金融数据和传统金融数据的整合和综合利用。以华尔街的金融分析师为例,当当我们 难能可贵详细后要使用标准数据。传统的金融数据包括也不我种,其中五种是市场信息,也不我技术分析师都使用一套规则和模板识别来分析股票;另五种叫做基本面数据,即分析师根据公司过去、现在和将来的盈利分析来预测未来的股市变化。当当我们 会基于金融市场的过去数据和公司的基本面数据来看其呈现的动态,从而进行宏观和微观经济学分析。非传统金融数据,也称为另类数据,包括对金融市场有影响的海量文本、卫星图像和语音数据等等。这人数据的多样性也不我我这里讲的异构数据的问題。它对于传统的统计最好的依据和金融数据分析而言,是有5个 巨大的挑战。而有了人工智能赋能后,金融投资领域就要能对异构或非标准金融数据进行更精准的分析。这是肯能效率神经网络能只能很自然地将异构数据整合在共同。

4、如可应用 AI ?

现在,华尔街的也不我金融机构都关注或应用了人工智能技术,其中一点我熟悉的对冲基金也聘用了同我有类事背景的人工智能专家来帮助当当我们 开发相应的人工智能技术。在两年多前,当当我们 (Citadel)就启动了相关的研究项目,而当当我们 的竞争对手如 Two Sigma、DE Shaw、JP Morgan、Goldman Sachs 等也在一年前聘用了人工智能科学家,跟进了相关的工作。它们现在也在人工智能人才上同我的团队竟争。金融机构争相勘实另一方的人工智能技术的这人现状,也间接说明了人工智能技术的应用对于金融投资领域的作用难能可贵。在使用人工智能分析金融市场时,能用到一点比较明显的异构数据。这里我举有5个 例子,详细后要来源自金融学的学术文献。

  • 有5个 例子是新闻社交媒体的文本数据。比如说,当当我们 能只能采用人工智能来分析一点新闻社交媒体对于市场行情的分析和讨论,以了解机构投资者以及散户投资者对于金融市场的情绪。这人点是非常重要的,肯能金融市场实际上中含心理学上的博弈,也也不我我说这是买卖双方在市场上的博弈,由此形成金融市场的走向。也不我我,自然语言防止等技术对于金融分析而言,是非常有意义的。

  • 原本例子是公开演讲或访谈的数据。这人数据对于金融投资分析来说,也是五种有用的异构数据。举个例子,在 Enron 出事的前段时间,当当我们 算不算 能从这家公司 CEO 的某个采访中都看一点欺诈或遮掩的猫腻?当当我们 在访谈中肯能会透露一点微弱的信号,也肯能会故意说假话,也不我我在说假话时的说话最好的依据肯能会跟说真话的完后 不太一样,当时呈现的语音语调、互动表情都要能成为寻找蛛丝马迹的点,也都能只能成为分析金融市场的波动和走向的信息源。投行等机构,也后要在与一点公司的 CEO 打交道和交通的过程中对其进行分析,以获得一点有价值的信息。而这人寻找一点蛛丝马迹来分析问題的过程,实际上是能只能通过人工智能赋能金融市场来完成的。

那么为哪几种原本的一点另类(异构)的数据对于金融市场的研究至关重要,且是独一无二的呢?肯能着实 人工智能的也不我落地老是只会用到单类或至多两类数据:影像数据和文本数据。而对分析金融市场有用的数据则更加繁复、更加多类。一般分析师通过基本面数据来分析上市公司在金融市场、实体经济中的市场表现等,哪几种数据能只能充分展现某家公司目前的财务具体情况、经营具体情况,共同,它能只能同历史市场数据以及图像,文本,甚至和语音数据综合起来应用。而这人将所有数据整合起来的过程,是要能通过人工智能来助力和赋能,整合分散的多类数据,从而挖掘更多真相。

那投行和对冲基金等在使用人工智能技术分析金融市场时还能注意一点哪几种事情,未来能做哪几种呢?

  • 首先,当当我们 要确保数据的可获得性,也也不我我说让更多的人更好地获得一点对当当我们 的研究有帮助的有价值的数据,原本当当我们 才有更大发挥空间。

  • 其次,当当我们 要确保数据不侵犯隐私,控制好金融风险。对冲基金公司着实 拥有非常多的数据,也不我我可不让能更加精准地去筛选合适的数据难能可贵侵犯隐私。

  • 共同,当当我们 可不让能招募到一点具备良好金融素养的又精通人工智能的有价值的人才,共同也可不让能对有潜力的人才进行培训。一般而言,拥有很强金融背景的人肯能不太精通人工智能,所有当当我们 不为什么在么在可不让能招募到既有金融背景又懂人工智能的人才,当当我们 也不我我当当我们 所说的「明星雇员」。

  • 最后,当当我们 也可不让能针对金融领域的数据分析定制算法,从而更好地应对金融领域所面临的独特的挑战。

谢谢当当我们 聆听我的演讲。

演讲开始 后,雷锋网(公众号:雷锋网) AI 科技评论也对邓力教授进行了提问,在提问中问到了当当我们 都比较关注的有5个 问題:一是邓力教授与 Geoffrey Hinton 教授的渊源;二是邓力教授从微软离职进入金融领域后的一点感想。雷锋网 AI 科技评论收集如下:

AI 科技评论:您放下神经网络的研究再到重拾该方向的研究并取得突破性的进展,似乎都与 Geoffrey Hinton 处在着一点联系,您如可评价 Hinton 对您研究生涯的影响?

邓力教授:是的,Hinton 对我的职业生涯帮助很大,主要体现在有5个 方面:

  • 第有5个 是我在他身上都看了信念的力量。Hinton 从神经网络的研究初期,也也不我我当当我们 非常质疑这人最好的依据的完后 ,他始终都坚持神经网络要能防止人工智能问題,老是到现在,我另一方真的非常佩服他。

  • 第5个是思维最好的依据。在跟 Hinton 的公司商务合作 中,他教给了我也不我好的思维最好的依据。

AI 科技评论:在此前媒体对您离职微软的报道中,了解到您曾表示「我着实 现在金融领域肯能非常成熟期的句子的句子 图片 图片 图片 是什么了,能只能我应该 工智能来大显神威。」您进入金融领域两年多,想法算不算 还与当年一样呢?

邓力教授:进入金融领域完后 和完后 的感受是详细不同的。

在进入完后 ,我当时的想法是,我另一方在语音识别及信息和语言防止等领域肯能研究得比较不错的,对于我而言不再具有不为什么在么在大的挑战性,也不我我应该 想换到有5个 更具挑战性的领域去展开研究。当时考虑到金融领域的数据量不为什么在么在丰沛 ,更多的数据就要能我可不让能的研究工作做得更好,而可不让能用到的最基本最好的依据与我完后 用的那一套不让相差太远。当时就着实 到金融领域做研究问題应该不大,也不我我非常具有前景性。

也不我我真正转到金融领域后,我才发现,该领域在应用人工智能方面的挑战性远远要比其它我熟悉的领域大得多,就比如我在演讲中提到的数据的噪声大、由竞争导致 的非稳定性以及异构数据问題,这详细后要非常繁复有趣的。不过当当我们 目前也取得了不少技术成果,要能比较好地防止金融领域的特殊问題。

雷锋网 AI 科技评论报道

雷锋网原创文章,未经授权禁止转载。详情见转载须知。