AI For Everyone 适用于所有人的人工智能课程(含全集所有中文字幕 )

0 / 894

开始时间: 05/29/2021 持续时间: Unknown

课程简介

Andrew Ng (吴恩达) 老师新推的通俗人工智能课程:AI For Everyone(全民AI) ,面向大众进行AI科普。AI不仅适用于工程师,这门非技术性人工智能课程将帮助学习者了解机器学习和深度学习等相关技术,以及将AI应用于自己组织中的问题和机会。 通过这门课程,学习者将会了解当前人工智能可以或者不能做的事情。 最后,学习者将了解AI如何影响社会以及我们将如何应对这种技术变革。

入门难度

❤️

先修课程

课程详情

AI不仅适合工程师。如果您希望您的组织在使用AI方面变得更好,那么这就是告诉所有人(尤其是您的非技术同事)的方法。 在本课程中,您将学习:

  • 通用AI术语背后的含义,包括神经网络,机器学习,深度学习和数据科学 -
  • 人工智能实际上可以做和不能做的事情
  • 如何发现将AI应用于组织中的问题的机会
  • 建立机器学习和数据科学项目的感觉
  • 如何与AI团队合作并在公司中制定AI战略
  • 如何引导有关AI的道德和社会讨论
    尽管本课程主要是非技术课程,但工程师也可以选择本课程来学习AI的业务方面。
    课程时长约6小时,4周完成

课程大纲

If you are a non-technical business leader, “AI for Everyone” will help you understand how to build a sustainable AI strategy. If you are a machine learning engineer or data scientist, this is the course to ask your manager, VP or CEO to take if you want them to understand what you can (and cannot!) do.


Week1 What is AI?

9 个视频(总计 69 分钟)

Week 1 Introduction7分钟
欢迎观看AI for everyone 人工智能正在改变我们工作和生活的方式 这个通俗易懂(不含有专业词汇)的课程会教你 理解人工智能的发展。 无论你是想更深入了解人工智能流行的背后, 或是 你想把人工智能应用到你的生活, 公司,或其他组织中。 这个课程会教你如何达成这些目标。 如果你想了解人工智能是如何影响社会的, 以及你如何驾驭它, 你也会从这个课程中学到这些。 这个星期, 我们将抛开对人工智能的炒作, 让你 对人工智能有更加客观的了解。让我们开始吧。

你可能看过 关于 AI 创造了多少价值的新闻。 根据麦肯锡全球研究所的一项研究 AI 估计会增加 每年 13 万亿美元的 价值 (在2030 年之前)。 尽管 AI 已经在软件行业创造 了大量的价值, 未来人工智能将会在 在软件产业之外创造更多的价值。 在零售、旅游、交通、 汽车、材料、制造等。 我很难想像 有哪一个行业, 在接下来几年里, 人工智能不能对它产生巨大的影响。 我和我的朋友们常常挑战对方说出 某一个行业不会受到AI 巨大的影响。 我最好的例子是美发行业, 因为我们 不知道如何使用人工智能机器人自动美发。 但是, 我曾经在演讲的时候提过这一点 当天观众中有一个朋友 是一位研究机器人的教授, 那天她站了起来, 看着我的眼睛说, "安德鲁, 大多数人的发型, 我不能让机器人剪出他们的发型 ", 但她看着我说 "你的发型, 机器人倒是可以剪出来 ( 嘲笑Andrew教授的发型)。 现实中有很多令人兴奋的, 但也有很多 关于 AI 的不必要的炒作。

其中一个原因是 AI 实际上是两个独立的概念。 几乎所有我们可以看到的人工智能中的进展 都是弱人工智能 (ANI)。 这些都是用 AI 做 一件事, 如一个智能音箱或 自动驾驶或网络搜索或 AI 在农业或工厂中的应用。 这些类型的 AI 只是 单方面的成果。但当你找到合适的技巧, 这可能是非常有价值的。 但是,AI 也包含它的 第二个概念 强人工智能(AGI)。 这就是构建 AI 的目标。 他们可以做任何人类能做的事情, 甚至可能是 超过人类智能的事和其他 任何人类都做不到的事情。 我看到了大量 ANI(弱人工智能)的进步 但是几乎没有 在 AGI (强人工智能)方面的进展。 这两个都是有价值的目标, 不幸的是, ANI的快速发展 (虽然它相当有价值), 导致人们认为 整体人工智能有很大的进步 (这倒是是对的结论)。 但这让人们 错误地认为, AGI 也有很大的进展 这导致一些非理性的恐惧 比如聪明但邪恶的机器人会 随时替代人类。 我想强人工智能是 一个令人兴奋的目标, 值得更多研究人员的工作, 但它仍需要多方面的 技术突破才能实现。 这意味着几十年或 几百年甚至几千年的探索。 正是因为强人工智能时代还离我们相当遥远 我认为没有必要过分担心这件事。

这一周里, 你将了解到 ANI 可以做什么, 以及如何将它们应用到您的问题中。 后面的教程,你将会 看到一些关于弱人工智能的案例研究 这些单一的人工智能可以用来建立 非常有价值的应用, 如 智能音箱和自动驾驶汽车。 在这一周里, 你将了解什么是 AI。 你可能听说过机器学习 下一个视频将教你什么是机器学习。 您还可以了解什么是数据以及什么类型的数据 是有价值的, 以及 什么类型的数据是没有价值。 你知道是什么让 一个公司成为人工智能公司或人工智能优先的公司 你将会开始思考 是否可以有改善 你的公司或其他组织 使用人工智能的能力 本周你将会学到 机器学习能做什么和不能做什么 在我们的社会,报章杂志 以及学术论文 倾向于只讨论 关于机器学习和人工智能成功的案例,我们几乎 从来没有见过任何失败的案例 这是因为失败的案例没有新闻报道的价值 但是为了能让你从现实的角度重新审视 人工智能和机器学习能干什么不能干什么 我认为 让你同时看到成和败的案例至关重要 你可以更准确钱的判断 哪些技术可以用,那些技术不应该尝试 很多最近兴起的对于机器学习的热潮 其实都来自于 深度学习的发展 深度学习又被称为神经网络 在本周最后的两段视频中 你能看到 对于深度学习直观的解释 你能更好的了解它们能做什么 特别是用于一组弱人工智能任务 所以,这就是你 在这周的课程中将学到的 你将明白 人工智能技术能做什么不能做什么。

第二周, 你将学到如何用这些 AI 技术 创造具有价值的项目。 你将对创造 AI 项目有些感觉, 并且,你将学会怎样选择 在技术上可行的项目, 而且它们能对你本人, 你的公司、或其他组织都是有价值的 当你明白建立一个人工智能项目需要什么之后 在第三周你将学习 如何把人工智能技术应用到你的公司 如果你想 使你的公司擅长人工智能 你会看到人工智能转型手册 学习如何创建一个人工智能团队和复杂的人工智能产品 最后,人工智能正在对社会产生极大的影响 在第四周(最后一周) 你将学到人工智能系统其实会会产生偏差 你会学习如何减轻或者清除这些偏差 你还会学到人工智能是如何影响 发展中的经济体,以及它对劳动力的影响 你能学到怎样帮助你你自己和你的公司 更好地应对人工智能的兴起 在这个为期四周课程最后 你将会比很多大型公司的CEO们 在人工智能科技上更懂行 并且你能比他们更合格地 用你的能力去帮助 你自己, 你的公司或 其他组织去更好地应对人工智能的兴起 我希望在学完这个课程之后 你将能够 领导其他人去应对这些挑战 解决这些问题 驱动人工智能兴起的 主要科技之一是机器学习 但是什么是机器学习? 让我们在下一个视频中一探究竟

欢迎大家使用人工智能。人工智能正在改变我们的工作和生活方式,这门非技术课程将教你如何驾驭人工智能的崛起。不管你是想知道这些流行语背后的意义,还是想在个人场合、公司或其他组织中使用人工智能,本课程都会教你如何使用。如果你想了解人工智能如何影响社会,以及如何驾驭它,你也可以从这门课程中学到这一点。在这第一周,我们将通过切断炒作,给你一个人工智能到底是什么的现实观点开始。我们开始吧。你可能已经看过关于人工智能创造多少价值的新闻报道。根据麦肯锡全球研究所的一项研究,预计到2030年,人工智能每年将创造13万亿美元的额外价值。尽管人工智能已经为软件产业创造了巨大的价值,但是未来创造的价值中有很大一部分是在软件产业之外的。在零售、旅游、运输、汽车、材料、制造等行业。我不认为人工智能在未来几年会对这个行业产生巨大的影响。我和我的朋友们互相挑战,说出我们认为人工智能不会产生巨大影响的行业名称。我最好的例子是美发行业,因为我们知道如何使用人工智能机器人自动化美发。但是,我曾经在舞台上说过这句话,我的一个机器人学教授朋友那天也在观众席上,她站起来,看着我的眼睛说,“你知道,安德鲁,大多数人的发型,我不能让机器人那样剪头发。”但她看着我说,“你的发型,安德鲁,机器人也能做到。”关于人工智能有很多令人兴奋的东西,但也有很多不必要的炒作。其中一个原因是因为人工智能实际上是两个不同的概念。我们今天在人工智能领域看到的几乎所有进步都是人工狭义智能。这些人工智能可以做一件事情,比如智能扬声器、自动驾驶汽车或人工智能,在农场或工厂进行网络搜索或人工智能应用程序。这些类型的人工智能是一个骗局,但当你找到合适的骗局,这可以是难以置信的宝贵。不幸的是,人工智能还涉及到 AGI 或人工通用智能的第二个概念。这就是构建人工智能的目标。它们可以做人类能做的任何事情,甚至可能是超级智能,它们可以做比任何人类都多的事情。我看到了人工智能和狭义人工智能的巨大进步,但对于 AGI 和人工通用智能几乎没有任何进步。这两个目标都是有价值的,但不幸的是 ANI 的快速进步是非常有价值的,这使得人们得出结论,人工智能有很多进步,这是真的。但是这使得人们错误地认为 AGI 可能也有很多进步,这导致了一些非理性的恐惧,害怕邪恶聪明的机器人现在随时会来接管人类。我认为 AGI 对于研究人员来说是一个令人兴奋的目标,但是在我们实现这个目标之前,大多数的技术突破都需要几十年、几百年甚至几千年的时间。考虑到 AGI 离我们有多远,我认为没有必要过分担心这个问题。在本周,你将学习 ANI 能做什么,以及如何将它们应用到你的问题上。在本文后面的部分,当然你还会看到一些关于 ANI 的案例研究,这个小把戏可以用来构建真正有价值的应用,比如智能扬声器和自动驾驶汽车。在本周,你将了解为什么这个人工智能。你可能听说过机器学习,下一个视频将教你什么是机器学习。您还可以了解什么是数据,什么类型的数据是有价值的,但是哪些数据是无价值的。你可以了解是什么让一个公司成为人工智能公司或者人工智能第一公司,这样你就可以开始思考是否有办法提高你的公司或者其他组织使用人工智能的能力,重要的是,这周你也学到了机器学习能做什么和不能做什么。在我们的社会中,报纸和研究论文往往只谈论机器学习和人工智能的成功故事,我们几乎从来没有看到任何失败的故事,因为它们只是没有那么有趣的报道。但是对于你对人工智能和机器学习能做什么或不能做什么有一个现实的看法,我认为重要的是你看到两者的例子,这样你就可以对你可能和也许不应该尝试使用这些技术做出更准确的判断。最后,许多最近兴起的,机器学习已经被深度学习的兴起所驱动。有时也称为神经网络。在本周的最后两个可选视频中,你还可以看到深度学习的直观解释,这样你就可以更好地理解他们能做什么,特别是对于一系列狭窄的 ANI 任务。所以,这就是你们本周学到的,到本周末,你们已经了解了人工智能技术,以及它们能做什么和不能做什么。在第二周,您将学习如何使用这些人工智能技术来构建有价值的项目。你会了解到建立一个人工智能项目是什么感觉,以及你应该做什么,以确保你选择的项目在技术上可行,对你或你的企业或其他组织有价值。

在学习如何建立人工智能项目之后,第三周你将学习如何在你的公司建立人工智能。特别是,如果你想让你的公司在人工智能方面做得更好,你可以看到人工智能的转型剧本,学习如何建立人工智能团队,以及如何建立复杂的人工智能产品。最后,人工智能正在对社会产生巨大的影响。在第四周,也是最后一周,你将学习人工智能系统如何产生偏见,以及如何减少或消除这种偏见。你还可以了解人工智能是如何影响发展中国家的经济,人工智能是如何影响就业的,并且能够更好地为自己和组织驾驭人工智能的崛起。在这四个资源的最后,你将比大多数大公司的首席执行官更加了解人工智能技术,也更有能力帮助你自己或你的公司或其他组织驾驭人工智能的崛起,我希望在这个课程之后,你将能够为他人提供领导力,同时他们也能驾驭这些问题。现在,推动人工智能最近崛起的主要技术之一是机器学习。但是什么是机器学习?让我们看看下一个视频。

Machine Learning6分钟

The rise of AI has been largely driven by one tool in AI called machine learning. In this video, you'll learn what is machine learning, so that by the end, you hope we will start thinking how machine learning might be applied to your company or to your industry. The most commonly used type of machine learning is a type of AI that learns A to B, or input to output mappings. This is called supervised learning. Let's see some examples. If the input A is an email and the output B one is email spam or not, zero one. Then this is the core piece of AI used to build a spam filter. Or if the input is an audio clip, and the AI's job is to output the text transcript, then this is speech recognition. More examples, if you want to input English and have it output a different language, Chinese, Spanish, something else, then this is machine translation. Or the most lucrative form of supervised learning, of this type of machine learning maybe be online advertising, where all the large online ad platforms have a piece of AI that inputs some information about an ad, and some information about you, and tries to figure out, will you click on this ad or not? By showing you the ads you're most likely to click on, this turns out to be very lucrative. Maybe not the most inspiring application, but certainly having a huge economic impact today. Or if you want to build a self-driving car, one of the key pieces of AI is in the AI that takes as input an image, and some information from their radar, or from other sensors, and output the position of other cars, so your self-driving car can avoid the other cars. Or in manufacturing. I've actually done a lot of work in manufacturing where you take as input a picture of something you've just manufactured, such as a picture of a cell phone coming off the assembly line. This is a picture of a phone, not a picture taken by a phone, and you want to output, is there a scratch, or is there a dent, or some other defects on this thing you've just manufactured? And this is visual inspection which is helping manufacturers to reduce or prevent defects in the things that they're making. This set of AI called supervised learning, just learns input to output, or A to B mappings. On one hand, input to output, A to B it seems quite limiting. But when you find a right application scenario, this can be incredibly valuable. Now, the idea of supervised learning has been around for many decades. But it's really taken off in the last few years. Why is this? Well, my friends asked me, "Hey Andrew, why is supervised learning taking off now?" There's a picture I draw for them. I want to show you this picture now, and you may be able to draw this picture for others that ask you the same question as well. Let's say on the horizontal axis you plot the amount of data you have for a task. So, for speech recognition, this might be the amount of audio data and transcripts you have. In lot of industries, the amount of data you have access to has really grown over the last couple of decades. Thanks to the rise of the Internet, the rise of computers. A lot of what used to be say pieces of paper, are now instead recorded on a digital computer. So, we've just been getting more and more data. Now, let's say on the vertical axis you plot the performance of an AI system. It turns out that if you use a traditional AI system, then the performance would grow like this, that as you feed in more data is performance gets a bit better. But beyond a certain point it did not get that much better. So it's as if your speech recognition system did not get that much more accurate, or your online advertising system didn't get that much more accurate that's showing the most relevant ads, even as you show the more data. AI has really taken off recently due to the rise of neural networks and deep learning. I'll define these terms more precise in later video, so don't worry too much about what it means for now. But with modern AI, with neural networks and deep learning, what we saw was that, if you train a small neural network, then the performance looks like this, where as you feed them more data, performance keeps getting better for much longer. If you train a even slightly larger neural network, say medium-sized neural net, then the performance may look like that. If you train a very large neural network, then the performance just keeps on getting better and better. For applications like speech recognition, online advertising, building self-driving car, where having a high-performance, highly accurate, say speech recognition system is important, enable these AI systems get much better, and make speech recognition products much more acceptable to users, much more valuable to companies and to users. Now, a few couple of implications of this figure. If you want the best possible levels of performance, your performance to be up here, to hit this level of performance, then you need two things: One is, it really helps to have a lot of data. So that's why sometimes you hear about big data. Having more data almost always helps. The second thing is, you want to be able to train a very large neural network. So, the rise of fast computers, including Moore's law, but also the rise of specialized processors such as graphics processing units or GPUs, which you'll hear more about in a later video, has enabled many companies, not just a giant tech companies, but many many other companies to be able to train large neural nets on a large enough amount of data in order to get very good performance and drive business value. The most important idea in AI has been machine learning, has basically supervised learning, which means A to B, or input to output mappings. What enables it to work really well is data. In the next video, let's take a look at what is the data and what data you might already have? And how to think about feeding this into AI systems. Let's go on to the next video.

中文字幕:

1、

欢迎观看AI for everyone

人工智能正在改变我们工作和生活的方式

这个通俗易懂(不含有专业词汇)的课程会教你

理解人工智能的发展。

无论你是想更深入了解人工智能流行的背后,

或是

你想把人工智能应用到你的生活,

公司,或其他组织中。

这个课程会教你如何达成这些目标。

如果你想了解人工智能是如何影响社会的,

以及你如何驾驭它,

你也会从这个课程中学到这些。

这个星期,

我们将抛开对人工智能的炒作, 让你

对人工智能有更加客观的了解。让我们开始吧。

你可能看过

关于 AI 创造了多少价值的新闻。

根据麦肯锡全球研究所的一项研究

AI 估计会增加

每年 13 万亿美元的

价值 (在2030 年之前)。

尽管 AI 已经在软件行业创造

了大量的价值,

未来人工智能将会在

在软件产业之外创造更多的价值。

在零售、旅游、交通、

汽车、材料、制造等。

我很难想像

有哪一个行业,

在接下来几年里,

人工智能不能对它产生巨大的影响。

我和我的朋友们常常挑战对方说出

某一个行业不会受到AI 巨大的影响。

我最好的例子是美发行业, 因为我们

不知道如何使用人工智能机器人自动美发。

但是, 我曾经在演讲的时候提过这一点

当天观众中有一个朋友

是一位研究机器人的教授,

那天她站了起来,

看着我的眼睛说,

"安德鲁, 大多数人的发型,

我不能让机器人剪出他们的发型 ",

但她看着我说

"你的发型, 机器人倒是可以剪出来 ( 嘲笑Andrew教授的发型)。

现实中有很多令人兴奋的, 但也有很多

关于 AI 的不必要的炒作。

其中一个原因是

AI 实际上是两个独立的概念。

几乎所有我们可以看到的人工智能中的进展

都是弱人工智能 (ANI)。

这些都是用 AI 做

一件事, 如一个智能音箱或

自动驾驶或网络搜索或 AI

在农业或工厂中的应用。

这些类型的 AI 只是

单方面的成果。但当你找到合适的技巧,

这可能是非常有价值的。

但是,AI 也包含它的

第二个概念

强人工智能(AGI)。

这就是构建 AI 的目标。

他们可以做任何人类能做的事情, 甚至可能是

超过人类智能的事和其他

任何人类都做不到的事情。

我看到了大量 ANI(弱人工智能)的进步

但是几乎没有

在 AGI (强人工智能)方面的进展。

这两个都是有价值的目标,

不幸的是, ANI的快速发展

(虽然它相当有价值),

导致人们认为

整体人工智能有很大的进步 (这倒是是对的结论)。

但这让人们

错误地认为,

AGI 也有很大的进展

这导致一些非理性的恐惧

比如聪明但邪恶的机器人会

随时替代人类。

我想强人工智能是

一个令人兴奋的目标, 值得更多研究人员的工作,

但它仍需要多方面的

技术突破才能实现。

这意味着几十年或

几百年甚至几千年的探索。

正是因为强人工智能时代还离我们相当遥远

我认为没有必要过分担心这件事。

这一周里, 你将了解到 ANI

可以做什么, 以及如何将它们应用到您的问题中。

后面的教程,你将会

看到一些关于弱人工智能的案例研究

这些单一的人工智能可以用来建立

非常有价值的应用, 如

智能音箱和自动驾驶汽车。

在这一周里, 你将了解什么是 AI。

你可能听说过机器学习

下一个视频将教你什么是机器学习。

您还可以了解什么是数据以及什么类型的数据

是有价值的, 以及

什么类型的数据是没有价值。

你知道是什么让

一个公司成为人工智能公司或人工智能优先的公司

你将会开始思考

是否可以有改善

你的公司或其他组织

使用人工智能的能力

本周你将会学到

机器学习能做什么和不能做什么

在我们的社会,报章杂志

以及学术论文

倾向于只讨论

关于机器学习和人工智能成功的案例,我们几乎

从来没有见过任何失败的案例

这是因为失败的案例没有新闻报道的价值

但是为了能让你从现实的角度重新审视

人工智能和机器学习能干什么不能干什么

我认为

让你同时看到成和败的案例至关重要

你可以更准确钱的判断

哪些技术可以用,那些技术不应该尝试

很多最近兴起的对于机器学习的热潮

其实都来自于

深度学习的发展

深度学习又被称为神经网络

在本周最后的两段视频中

你能看到

对于深度学习直观的解释

你能更好的了解它们能做什么

特别是用于一组弱人工智能任务

所以,这就是你

在这周的课程中将学到的

你将明白

人工智能技术能做什么不能做什么。

第二周,

你将学到如何用这些 AI 技术

创造具有价值的项目。

你将对创造

AI 项目有些感觉,

并且,你将学会怎样选择

在技术上可行的项目,

而且它们能对你本人,

你的公司、或其他组织都是有价值的

当你明白建立一个人工智能项目需要什么之后

在第三周你将学习

如何把人工智能技术应用到你的公司

如果你想

使你的公司擅长人工智能

你会看到人工智能转型手册

学习如何创建一个人工智能团队和复杂的人工智能产品

最后,人工智能正在对社会产生极大的影响

在第四周(最后一周)

你将学到人工智能系统其实会会产生偏差

你会学习如何减轻或者清除这些偏差

你还会学到人工智能是如何影响

发展中的经济体,以及它对劳动力的影响

你能学到怎样帮助你你自己和你的公司

更好地应对人工智能的兴起

在这个为期四周课程最后

你将会比很多大型公司的CEO们

在人工智能科技上更懂行

并且你能比他们更合格地

用你的能力去帮助

你自己, 你的公司或

其他组织去更好地应对人工智能的兴起

我希望在学完这个课程之后

你将能够

领导其他人去应对这些挑战

解决这些问题

驱动人工智能兴起的

主要科技之一是机器学习

但是什么是机器学习?

让我们在下一个视频中一探究竟

2、

人工智能的兴起在很大程度上是由

机器学习的人工智能工具推动的

在这个视频中,你会学习到什么

是机器学习, 那么在最后,

希望我们会开始思考怎样把机器学习

应用于您的公司或您的行业。

最常用的

机器学习类型是

学习如何从A到B

也就是从输入到输出的映射

这被称为监督学习

让我们看些例子

如果输入 A 是一封电子邮件, 并且

输出B表示是(1)或不是(0)垃圾邮件

这就是

用于构建垃圾邮件筛选器的AI的核心思想

如果输入A就是一段音频片段,

AI的任务是将语音转化为文本,

这就是语音识别

还有更多的例子, 如果你想

把你输入的英语变成其他的语言

中文, 西班牙语, 或者别的语言,

那么这就是机器翻译

最赚钱的监督学习,

以及类似这种类型的机器学习

也许是在线广告

所有大型在线广告平台都有

一个AI推荐系统, 输入一些关于一个广告的信息,

还有一些关于你的信息

然后试图预测

你是否会点击这个广告

向你展示你最有可能点击的广告,

是非常有利可图的

也许这不是最鼓舞人心的应用

但这会对当前的经济产生巨大的影响

如果你想造一辆自动驾驶汽车,

其中关键的人工智能技术

是将图像作为AI的输入,

和一些从

雷达, 以及其他传感器获取到的信息

然后输出周围汽车的位置,

这样你的自动驾驶就能避开其他车

还可以看到制造业中的例子,

我其实为制造业做了很多

AI的工作

就是把你制造的东西的图片作为输入

例如一张

在装配线上的一部手机的图片

这是一张手机的照片

而不是用手机拍摄的照片

你想要的输出

是看这个手机是否有划痕, 还是凹痕,

或其他一些缺陷在

你制造的这个东西上。

这叫做外观(视觉)检查, 这可以帮助

制造商减少或

防止他们制造的东西出现缺陷

这种被称为监督学习的人工智能技术,

是学习从输入到输出,

或A到B的映射

一方面, 输入到输出,

A 到 B 似乎是相当有限的

但是, 当您找到合适的场景来应用它们的时候,

这可能是非常有价值的。

监督学习的概念

其实已存在几十年了

但它迅猛的发展还是在

这过去的几年里,为什么会这样?

我的朋友问我,“Andrew

为什么监督学习等到现在才飞速发展“

我给他们画了一张图

我现在给你看这张照片

你也可以把这张图

画给其他问你同样问题的人

让我们假设横坐标表示

在某项任务中我们拥有的数据量

也就是说, 对于语音识别,

这就代表

音频数据和语音文本的数量

在很多行业,

您可以拿到的数据量

在过去的几十年里确实有了增长

这得益于互联网的兴起

和计算机的兴起

很多以前记录在纸上的信息

现在已被记录在数字计算机上

我们正在收集越来越多的数据

现在, 让我们假设纵坐标表示

人工智能系统的性能

如果你使用传统的人工智能系统

它的性能会像这样增长

当你输入更多的数据时

它性能会变得好一点

但当数据量超过一定范围之后,

它的性能并不会持续增加

好比说,你的语音识别系统

并不会因为你提供了更多的数据,

就变得更加准确,你的在线广告系统

并不会因为你提供了更多的数据,

就能够显示越来越相关的广告

AI 最近真正地飞速发展, 得益于

神经网络和深度学习的兴起。

我将在以后的视频中更精确地定义这些术语,

现在不必要担心这些看似复杂的术语

但随着现代人工智能技术

以及神经网络,和深入度学习的技术

我们看到的是

如果你训练一个小的神经网络

那它的性能 (蓝线)是这样的

但当你向它提供更多的数据时

它的性能(蓝线)提升会持续更长的时间

如果你训练一个稍大一点的神经网络

例如中型神经网络

那它的性能 (紫线)可能是这样的

如果你训练一个非常大的神经网络

那么它的性能 (绿线)会

不断变得越来越好

对于语音识别,

在线广告, 自动驾驶等应用,

拥有高性能,

高准确率

比如,

如果这些人工智能系统变得更好,

因此制作出很棒的语音识别产品

这样更容易被用户接受,

对公司和用户更有价值

现在来看看这个图的几个含义

如果您想要最好的性能,

那这个性能需要在这里

达到这样的性能水平

你需要知道两点,第一

拥有大量的数据

这就是为什么有时你会听到大数据

数据量总是多多益善的

第二, 你要能够

训练一个非常大的神经网络

所以, 快速计算机的兴起, 包括摩尔定律,

还有

专用处理器的发展, 例如

图形处理单元或 GPUs,

在之后的视频中会深入探讨

使许多公司

,不仅仅是科技巨头

还有许多其他公司

能够用足够大的数据集

来训练大型神经网络, 以获得

非常好的性能和商业价值

人工智能中最重要的概念是机器学习,

这包括监督学习,

也就是,从A到B,

或者是从输入到输出的映射。

数据能使它有很好的表现。

下一个视频中,

让我们来看看什么是数据?

让我们看看哪些数据是你已经拥有了的?

如何将数据输入AI系统

我们下一节再见

3、

你可能听说过, 数据

对于构建AI系统是非常重要的

但是, 到底什么是数据? 让我们一探究竟。

让我们看一个例子,一个数据表格,

我们也称之为数据集。

如果你想知道怎样

给你想要买或者卖的房子定价

你可能会收集类似这样的数据集

这可能是一个电子表格

比如一个微软Excel电子表格

其中一列是房子的大小,

比方说单位是平方英尺或平方米,

第二列是房子的价格。

也就是说, 如果你想建立

一个AI系统或机器学习系统, 以帮助

您设置房子的价格

或者看已有定价是否合理,

你可能会把A设定为房子的大小

把B设房子的价格

然后让一个AI系统去学习

这个输入到输出的过程,或者说 A 到 B 的映射。

但我们不想只是

根据房子的大小来定价

你可能会想要

收集

房间数量的数据。

这样的话, A 就可以代表前两列数据,

B 可以只代表房子的价格。

所以, 当给定一个数据表,

这时侯就取决于你

或者你的业务所需

来决定什么是 A, 什么是 B。

您的企业通常会有很独特的数据,

像这个数据例子,

可能来自于一个称城乡机构

他们想给新建的房子定价。

这就完全由你来决定什么是 A 什么是 B,

以及如何定义 A 和

B,以此增加你的业务有价值。

另一个例子是,如果你有一定的预算

你想知道

你能买得起多大的房子

那么你可能会把

输入 A 定义为在一个房子上的花费

把B 定义为房子的大小,

这将是对A 和 B 完全不同的选择

它们会告诉你

在某一个预算下

多大的房子

是你可能会考虑的

这里有另一个数据集的例子

假设您要构建

识别图片中的猫的人工智能系统。

虽然我不知道你为啥要建这么一个系统,

但也许这是一个有趣的手机app。

你想给猫的照片贴上标签

你可以收集一个数据集, 其中

输入 A 代表一组

不同的图像, 输出 B 是它们的标签, 例如

"第一张照片是一只猫, 第二张不是猫。

这是一只猫, 那不是一只猫 ",

这个AI 系统接收图片 A 然后输出

一个标签。也就是说你可以用以标记

所有

在你的照片集或移动App里猫咪照片

在机器学习的传统中,

有很多关于猫的例子。

我觉得其中的一些是在我

领导谷歌大脑团队的时候

那时我们公布了一些结果,

是有关谷歌猫的。

在这个项目里,人工智能系统

从youtube 视频中学习如何会识别猫。

自那以后,

把猫作为一个谈论

机器学习的例子就成为了习俗。我对

所有的爱狗人士感到抱歉。我也是很喜欢狗狗的。

因此, 数据相当重要

但如何获得数据?

如何收集数据?

获取数据的方法之一是手动标记。

例如, 您可能会收集一组

照片,就像这里所示。

然后你自己或其他人

去一一标记这些图片

也就是说,第一个标记是猫

第二个不是猫

第三个是猫, 第四个不是猫。

通过手动标记这些图像中的每一个,

你现在有了一个用于构建猫探测器的数据集。

实际上这需要四张以上的图片才能真正做到。

你可能需要几十万张照片

但手动标签是

一个让你同时拥有

A 和 B数据集的有效方法。

获取数据集的另一种方法是从

观察用户行为或其他类型的行为。

例如, 假设你运行

一个在网购网站。

像是电子商务

在这个网站上

不同的物品会有不同的价格

你可以观察用户是否购买了你的产品

所以, 仅仅通过购买或不购买

你产品的用户行为

你就可能收集到这样的数据集

你可以在用户访问你网站的时侯

存储用户名

你向用户所提供的某一产品的价格

以及他们是否购买了它

所以, 当用户只是使用了你的网站的时候

这个过程就生成这些数据

这是观察用户行为的一个例子

我们也可以观察

其他事物的行为, 比如机器

如果你在工厂里运行一台大机器

并且你想预测

一台机器是否即将坏掉或出现故障

那么在仅仅只观察机器表现的时候

你就可以记录一个像这样的数据集

这里有机器序列号

机器的温度

机器里的压强

和机器之前是否出现过故障

如果你的程序是为了进行预防性维护

比如你想知道一台机器是否将要坏掉

那么你可以这样,比如,

选择这几列数据作为输入 A

并选择那个作为输出 B

来判断一台机器是否即将出现故障

如果是的话, 你可能需要

对机器进行预防性维护

第三种非常常见的获取数据的方法是

从网站上下载

或从合作伙伴那里获取

多亏了开放的互联网

有非常非常多的数据集可供你免费下载

从计算机视觉或图像数据集

到自动驾驶汽车数据集

到语音识别数据集

到医学成像数据集以及很多其他的

因此, 如果你的应用需要某一类型的数据

只要遵守许可证和版权的规则

便可直接从网上下载

这可能是一个

让你建立应用的不错的方式

最后,如果你有一个合作伙伴

比如你在一个工厂工作

也许这个时候他们已经

收集了一个很大的数据集可以给你

比如机器,温度,

还有机器出现故障与否时的压强

数据是重要的,但是它有些被炒得过热了

而且有时候被误用了

让我给你描述两个

最常见的误用

亦即错误思考数据的方式

当我跟一些大型公司的首席执行官交谈时

他们中有些人甚至对我说

嘿 Andrew, 给我三年时间来建立我自己的IT团队

我们现在正在搜集很多的数据

这样在三年后,我就会有这个完美的数据集了

那时我们就会启用AI了

这其实是一个非常糟糕的策略

相反,我想建议每家公司的是

一旦你开始搜集了一些数据

马上把数据展示给

或者将数据喂给某一个AI团队

因为大多数情况下AI团队可以

反馈给你的IT团队

哪种类型的数据是需要收集的以及

应该继续构建哪种类型的IT基础架构

举个例子,也许一个AI团队能看了你的工厂数据

然后说,嘿,你知道吗?

如果你可以

从这个大制造机器里

不仅仅是每十分钟

而是每分钟就收集一次数据

那么我们可以帮你构建一个

更棒的防御性维护系统

所以, IT团队和AI团队之间

经常会有这种相互作用

我的建议通常是早点从

从AI团队那里获得反馈

因为它可以帮助引导

你IT基础构架的发展

另外,说到数据的误用

很不幸,我看到一些首席执行官

在通过新闻了解到数据使用的重要性后

然后就说,

既然我有这么多数据

那AI团队肯定能用它们创造价值

不幸的是,这并不总是如此

通常数据多确实比数据少要好

但是我会不要因为你有数不完的数据

就理所当然地认为

AI团队能奇迹般的使它们变得有价值

因此, 我的建议是不要认为只要扔数据给AI团队

就假设它们会创造价值

事实上, 在一个极端的例子里

我见过一家公司收购了了

一大堆其它医药公司的数据,

理论上讲,

假设性地来看,他们的数据将会非常有价值。

到如今几年后,

就我所知,工程师们还没有

弄明白如何

使用这些数据并且真正地从中创造价值。

所以,有时候它会奏效,有的时候不会。

但不要为了只是为了获取数据

而过度投资

除非同时聘用

一个AI团队来研究这些数据。

因为,他们可以帮助指引你去思考

那些数据是最有价值的。

最后,数据是散乱的。

你也许听过“垃圾进垃圾出”这句话,

如果你的数据质量差,

那么AI会学习出不准确的结果。

这一些是数据问题的例子。

比方说你有一个数据集,包括房子的大小、

卧室的数量和房价

你可能有不正确的标签或者不正确的数据

例如,这个房子不太可能只卖了

0.001千美元(仅仅1美元)

或者,数据有可能会缺失,比如

这里有一堆未知的值

所以,你的AI团队需要去解决

如何清理数据,

如何处理这些不正确的标签

和这些缺少的值

数据还会有很多不同的类型

例如,有时候你会听说

图片、视频和文本

这些类型的数据,人类

很容易理解。这些类型的数据

我们称之为“非结构化数据”

有一些

AI技术能够

识别图片图片是不是猫或者

将语音转化为文字

或者识别垃圾邮件

还有一些类似右边的数据集

这是一个结构化数据的示例。

简单说,结构化数据储存在

一个巨大的表格里

处理这些

非结构化数据的技术要比

处理这些结构化数据的技术

难一点

但无论是那种类型的数据

,非机构化数据或者结构化数据

AI 技术都表现出色

这集视频中,你学习了什么是数据

你也学习到如何不误用用数据

比如,花重金投资一个

IT基础系统,寄希望于

这在未来会将AI派上用场

但是我们实际需要检查的是,

看这些数据是否对你想要建立的AI程序有用

你会发现数据其实很混乱

但是一个好的AI团队会

帮助你解决这些问题

当人们提到AI的时候会用到一些难以理解的术语

比如AI,

机器学习、数据科学

在下一个视频,我想

和你们分享这些术语真正的含义

这样你就能自信地

准确地和其他人谈论这些概念

我们下一节再见

4、

你可能听说过一些人工智能的术语,

比如机器学习

或数据科学、神经网络、深度学习

这些术语是什么意思呢?

在这个视频中

你会学习到这些人工智能中最重要的术语

这样你就能跟别人谈论它们

并思考怎样把他们应用到企业中

让我们开始吧

假设你有一组房子数据,其中包括房屋大小

卧室的数量, 浴室的数量,

房屋是否重新装修,以及价格

如果你想开发

一个手机应用来给房屋定价

那这些将是输入A

这是输出B

那么,这就是一个机器学习系统

具体来说

这种机器学习系统

学习输出输入

或A到B的映射

所以, 机器学习往往会产生出

在一个运行的AI系统

也就是说,它是一个你可以任何时候

自动输入A(房屋属性)

然后输出B(价格)的软件。

所以, 如果你有一个运行的人工智能系统

去服务几十或几十万

甚至数以百万计的用户

那通常就是一个机器学习系统

与此相比,你还可以做其他一些工作

例如请一个团队分析你的数据集

好从数据里面获取一些提示

也就是说,这个团队可能会得出这样的结论

"如果你有

两栋大小相似的房子,

有类似的面积,

如果其中一间房有三间卧室

那么他的花费比两间卧室的房子要高很多

即使两栋房子的整体面积一模一样

或者, "你知道吗?

新装修的房屋定价高出旧房子15%”

这可以帮助你决策分析, 比如

如果你已经决定要建造一定面积的房子,

那把它们修成两个卧室的房子,

还是三个卧室的, 可产生最大的价值?

或者,

投资翻新一个房子,

是否真正可以提高

你房子的出售价格?

以上这些都是数据科学案例

数据科学项目的结论通常

一些帮助你做商业决定

的见解

比如,建造哪种房屋

或者,否需要投资来翻新房子

这两个术语 --

机器学习和数据科学 --

的界限是有点模糊的,

这些术语

在当今行业并不是使用得很一致

但我在这里提到的

是这些术语最常使用的定义,

但是你不会查到对

它们固定的定义。

现在我想把这两个定义更加系统化,

机器学习是一个

让电脑在不被编程的情况下,就可以自己学习的研究领域

无需显示编程。

这是Arthur Samuel几十年前提出的定义。

Arthur Samuel 是

机器学习的先驱之一,

他以编写了一个跳棋程序而闻名。

这个程序可以玩跳棋,

比Arthur本人,

玩得更好。

所以,机器学习项目

通常会带出一个运行的软件,

用给定的A,得到输出B。

与机器学习相比,数据科学是

通过挖掘数据来获取见解。

所以,通常

一个数据科学项目的结果是一组幻灯片,

它们包括一些

帮助高管们

采取商业行动的结论,或者是一些

帮助产品团队决定 如何改善网站的结论。

让我给一个在线广告领域里的

机器学习与数据科学的例子。

当今,几乎所有大型商业平台,

都有AI系统在内,以此快速

知晓你最有可能点击的广告是什么

所以,这就是机器学习系统

事实证明,这是一个

利润非常丰厚的人工智能系统,

它的输入是关于你和那些广告的信息,

输出就是判断你是否会点击某一个广告

这些系统不停地运作

这些机器学习系统

为这些公司增加广告收入

这其实就是一个软件在背后运作

相比之下,我还在

网络广告行业做过数据科学项目。

例如,如果数据分析告诉你,

旅游业的公司没有购买足够的广告,

这时候,如果你能派出更多销售人员

向旅游公司出售广告,

你可以说服他们使用更多广告,

这便是

数据科学项目

一个例子,这个项目的结果就是

高管们决定要销售团队

花更多的时间去游说旅游业。

即使在同一家公司,

也会有不同的机器学习项目

和数据科学项目,

这两者都非常有价值

你也许还听说过深度学习

那么,什么是深度学习?

假设你想要预测房价

你想给房子定价

所以,你会有一个输入,其中

包括房子的大小,

卧室数量,浴室数量

以及是否是新装修的。

给房屋定价最有效的方法之一是,

把输入A提供给

这个东西,然后让它输出一个价格。

这个东西叫做神经网络,

有时也称之为

人工神经网络

这是为了将它与

人脑中的神经网络区分开来

人类的大脑是由神经元组成的

当我们说人工神经网络时,

只是为了强调

这不是生物大脑

而是一个软件

神经网络的功能,

或者人工神经网络的功能

是运用输入A,

就是全部这四个东西,

然后输出B,

就是房屋的估值。

在本周的后续可选视频中,

我会告诉你更多,

这个人工神经网络究竟是什么

但是所有的人类认知都是由

大脑中的神经元组成的,通过电脉冲,

相互传递小信息

当我们画一个人工神经网络的图片时,

其实是与人的大脑有一个类比。

这些小圆圈被称为人工神经元,

或简称神经元。

这也使神经元相互传递

这个庞大的人工神经网络是

其实是一个大的数学方程

根据输入A,

告诉你如何计算B (价格)

如果你觉得这里有太多繁复的细节,

也不要担心

我们稍后会详细讨论这些细节

现在只需明白的是,神经网络是

一种学习A到B,或输入-输出映射

的非常有效的方法

当今,神经网络和

和深度学习几乎可以互换使用

他们的意思基本上是相同的

几十年前,这种类型的

软件被称为“神经网络”

但近年来,

我们发现深度学习

只是一个更好听的‘品牌’

所以无论好坏

这个术语是最近才兴起的

那么,神经网络(人工神经网络)

与大脑有什么关系呢?

事实证明几乎没有

神经网络最初受到大脑的启发,

但是它工作原理几乎

完全与生物大脑的工作方式无关

所以,今天我在类比

人工神经网络和

生物大脑的时候是非常谨慎的

即使它们之间有一些松散的关联

AI有许多不同的工具

在这个视频中,你了解了

什么是机器学习和数据科学

以及什么是深度学习

以及什么是神经网络

你可能也在媒体上听到

其他流行语如无监督学习,

强化学习,图形模型,

计划,知识图表等。

您不需要知道所有

这些其他术语的含义

但这些只是能够

让计算机智能化的工具

我会试着在后面的视频中让你了解

一些这些术语的含义

但我希望你能知道这些最重要的工具,

比如机器学习,

数据科学

以及深度学习,和神经网络

(神经网络)是一个非常强大的机器学习的方式

有时是数据科学(也会用到神经网络)

如果我们要绘制

维恩图来显示

这些概念是如何组合在一起的,

我们可以这样画这个图

人工智能是一套庞大的工具集

用于使计算机智能化

对于AI,最大的子集

是自机器学习的工具,

但AI还有其他工具,

比如如下的

一系列流行语

当下最重要的

机器学习的分支

是神经网或深度学习,

这是一套非常强大的工具

可以执行监督学习,或学习从A到

B映射,以及学习其他东西

但机器学习的工具里

不仅仅只有深度学习

那么,数据科学属于这个图的哪个部分呢?

大家对此其实没有一致的结论

有些人会告诉你 数据科学是人工智能的一个分支

有些人会告诉你AI 是数据科学的一个分支

所以,这取决于谁来回答这个问题

我的观点是,数据科学可能是

所有这些工具的

交叉子集加上一些额外的东西。

它使用了许多

AI机器学习和深度学习的工具

但还有其他一些独立的工具,

来推动商业方面决策等

一系列重要问题

在这个视频中,你看到了什么是机器学习,

什么是数据科学,

什么是深度学习和神经网络。

我希望这能让你了解

人工智能里最常见和最重要的术语,

你可以开始思考

怎样把他们应用到你的公司

那,对于一家擅长AI的公司来说, 这意味着什么?

我们将在下一个视频中讨论这一点

5、

什么能使一个公司擅长人工智能呢?

也许更重要的问题上是

怎样才能让你的公司

擅长使用人工智能呢?

我曾经领导过谷歌的谷歌大脑团队

和百度的人工智能小组

期间我分别帮助这两个公司

成为了非常棒的的人工智能公司

那么,你能为你的公司做些什么呢?

通过观察互联网的兴起与发展

我学会了一些我认为

能帮助我们更好地应对 人工智能兴起的经验教训

让我们一起来看一看吧!

我们从互联网的兴起中

学到的一课就是

那你最喜欢的商场举个例子

比如我跟我妻子有时候会去

斯坦福购物中心

假如你为这个购物中心 建立了一个网站

也许在这个网站上卖一些东西

这个行为本身并不会 把这个购物中心

变为一个互联网公司

实际上 ,几年前一个大型零售公司

的首席执行官曾像我说,

‘嘿Andrew,我有一个网站

我在网站上卖东西,

亚马逊有一个网站,

亚马逊也在网上卖东西,这是一回事‘

但是当然了,这并不是一回事

一个有网站的商场和

一流的互联网公司是不一样的

所以,如果在网站上售卖物品

无法定义一个互联网公司的话

什么能定义它呢?

我认为一个互联公司是一个

能够把那些互联网 让你做的事情做得很好的公司

比如说,我们会做无处不在的AB测试

意思是我们会常规性地

使用两个不同版本的网站

并且看哪个效果更好, 因为我们可以这么做

这样,我们能快得多学习.

但在一个传统的购物中心里

是很难同时拥有

两个平行宇宙里的两个商场的

并且你可能只有每个季度

或者每六个月才能对物品进行改变

而互联网公司因为有 很短的迭代周期

你可以每周都寄出新产品

或者甚至每天, 因为你可以这么做

而一个购物中心却 只能在好几个月之后

才能被重新设计,

互联网同时也更倾向于

把做决定的权利从首席执行官

推向工程师和 其他一些专门的岗位

比如产品经理

这跟一个传统的购物中心正好相反

在传统的购物中心里

也许首席执行官会做 所有重要关键的决定

其他所有人按照首席 执行官说的做就好了

事实证明,这种传统的模式 并不适用于互联网时代

因为只有那些工程师,以及其他职位

例如产品经理这样的专门岗位

才对技术产品

以及用户,有足够的了解

从而能做出好的决定

所以, 这便是一些

互联网公司所做的事情

这么做能保证它们把那些

互联网能让它们做得事情做得很好

这便是我们从互联网 时代所学到的东西

那么人工智能时代呢?

我认为如今

你可以让任何公司使用

一些神经网路或者

深度学习的算法

而仅仅这么做

并不会让这个公司 变成一个人工智能公司

相反,真正成就一个伟大的人工智能公司,

有时被称为人工智能为先的公司的是

你是否把那些通过人工智能 做到的事情做得特别好?

比如说,人工智能公司

十分擅长有策略性数据采集

这就是为什么它们当中很多

大型的消费型科技公司会有

免费产品来帮助它们采集数据

并在别处产生收入

我也带领过战略团队

去刻意地发行一些

完全不挣钱的产品

而只是为了采集数据

认真考虑如何获取数据,

是一个好的人工智能公司的关键成分

人工智能公司会 建立统一的数据仓库

如果你有50个不同的数据库

或者50不同的数据仓库

由50和不同的副总裁来负责

那么让一个工程师 去从每一个地方获取数据

综合所有数据, 然后进行分析判断,并且得出结论

这几乎是不可能的

所以很多很好的人工智能公司

先发制人地把

所有的数据全都带入一个数据仓库

以此来增加团队综合利用 所有不同数据的能力

当然,这些都是要根据隐私保障 和数据规范来进行的

比如欧盟的《通用数据保护条例》。

人工智能公司十分擅长

发现能自动化的机会

我们十分擅长,比如说,

哦!让我们把监督式学习 算法用在这个上面

和一个自动定理证明制图 (Automated Thereom Proving mapping)

这样的话,我们就不用人力来做这些事情了

我们可以把它们自动化

人工智能公司也有很多新的岗位 比如说MLE, 即机器学习工程师

和很多新的方式

给团队成员分配任务

所以,一个公司来想要变得擅长人工智能

意味着这个公司用 人工智能去做某些事情

并把它们做得很好,

一个公司想要变得擅长人工智能

确实是需要一个过程的

实际上十年前

谷歌和百度

和一些其他我并没有参与的 公司比如脸书和微软

并不像它们今天这样 如此擅长人工智能

所以,一个公司如何能够 变得擅长人工智能呢?

事实证明,变得擅长人工智能并不是一个

神秘的魔法过程

相反的, 有一个系统化的进程

能让很多公司

基本上,任何大公司变得擅长人工智能

这是一个5步人工智能转型手册

我把它推荐给想要

有效运用人工智能的公司

我在这里将做一个概括

下周我们将会讲更多的细节

第一步是启动试点项目来获得势头

只需要几个小的项目

让你大概对人工智能可以做什么,

不可以做什么有更好的了解

并且让你体验一下 做人工智能项目是什么感觉

这个你可以在公司内部做

或者外包给一个团队去做

但无论如何,你都需要做第二步

就是在公司内部 建立一个人工智能团队

并且提供广泛的人工智能培训

这些培训不仅仅要提供给 工程师,也要提供给经理

部门领导和,高级管理人员

同时还需要培训他们 如何思考人工智能

做完这个之后, 或是做这的同时

你将会对人工智能是什么 有一个更加深刻的理解

接下来对很多公司来说,

制定一个人工智能策略 是十分重要的

最后,保证内外部沟通一致

那么所有的相关人员,从员工

顾客到投资人都将清楚知道

你的公司是如何在人工智能的 兴起中找到前行方向的

人工智能在软件行业提供巨大的价值

并且会持续这样

它同时也在软件行业之外

提供了无可估量的价值

如果你能帮助你的公司 变得擅长使用人工智能

我希望你能在创造这样巨大价值的过程中

扮演领导者的角色

在这个视频中,

你了解到什么样的公司 是一个好的人工智能公司

并且简单地了解了 人工智能转型手册

我会在下一周提供 更多这个手册的细节

并且我也会提供一个能帮助公司

变得擅长人工智能的路线图

如果你有兴趣的话, 网上有一个公开的

人工智能转型手册

为你详细罗列出了 这五个步骤的具体细节

下周你也会更多地了解到这方面的内容

在进行人工智能项目时,

比如试点项目, 会遇到的一个难点

就是明白人工智能到底 能做什么,不能做什么

在下一个视频中, 我想为你展示并且举几个

人工智能可以做什么 和不能做什么的例子

来帮助你更好地 选择能让人工智能

被高效运用到你公司的项目

让我们进入下一个视频吧!

6、

在这个视频和下一段视频中

我希望能帮你 明白

AI能做什么和不能做什么

实践中,我和工程师通常

会在某个AI项目开始前

进行足够的技术调研

确保项目在技术上可行

这意味着看看数据,看看输入A和输出B

然后直观思考

这些数据是否能用上AI

不幸的是,有些CEO

会对AI有不合理的期待,

要求工程师做一些 AI技术还达不到的事情

造成这样的困扰, 是因为媒体

和有些学术文献

只报道有关

使用AI成功的案例

我们会看的一系列成功的故事

但却没有失败的案例

人们就会认为AI什么都能做

但事实并不是这样

所以,我希望通过 这个视频以及下一段视频

向你展示一些案例,介绍

哪些可以使用现今 AI 技术

哪些不能

我希望这能够帮助

训练你的直觉,去

帮助公司

选择有几率成功的项目

前面,你已经看的了一个列表

包含了一些 AI 项目

从垃圾邮件过滤、语音识别,

到机器翻译等等

有一个判断监督学习

能做什么不能做什么

的不完美经验法则是:

几乎所有你可以

一瞬间完成的事

我们在现在或者将来

都可以用监督学习来完成

利用这个“输入-输出”的映射关系

如果你想

判断周围车的位置

那这件事你可以在一瞬间完成,

又如,你想知道手机上是否有划痕

你只要看一眼

就可以瞬间得出判断

当你想要理解

或者转述别人说的话

这不会需要超过几秒的时间

虽说这是一个不完美的经验法则

但这确实是一个快速

判断哪些任务是AI可以办到的

相反的

有些事现今AI技术还无法达到:

(比如)分析市场并写一份50页的报告

(因为)人类还不能

在一瞬间写完一份50页的分析报告

这很难,至少我不能。

我不认为当今世界上有任何一个团队

知道如何

让AI系统做市场调研

然后写出一份相信的分析报告

我发现一个最好的

锻炼直觉的方法,就是看具体的例子

那就让我们看一个具体的例子:

智能客户支持的例子

就来看一个卖东西的网站的例子吧,

这是一家电子商务公司

里面有一个客户支持部门,

某天收到了这样一封电子邮件:

“我订购的玩具比预计晚到了2天,

这导致我我不能及时地把它作为生日礼物送给我侄女

我能退货吗?“ 如果你想要一个AI系统

在看这封邮件, 然后判断出这是一个退货申请

并且能将这封邮件直接转到退货部门

那我认为这个问题

用一个AI系统来解决是可行的

这个AI系统

把顾客的邮件的内容 当做输入(A)

然后,AI系统会判断出

这是一个退款申请、还是一个运输问题

还是其他申请

作出这个判断后

才能把这份邮件转到公司最合适的部门

--- 在客户支持中心里

因此,输入A就是邮件内容

输出B就是这三个判断中的一个:

  1. 退款问题, 2. 运输

或者物流进度查询问题, 3. 是一个其他类型的问题?

那么,这就是今天人工智能所能做的

下面是一些AI系统现在

不能完成的例子:如果你想要

AI系统根据一封电子邮件的内容, 然后自动生成

这样的回复:“哦,非常抱歉,

我希望您侄女的生日过的很好。

是的,我们可以帮您(退货),等等”

如果想让AI系统输出

类似这样一段复杂的文字

这对当下的AI系统来说,还是很难 的。事实上,

就仅仅展现出对你侄女生日的遭遇感同身受

都很难做到的

特别是你会收到很多不同类型的邮件

那有没有可能使用

一种机器学习工具,比如

深度学习算法来尝试完成这件事?

假设你给一个AI系统,

输入这个顾客的电子邮件

然后让它输出两到三个段落来

展现出感同身受和适当的回应

假设您有一个中等大小的数据集,比如

1000个用户电子邮件示例 和适当的回应

你会看到的是,

基于这种类型的数据,给AI系统

一个小的数据 -- 比如1000个示例,

这可能是你能得到的结果:

比如,一位用户发电子邮件说:

"我的箱子坏了"(顾客说)

“感谢您发来的电子邮件”(AI回答)

(顾客问)“我在哪里写评论”,(AI 回答)“感谢您发来电子邮件”

(顾客问)“退货政策是什么?”,(AI 回答)“感谢您发来电子邮件”

出现这种问题的原因是,

仅用1000个数据,来搭建一个AI系统

去学习如何撰写两到三段

合理的并且感同身受的回应

(这种数据量)是远远不够的

所以结果就只能是

不管顾客发送什么内容的邮件,这个AI

只能生成简单且相似的回应 --

-- “感谢您发来的电子邮件”,

还有一种错误的情况,

(另一种AI系统失败的案例)

就是它自动生成错乱的内容,比如:

(顾客问)“我的快递什么时候到?”,

(系统回复)“谢谢,是的,现在,你的”,这是胡言乱语。

这其实是一个很难的问题,就算

有1万个甚至10万个电子邮件示例,

我也不知道这个数据量

是不是足够多,以此确保AI系统可以实现这些功能

判断什么功能AI能和不能达到

是一个漫长且艰难的过程,

我通常不得不问

开发团队,有时候会花费几周的时间

深入了解技术

来帮助我决策这个项目的可行度

但是,为了锻炼你的直觉

来帮助你快速判断项目是否可行

这里有两个其他的经验法则

来判是否一个

机器学习的问题

是容易变得可行的。

第一,(机器)只是学习一个“简单的概念”

这更有可能实现

那什么叫做“简单的概念”?

这没有正式的定义

但可以这样理解,这个概念

不超过一秒

或者几秒的思考

就能得出一个结论,

类似这种概念就可算是一个“简单的概念”

例如,你在

一辆自动驾驶汽车里看向窗外,

那察觉其他车辆的位置,就是一个相对简单的概念

而如何写一个感同身受的回应,

来应对一个复杂的用户投诉

就不是一个简单的概念

第二,有大量的可用数据

会让机器学习问题更可行

这里的数据是指“输入A”和“输出B”

你的目标是让AI系统学会从A到B,

输入和输出映射关系

例如,在客户支持程序中

“输入A”代表的是

客户发来的电子邮件,“输出B”可以是

这些电子邮件的类型 --

-- 退款申请, 运输问题申报,

其他问题的申报 --

这三种结果之一

所以,如果你有成千上万的有A和B的电子邮件

那你建立

一个机器学习系统

来做这件事的概率将会很好

AI相当于是现今的电力

它正在改变每一个行业

但它并不是魔法

它不能完成全世界所有的事情

我希望这个视频,可以开始帮助你

锻炼你的直觉来思考它能做什么不能做什么

同时,帮助你

为你的团队选择

更加可行和有价值的AI项目

为了继续帮助你锻炼你的直觉

我想让你看看

更多的关于AI的能与不能例子

我们下节课见

7、

能开始擅长分辨AI

的能与不能的挑战之一

是我们确实需要亲眼目睹

一些AI成功和失败的真实例子

如果你平均每年做

一个新的人工智能项目,

那么看三个例子就会花费你

三年的工作经验

那真是很长一段时间

我希望

在本视频中(以及前一个视频)中

快速向你展示

一些AI成功和失败的例子,

或者它能做什么和不能做什么

以便在更短的时间内,

你可以看到多个具体的例子

帮助磨练你的直觉并选择有价值的项目

那么,我们来看几个例子吧

假设你正在制造一辆自动驾驶汽车,

这是人工智能可以做得非常好的事情,

它可以拍摄汽车前面的东西

也许只使用相机,

也可以使用雷达等 其他感官或激光雷达。

然后弄清楚,

它们的所在位置。

或其他车在哪里。

那这就是一个AI问题,输入A

就是车辆前方的图片,

或者可能是图片加上

雷达和其他传感器数据

输出B是,

其他车的位置

现如今自动驾驶汽车行业

已经找到了如何

收集足够的数据, 且有相当好的算法

来做到这一点

这个例子就是现今人工智能所能做的

接下来,这是现今人工智能 无法做到的例子,

至少这对现今人工智能还是非常困难,

即输入一张像这样的人类图片

然后输出这个人的

意图。

比如,这张图是一个建筑工人

伸手让你的车停下来,

这张图是一个想搭便车的背包客,

这是一个骑自行车的人,

她伸出左手表示想要左转,

所以,如果你试图构建

一个系统来学习A到B的映射,

其中输入A是

这些不同的人类手势的短视频,

并且输出B是,

对这些手势意图的判断,

那这个在今天还是很难做到的

部分问题在于

人的手势可以有很多不同的动作

就是说,你可以想象出很多不同的手势

要求车辆减速或停止

也就是说,人们可以做出的

不同种类的手势非常之多。

因此,很难从成千上万不同的

对你做姿态的人手中,

去收集足够的数据

来捕捉人类手势的丰富性,

更别说每一个人都可能有很多不同的手势

因此,从视频中来学习这个人的意图

实际上是一个有点复杂的概念

事实上,有时一个真人

也比较难去判断出一个手势的意图。

第二,因为这将

是一个对人生安全很重要的应用程序,

你会想要一个非常准确的

人工智能来确定

一个建筑工人是想让你停车,

还是想要你继续开。

这使这类AI系统更加困难

如果说,今天你只收集

10,000张其他汽车的照片,

许多团队将构建一个至少

具有检测其他汽车的基本功能的AI系统。

相比之下,即使你

收集了10,000人的照片或视频,

但从中也很难找到

10,000个对你的车挥手的人

就算是有了这个数据集,

我还是认为现在很难建立

一个人工智能系统来非常准确地

识别人类手势的意图,

以便在这些人周围安全驾驶。

因此,这就是为什么现今

许多自驾车队都有

一些用于检测其他车辆的部分软件功能

他们确实依靠这些技术来安全驾驶。

但很少有自驾车团队

试图依靠人工智能系统识别出

多种多样的人体姿势

并依靠它来安全驾驶

让我们再看一个例子,

假设你想构建一个AI系统

来查看X射线图像并诊断肺炎。

所有这些都是胸部X光片。

因此,输入A可以是X射线图像

输出B可以是诊断,例如

这名患者是否患有肺炎?

所以,这是AI可以做的事情

但AI不能做的

从10张解释肺炎的

医学教科书章节中

诊断出肺炎

人类可以看一小部分图像,

比如几十张图像,

再读几段医学教科书中相关的内容

就能大概开始理解究竟。

但说真的,我不知道,

如果给AI系统一本医学教科书,

什么应该是它的输入A和输出B?

或者如何将此作为

一个人工智能问题做。比如,

如果只有10个图像和几段文字,

我们怎么写一个软件来

描述胸部X射线中的肺炎

应该是什么样子。

但是,对一个年轻的医生来说,

在看几十张医学图像,

并且读上几段医学教科书,

这个医生可能就会开始学会怎么分辨肺炎。

相比之下,人工智能系统

今天真的无法做到这一点。

总而言之,以下是

机器学习的一些优点和缺点。

机器学习在试图学习一个

简单的概念时会运作良好

例如你可以用不到

一秒的脑力就可办到的事情,

以及有大量数据的事。

机器学习往往在你试图

从少量数据中学习复杂概念时

效果不佳。

人工智能中第二个

未被充分认识的弱点是:

用系统从未见过的新类型数据时执行任务,

这往往会让它表现不佳

让我举个例子,

假设你建立了一个监督学习系统,

使用A到B的映射来学习从图像中诊断肺炎,

这些是非常高分辨的胸部X射线图像。

现在,假设你把这个AI系统

应用于另外一个医院

或不同的医疗中心,

碰巧那里的X射线人员让

患者总是躺在一个奇怪的角度

或有时找出的x光有很大瑕疵。

不晓得此时的你能否观察到图像中的结构,

这里有其他物体在患者的上面。

如果人工智能系统

从左侧的数据中学习,

这些数据可能是从高质量的医疗中心获取的,

然后你把这个人工智能系统应用到

另外一个医疗中心,那里只有

类似如右侧的图像,

那AI的功能不会很好。

一个优秀的AI团队要能够改善

或减少这些问题,

但这并不容易。

这是AI

相比人类弱得多的方面之一

如果人类从左侧的图像中学习,

他们会很快适应

右侧的图像,这是因为人可以

看出来图片的不同是因为患者平躺的角度导致。

但是,人工智能系统

在新的数据面前

举一反三的能力

可能不如人类医生。

我希望这些例子可以帮助你锻炼

你对AI的能与不能有好的直觉

当它的能与不能之间的界限

对你来说还是很模糊,请不要担心

这是完全正常的,没有关系。

即使在今天, 我仍然无法在看到一个项目后

立即判断它是否可行

我在形成对某些项目的可行性

下定论之前,

我经常需要做

数周的技术调查

但我希望这些例子

至少可以帮助您开始想象

公司中可能可行且

值得探索的一些事情。

接下来的两个视频是可选的,

是对神经网络以及深度学习的

非技术性描述

请随意观看。

接下来,我们将更深入地了解

构建AI项目的

过程是什么。

我期待下周还能见到你

8、

深度学习和神经网络这两个术语 在AI中几乎可以交替使用.

并且,即使它们是非常棒的

机器学习工具,它们还是被炒作弄得有点神秘

这段视频将揭开深度学习的神秘面纱,

这样的话,你会真正了解什么是深度学习和神经网络

让我们使用一个预测市场需求的例子,

假设你正经营一家卖T恤的网站

你想知道,根据T恤的定价,

你大概可以卖出多少件T恤

接下来,你可能会有像这样的一组数据集,

T恤的价格越高, 需求越低.

所以你可能会用一条直线去模拟这个数据,

以此模拟价格的越贵,衣服卖得越少的现象

注意,卖出的件数是不可能低于零的,

也就是说当价格超过某个点后,

你认为 几乎没有人会买这种T恤.

这条蓝线其实是神经网络的最简单形式

价格可以作为输入A,

输出结果B就是估计会售出的件数。

也就是说你可以这样画这个神经网络,

把价格输入进这个圆形的东西

然后这个圆形会估计售出的件数

在人工智能的术语中,这个圆形的东西叫做

一个神经元,有时也被称为人工神经元

它的功能就是计算我画在左边的这条蓝色曲线

这种只有一个经元的网络算是最简单的神经网络

只需要输入价格,输出预估的需求

如果你把这个小圆环想成一块乐高积木

那神经网络可以看成是堆加乐高积木

直到你建出一个很大型的神经网络

让我们来看一些复杂的例子

假如你不仅有体恤的价格,

你还有顾客所需支付的邮费,

你也许还有每周在广告营销上的花费,

你可能还会选择不同材质来做T恤,比如高级的棉材料,

或者更加轻薄便宜的材料。

这些都是你认为会影响

客户对体恤的需求的因素

让我们来看看更复杂的神经网络的样子吧,

你知道你的顾客群很在意价钱,

假设这有一个神经元,我现在用蓝色画出它,

它的工作是预估客户群是否愿意买,

而购买力主要由

体恤定价和邮费决定

第二个影响客户需求量的是消息渠道,

也就是说,你的顾客知道你在卖这件体恤吗?

影响消息渠道的是你的广告营销

让我在这里画出第二个人工神经元,

它把你的广告营销预算作为输入

来输出顾客们对体恤的认知程度

最后一点,广告营销会影响顾客

对T恤质量的感觉,也就是说

顾客对你产品的质量的预判是受广告影响的,

东西的价格本身也会影响顾客对产品质量的预判

那这里我要画第三个神经元

来输入价格,营销,和材料,

来试图估计顾客对T恤质量的判断

这些前期神经元,即这些蓝色的神经元

就可以算出价位负担性,客户认知程度,和

客户对质量的判断,然后在这里多用一个神经元(黄色)

给它输入这三个因素,并且最终输出预估需求量

那这就是一个神经网络了,它的工作

就是学习这四个输入值,即A,

到输出值,即B(预估需求量)的映射。

神经网络就是用来学习这种输入输出,即AB映射的

这是一个相对较小的神经网络,只有四个人工神经元

在实际操作中的神经网络往往要大得多

动辄就有成千上万甚至更多的神经元

这里有一个小细节我需要具体讲一下,

在我刚刚描述神经网路的过程中,

你可能觉得你必须先弄清楚哪些因素决定需求,

比如可负担性,认知程度和产品被预判的质量

但是!神经网路的绝妙之处就在于

当你用神经网络来创建一个机器学习系统时,

你只需要给它输入A和输出B就可以了

它自己会把中间所有的事情搞清楚

所以建立一个神经网络,你需要做的就是

给它大量的数据,即输入A,像这样

把这些蓝神经元输给一个黄色神经元

并且你也需要标明输出的数据,比如这里的客户需求

接下来就让软件来弄清楚这些蓝色需要计算什么

从而能完全自动化地,精准地

学习由输入A到输入B的功能映射。

事实证明,只要你给它足够多的数据

并且训练一个足够大的神经网络

它能极好地学习出从输入A到输出B的映射

那么,这就是一个神经网络了。它就是一组神经元,

每个神经元会计算出一个相对简单的函数

但当你把它们像乐高积木那样堆叠在一起的话

它们可以计算出极其复杂的函数,这些函数

能极其精准地学习出输入A到输入B的映射

在这个视频中,你看到了神经网络

用于需求预测的例子

让我们在下一个视频来看一个更加复杂的例子吧!

剧透:用神经网络做人脸识别

9、

上个视频中

你看到怎样用一个神经网络

来预测需求,

但是神经网络是如何识别图片的呢?

并分析出图片里是什么呢?

或者它如何能在听到一段语音后,

明白语音的内容呢?

就让我们来看一个更复杂的例子 --

-- 用神经网络来识别人脸

比如你要建立一个能从

图片里认出人脸的系统

那一个软件是

如何能看到这个图片之后,

去明辨这个人的身份呢?

让我们把图像的小方格放大

来更好地理解电脑是怎样读图的。

这个方格对你我来说是人眼,

而电脑看到的则是

一个由像素亮度值

组成的表格

这个表格告诉电脑

图片里的每一个像素有多亮

如果这是一个黑白或者灰度图像的话

那每一个像素会以一个单独的数来呈现

来告诉你那个像素有多亮

如果是一个彩图的话

那每个像素回以三个数来呈现,

用来表示红,绿,蓝这三个

元素分别在那个像素里有多亮

所以神经网络的工作是把这些数字

作为输入,然后告诉你

图里面人的名字。

上个视频中

你看到了神经网络是如何把

四个数字 -- 分别代表

价格,运费,营销力度,体恤原料--作为输入,

然后输出客户对T恤的需求量。

在这个图像例子中,神经网络

需要输入多得多的数字来分别对应

这张图片里的像素亮度值

如果这个图片的分辨率是

长宽各一千像素(1000 * 1000)

那么总共就是一百万像素

所以,如果有一个黑白或者灰度图像

这个神经网络需要把一百万个数字作为输入

以此来对应这张图片中

所有一百万个像素的亮度

如果是一个彩色图像的话

神经网络需要把三百万个数字

作为输入,因为红蓝绿三原色

每一个都有一百万个像素的亮度

跟之前类似,你将会有很多很多

这些人工神经元来计算很多不同的数值

但不需要你来决定

这些神经元需要计算什么

神经网络自己会计算出来的。

一般来讲,当你给它一个图片时

神经网络前期的神经元

会学会探测出图片的边缘

然后后期一点的会一点点

辨认出物体的各个部分,

它们会学着辨认出鼻子,眼睛

脸颊和嘴巴的形状

然后再晚期一点的神经元,像右边这样的,

会学习辨认出不同的脸型

并且最终将学会

将这些元素融合在一起

来分辨出图片中的人是谁。

再次强调,神经网络的魔法就在于

你并不需要知道神经网络

里面到底在干嘛,

你只需要

给它很多像A这样的图片数据

和像B这样的正确人脸的身份标签,

然后这个学习算法

自己就会弄清楚这中间的

每一个神经元需要计算什么!

恭喜你看完了

这周所有的视频

现在你知道机器学习和数据科学是如何运作的了,

我很期待在下周的视频中见到你

你将学习如何建立

你自己的机器学习或者数据科学项目

下周见

监督学习
监督学习:通俗来讲,我们知道需要输出的什么,也就是说,我们知道所寻求的目标是什么类型的,然后告诉程序,让程序给出准确的判断。比较简单的数学表达是:A表示数据集,或者是一个物体的特征集,B表示输出集,就是我们所期望的输出结果所组成的集合,或者说是空间,(学习的数学多了,感觉用空间来描述还是更舒服一些);机器学习就是为了学习一个从A->B的映射,根据学出来的这个映射,我们就可以抽象出其物体的特征,然后作为输入,得到我们所期待的输出。
常见的例子:垃圾邮件分类,语音识别,机器翻译,在线广告,无人驾驶,视觉检测…
机器学习性能的分析
在这里插入图片描述

总而言之一句话:性能和数据量是有关系的,但还与模型的复杂度有关,这里的这个复杂度主要是指神经网络的深度。所以这里也就给了我们一个非常重要的启示,并不是说盲目的收集数据就能够提高模型的性能,还与我们对模型的认识有关,如果对模型有足够的认识的话,我相信,你一定不会盲目的去手机数据,而是想凭借自己的了解改进自己的模型,当然,如果你对模型了解不够深入,这定然很慢取得好的性能。

What is data?11分钟
直观上认识数据
举一个简单的例子:数据集存储在一个巨大的Excel表格中,其中这个数据集中的A和B是哪些列(如果修过机器学习的话,那么会很习惯的将每一列想象成一个个的特征)是A,哪些列是B。这个并不是固定的,还是由你所需要什么而确定的,专业点来讲是由业务决定的。
获取数据的方法
手动标记数据,从用户行为中获取(意为:从现实世界中物体的表现中获取,将这种行为作为数据收集起来,进行学习),从网上下载,比如爬虫 。
滥用数据的例子:
在这里插入图片描述
首先收集大量的数据集,然后交给AI团队去进行训练,这种效果往往不好。
这里的意思是:我们可以首先收集一些数据交给AI团队进行训练,然后AI团队会根据模型的表现进行模型估计,发现模型性能不好的问题,产生需求,从而确定所需要的数据的类型,反馈给IT团队去做,这种循环反馈的进行往往比较有效
盲目的认为大量的数据一定是有价值的。诚然,数据是有价值的,但是很多人确很难从中找出这些数据的价值。而比较好的办法是:把已有的一些数据交由AI团队处理,根据团队的反馈,有针对性的去获取数据,这种反馈可以告诉你 什么样的数据在当前是有价值的,什么样的数据在当前是没有价值的。
数据混乱
输入不好的数据,当然也就不会有好的输出,这里的输出并不是指的预测输出,在没有进行机器学习之前,提预测输出不觉得有点早吗!这里的输出是值得学习输出,输出的映射,可以认为是模型,这个模型本来就不是合格的,那么很难用它进行预测!
数据的问题:现实中的问题肯定是非常多的。这里仅仅例举了一些。不正确的标签,不合理的标签,不符合现实意义的标签(比如数学上所谓的不再值域内)。空值,又是所谓的缺失数据,缺失的数据不处理掉,肯定会对模型的训练产生影响。
显然,进行训练之前,需要大量的数据处理工作,数据处理的好与坏,还会影响了模型的性能。
各种各样类型的数据:总体而言,结构化数据和非结构化数据。结构化数据:比如Excel表格,数据库中的数据。非结构化的数据:语音,文本,图片,视频…

The terminology of AI9分钟
AI术语
机器学习和数据科学的直观理解
通常说的机器学习,更多的是指一个正在运行的应用系统,比如一个APP所实现的一些智能化的功能,一个软件所实现的智能化的功能,其实可以非常容易的发现,现在很多应用上都有机器学习的身影。
数据科学更多的是发现数据的某些规律,以对我们的决策提供参考。
机器学习和数据科学的比较正式化的理解
机器学习可以使得计算机学习一些不用通过具体的代码给出的功能。可以认为这是一种数据的规律,计算机利用这种规律做出智能化的行为。更多的是表现在软件的功能上,系统的功能上。
数据科学是从数据中获得某些知识,或者是规律,或者是视野(这里的意思相当于眼界,通俗理解为解决问题的思路,方案),以得出某种结论,帮助我们决策。主要表现为某种用于参考的结论,或者是在PPT中介绍的解决某种问题的方案。
例子:
深度学习

机器学习中有一种算法叫神经网络,主要应用在监督学习上,通过设计更多层,更大型的神经网络我们可以得到更优秀的学习算法,这就是深度学习主要的内容。深度学习的主要内容就是神经网络,可以说这两个概念是相等的,只不过"深度学习"这个更具有品牌效应。
上面这就是一个简单的神经网络,其中一个个的小圆圈叫做神经元,最初设计神经网络是受到了大脑的启发,但是它的工作方式跟生物大脑的工作方式完全无关。所以,请记住了,不要再听别人炒作说:神经网络的实现方式是模仿的大脑。准确来说,他们没有关系。不过,神经网络跟门电路颇有相似之处。
讲的更多一点,利用这么多的神经元,通过设计大型的神经网络,它可以自己输出很多特征,就像物以类聚,人以群分一样,它可以自动的把很多类似的东西聚集到一块去,于是就形成了一派一派的效果,利用这些派别似的东西,可以进行预测和判断某些性质,然后进行输出。
AI的工具
最强有力的三大工具是:机器学习,数据科学,深度学习。这写工具之间有很多交叉的地方,但各有利弊,各有其存在的价值,各有其适应的场合。
其他的一些工具:无监督学习(其实也是属于机器学习内的,不知道为什么划分到这里来了),强化学习,图模型,知识图谱…
包含关系
AI包括机器学习和其他众多的算法,,机器学习包括深度学习。数据科学与AI的机器学习,众多算法,深度学习有很大的交叉,但数据科学又不仅仅限于这些东西

What makes an AI company?7分钟
利用AI帮助公司
正确认识互联网公司
比如说:一个公司利用了一些IT技术,那么他就是一家互联网公司吗?实际上并不是,有的时候,即使你使用了AI实现了某些功能, 可能你还只是一个传统的公司。我认为一家互联网公司应该是:利用互联网这个工具可以是你的公司做的更好。互联网公司的业务周期很短,迭代很快,另外,互联网公司的决策制定可以下推到工程师和其他的专业人员,因为互联网公司中,这些人可能更懂产品和技术,更了解用户的需求。
与上一个类比之下的AI公司
一个公司配置了神经网络,或者说其他的机器学习算法,并不能称的上是AI公司。所以问题还是:你在做AI能够让你做的更好的事情吗,换言之,你利用AI做的事情,能够让你的公司做的更好吗?
AI公司擅长数据集采集的战略,如何费更少的人力和财力以获得最大量的数据集。
统一数据仓库。这里提到了一个非常重要的问题就是隐私保护问题,要十分注意隐私保护。统一的数据仓库更有利于工程师们发现数据的秘密。
会有十分普遍的自动化的产品。这是显然的。
因此,对于一家AI公司而言,擅长AI意味着,为公司设计一些AI可以做的很好的什么事情,以帮助公司的业务。转换到AI并不是一蹴而就的,也是需要过程的。并且也是一个比较系统化的过程。
AI的转换

  1. 执行一些试点项目以获得动力。这是比较显然的,刚开始进行转变肯定要进行试点,通过这样的试点,你可以更了解自己的公司的情况,更了解AI与公司业务的结合的情况,从而做出合理的调整。
  2. 建立自己的AI团队,并逐渐扩建强大。一个成熟的团队就像一把尖刀,可以非常厉害的解决问题。
  3. 提供AI培训。帮助自己的内部人员,高层人员,新手更加了解AI,使得组织交流更有针对性,交流起来也会流畅。也能够加强自己的建设。
  4. 制定人工智能战略。战略是长期的战略,作为已经稍有成就的团队而言,指定长期的战略也是自然的事情,不过关于战略指定的优劣跟眼界还是有很大的关系。
  5. 发展内部和外部的交流。发展对内的交流,一方面是内部调整,以方便自己的组织人员了解公司的计划从而做出合理的调整。对外部也是类似的道理,有利于客户做出合理的调整,甚至于有利于吸引客户。
    有一个词非常好,叫“拿捏”,纵观以上五条,都可以用这个词来形容一下,无论是在哪一个阶段,只要拿捏的好,我相信效果一定是非常显著的。
    软件行业,

What machine learning can and cannot do7分钟

More examples of what machine learning can and cannot do8分钟

Non-technical explanation of deep learning (Part 1, optional)7分钟

Non-technical explanation of deep learning (Part 2, optional)3分钟



Week2

完成时间为 1 小时

Building AI Projects

8 个视频 (总计 52 分钟)

显示更少

8 个视频

Week 2 Introduction1分钟

Workflow of a machine learning project6分钟

Workflow of a data science project6分钟

Every job function needs to learn how to use data6分钟

How to choose an AI project (Part 1)7分钟

How to choose an AI project (Part 2)8分钟

Working with an AI team8分钟

Technical tools for AI teams (optional)6分钟

1、#
欢迎回来 上周你学到了

一些 AI 和机器学习的基础

但你如何在项目中使用这些技术,

无论你是想在那些“神奇车库”里做项目,

(许多硅谷出身的著名企业都是从创始人的车库发家的,像苹果,谷歌,惠普等)

还是你想在一个更大的公司里做,

或者甚至是做一些

跟你公司战略相符的东西,

让我们一起探索一下, 在这一周里,

你将学到 AI 项目的工作流程

不同的项目有不同的步骤,

就像一个生日派对

有一些特定的流程那样。

首先,你会写出嘉宾列表,

然后选择一个场地, 预定生日蛋糕,

还有发送邀请函等等。

一个 AI 项目也是如此,

有一些既定的步骤

这里,你会学习到

AI 项目的工作流程,

并对构建

AI 项目有些感觉。

其次,你会学到如何选择 AI 项目

表面上看,你会觉得有很多事情需要做。

这周你还会学到一个大概的模式

以帮助你自己,或和朋友一起进行头脑风暴

去选择一个可行的项目去做。

这也可以帮助公司在

选择大项目上有帮助。

最后,你会学到如何组织数据和团队,

这不论对你自己或是和朋友一起,

亦或是企业里更大规模的队伍,

都是重要的。

我们会学习AI 项目管理,

包括组织数据,管理团队。

这一周结束后,

你会知道怎样构建自己的 AI 项目,

也许你可以开始和朋友尝试

一些可行的想法。

我们下一节再见

  1. #Workflow of a machine learning project

机器学习可以学习从输入

到输出,或A到B的映射

那么,你该怎么搭建一个机器学习的项目呢

在这个视频中,你会学到

机器学习项目的工作流程

让我们开始吧

我用语音识别系统来举例

有些人也许有亚马逊智能音箱或是谷歌Home

或是苹果Siri设备,百度DuerOS设备

几年前,我参与了

谷歌语音识别系统的研发

同时也领导了百度的DuerOS项目

在我的厨房里有一个亚马逊智能音箱

因此,每次我要煮鸡蛋的时候,我会说 'Alexa

计时3分钟' 然后它就会

在3分钟后提醒我鸡蛋熟了。

那么,你该如何搭建

一个能知道你在说

‘Alexa‘,‘嘿,Google‘

或是”嘿,Siri','你好,百度'

的语音识别系统呢

让我们来看一看机器学习项目的

关键步骤

简单起见,我将使用亚马逊智能音箱或者

识别‘Alexa‘这个关键词作为例子

如果你想搭建一个

能在用户说出'Alexa'这个词时进行有效识别的

AI系统或是机器学习系统

第一步就要收集数据

那也就是说,你得到处走

然后让人们

来说这个词'Alexa'

然后你把这些语音记录下来

你同时也需要收集其他的词

例如'你好'等很多其他的词

并且录音下来

当你收集了非常多音频数据

也就是很多不同人说

‘Alexa ‘或其他词语的音频片段后

第二部就是训练模型

就是说你需要利用一个机器学习算法

来学习从输入到输出,或者是A到B的映射

这里输入A就是一段音频片段

当使用上面这第一个音频片段的时候

希望它能够告诉你,片段里说的是

'Alexa', 而在播放第二个音频时

也就是右边那个时

希望系统能够学会

识别用户说的是'你好'

每当一个人工智能团队尝试着去训练模型时,

即学习A到B,或输入到输出的映射时,

很常见的现象是,

第一次尝试的效果都不好

所以团队总是需要尝试很多次

在人工智能领域,

我们把这个叫做反复迭代

你需要多次迭代,直到

模型看起来足够好为止

第三步就是“派送”模型了,

意思是,你需要把这个AI软件

放进一个智能音箱里,然后送到

一小群测试用户,

或是一大群用户手中

在运输之后

很多AI产品都会发生这种情况,

就是它开始收集新的数据

但是效果也许不像你最初所希望的那么好

举例说,我来自英国

所以我将会选择英式英语

但如果你的

语音识别系统是

被美式口音的人训练的

然后你将这个智能音箱运输到英国

那么就会有英式口音的人对它说'Alexa'

这些人就并不会像你所希望的那样

觉得这个语音识别系统很好用

当这种情况发生时

你最好能将这种情况的数据回收

比如对一个英式口音的用户来说

Alexa表现并不理想,这时你可以

收集这个用户的数据

去维护和更新模型

总之, 以下是机器学习项目的关键步骤:

收集数据

训练模型

即A到B映射

然后派送模型

在这些步骤中,

通常会有很多的反复更改完善的过程,

也就是说微调或者是使模型变得更好用

或者是即使寄出模型之后,

你还要继续收集新的数据,

使你能让产品变得更好

但这一步取决于你是否能

获取那些新的数据

让我们来看看如何把这三个步骤 应用于

一个不同的项目中

现在我们想建立 一个自动驾驶汽车的关键组成部分

快速回想这三个步骤是什么,

他们是收集数据,训练模型

和派送模型

在下一幻灯片中我们会再次回顾这些步骤。

假设你在制造一辆自动驾驶汽车,

自动驾驶汽车的关键组成部分之一是

机器学习算法,它能输入,

比如说,一张展示你车前有什么东西的图片

来告诉你其他的车的位置。

那么建立这个机器学习系统

的第一步是什么呢?

希望你还记得住上张幻灯片中的内容

第一步是收集数据

如果你的目标是让这个机器算法

把图片作为输入,

然后输出其他车辆位置的话,

你所需要收集的数据

既要有图片(输入)

也要有人工智能系统能的输出

即其他的车的位置。

假设你用几张

这样的图片开始

这些就是机器学习算法的输入A

你还需要告诉它你想要的

输出B是什么。

所以,在每一个图片上

你得在你想要在被系统识别出的车的周围

画这样的长方形

在这张幻灯片上, 我是徒手在画

这些长方形,但实际操作中

你需要用一些软件

来画出完美的长方形,

而不是像这种手绘的。

在创建了这个数据库之后

什么是第二步?

希望你还记得,

第二步是训练这个模型。

当你的人工智能工程师开始

训练这些模型时,

他们总会发现一开始模型并不能很好的运作

比如,我们现在有这张照片,

也许软件最开始的几次尝试

会认为这(方形里的 )是一辆汽车

只有通过多次改进后你才有希望

得到一个更好的模型

来判断出这里才是汽车所在的位置

最后, 第三步是什么?

它就是派送模型。

当然, 在自动驾驶的世界里

安全是头等重要的。

要在保证安全的情况下再派送

或测试你的模型。

当你把软件装入汽车上路时

你可能会发现软件并不能

很好判别出一些新型汽车,

比如说高尔夫球车。

所以你会回收数据,

比如这些高尔夫球车的图片,

用以维护和更新

这个现有的模型

这样的话,你能让你的人工智能软件

不断地变得更好

好到一定程度时,这个软件

能从这些图片里

辨识出其他的汽车

在这个视频中,你学习了

机器学习项目的关键步骤

即收集数据,

训练模型,

和派送模型。

在下一个视频中我们将学习

数据科学项目的工作流程中,

即它有哪些关键步骤?

我们下一节再见

  1. Workflow of a data science project

和机器学习项目不同,

数据科学项目成果

常常是一系列可以指导行动的见解和观点。

这些观点可能会

让你的采取不同的行动

所以,数据科学项目与

机器学习的工作流程不同。

让我们看看

一个数据科学项目的步骤。

让我们举个例子,

比如你希望优化一个销售漏斗,

比如你在运营一个卖咖啡杯的电子商务平台

或者是在线购物网站,

所以当一个用户

从你这购买咖啡杯时,

他们常常需要经过一系列步骤。

首先,他们将访问你的网站,

浏览不同的马克杯,然后

他们点进某个产品的详情页面,

然后他们把商品放入购物车,

然后,进入支付界面,

最终他们将支付订单。

所以,如果你想优化销售漏斗

使得尽可能多的人

经过所有这些步骤,

那数据科学怎样帮助你解决这个问题?

让我们一起了解数据科学的关键步骤。

第一步是收集数据,

在我们刚刚看到的那个网站上

你可能有一个数据集记录

不同用户跳转网页的时间。

在这个简单例子里

我假设你可以了知道

用户来自的国家/地区,比方说,

通过查看他们电脑地址,

也就是IP地址,

来了解到用户

的所在地。

但是在实践中,你通常可以得到

很多用户所在地

的数据。

第2步是分析数据,

你的数据团队可能会想出

很多会影响销售漏斗的因素,

例如,数据团队也许

会认为海外顾客

因为国际运费太高而被吓退,

这可以解释为什么很多人虽然

点进了支付页面,但是最终没有下单。

如果真是这样,那么你可能会考虑

是否把部分运费

直接包含进商品价格中,或者数据团队

可能会想到在假期来临的时候,

数据是否会存在短暂的突变。

就是说,也许更多的人会选择

在假期购物因为他们要买礼物,

但也许更少的人会选择在假期购物

因为他们宁愿

待在家里而不需要

用工作电脑购物。

在一些国家,数据可能会在一天的某个时段出现短暂的突变,

这些国家人们习惯小憩一会,

像短暂的休息,比方说午休,

这些情况会导致购物者减少

在线时间,从而导致你的销量下降。

数据科学团队就会建你

在午睡的时段,减少

广告的投放,因为

少量的人会在这个时段网购。

所以,一个优秀的数据科学团队

会有很多的想法,他们会尝试

这些想法,反复迭代

许多次去获得好的见解和观点。

最终,数据科学团队

把这些见解

提炼成一系列的假设,

比如,什么可能对销量

有帮助,什么可能对销量没有用。

数据团队也可能给出经营上的建议,

比如,将运输成本纳入产品

成本中,而不要单独列出。

当你采纳这些建议

并把它们应用到你的网站,

然后你的网站需要开始收集新的数据,

因为用户的行为可能已经发生了变化,

因为你改变了在午休时间发布广告的方式

或者你改变了结算方式。

然后,你的数据科学团队可以继续收集

数据,分析新的数据

定期作出评估,并且随着时间推移提出

更好的假设,甚至更好的经营方法。

所以说,数据科学项目的关键步骤

是收集数据,

分析数据,

然后提出假设和行动,

然后继续定期地获取数据

和分析数据。

就让我们把这个框架应用到另一个新的问题中,

-- 优化生产线。

所以我们将采取这三个步骤

在接下来幻灯片中使用这个方法。

假设你运作一个工厂,

这个工厂每月制造成千上万个咖啡杯,

并销售他们,你希望能

优化生产线。

下面这些是制造咖啡杯的关键步骤:

第一步是混合粘土,

这个过程一定要加适量的水,

第二步是把黏土捏成咖啡杯的形状,

接下来,你需要给杯子上釉,

也就是,添加着色和保护层。

接下来,你需要给杯子加热

我们称之为烧窑。

最终,你应该检查

这个马克杯

是否有凹痕,

确保杯子在交给顾客之前没有损伤。

所以, 制造业中一个常见的问题是

如何优化生产线,

即确保生产出的咖啡杯尽可能没有损伤。

因为这些被损伤的

咖啡杯必须得扔掉,

这导致时间和材料上的浪费。

这个场景中开展数据科学项目的第一步是什么?

(希望你们能够记住上张幻灯片中的内容)

第一步是收集数据

比方说,你可能保存有关

混合的不同批次的黏土的数据,

例如,黏土的供应商,

黏土经过多长时间混合,

或者黏土的湿度,

添加了多少数量的水。

你也许还收集了关于

不同批次的杯子的数据,

例如,那批货的湿度有多大呢?

窑的温度是多少?

杯子在窑里烧了多久?

拥有这些数据,你可以找

数据科学团队去分析。

他们也许会重复进行多次分析来给出最合适的建议。

他们可能发现,

有时如果湿度过低,加上

窑炉的温度过高,

会导致杯子上产生裂痕,

他们可能还会发现,在中午时外部环境比较暖和,

所以在一天中不同时段,

你需要调整

湿度和温度。

基于数据科学团队提出的这些结论

你会得到一些假设性的建议,

以及如何调整生成线的策略

用以

提高生产线的效率。

进行生产线整改之后

你将得到新的数据

所以,你可以继续定期进行分析。

这样他们就可以继续

来优化生产线。

总之, 数据科学项目的关键步骤

是收集数据

分析数据,

然后提出假设和开展行动,

上一讲和这一讲,你看到了

机器学习和数据科学项目的例子。

这样讲吧,机器学习和数据科学

几乎正在影响每一个行业。

下一讲视频,我希望向你们展示

这些技术如何影响很多工作的,

这也许包括你的现有工作

以及大部分你的同事的工作。

我们下一节再见

  1. Every job function needs to learn how to use data

数据正在改变着很多不同的工作职能

不管你从事的是招聘、销售、

市场营销,还是制造业、农业等行业

数据很可能改写着你的工作职能

过去几十年来

社会正在走向数字化

以前人们经常进行纸质问卷调查

现在更加倾向于

使用数字问卷。

医生仍然会写一些手写记录

但这些记录正逐渐变成

数字档案

其他工作职能也面临同样的趋势

得到这些数据意味着

你的工作很可能类需要

数据科学和机器学习

里的工具来辅助你。

在这个视频中,我想探讨一下

不同的工作职能,以及

数据科学和机器学习会

对不同类型的工作产生怎样的影响

让我们从销售讲起

上一节视频里,你看到了

如何用数据科学优化销售漏斗

那机器学习可用于优化漏斗吗?

如果你是一名销售人员,你可能有

一组潜在客户的名单,

你可以联系他们,

并说服他们去买你公司的产品

机器学习可以帮助你对这些人进行优先级划分

比如优先给

大公司的 CEO 打电话

而不是给小公司的实习生打电话

这种自动的名单优先级排序

可以让销售人员变得更有效率

让我们来看看更多的例子。

假设你是产品生产线的经理

你已经看到了数据科学

可以如何帮你优化一条产线

那么机器学习呢?

生产制造过程有一步

是最终的产品质量检测

在现今的工厂里

可能有成千上百的人

用肉眼检查物体

可能是咖啡杯或者其他东西

上面是否有划痕,这叫做检测

机器学习可以通过

像这样的数据集

学会自动判断

一个咖啡杯是否有缺陷。

通过自动识别划痕,

既降低了劳动成本

又提高了工厂的生产质量

这种类型的自动视觉检测

是我觉得会对制造业有

深远影响的技术之一

这也是我一直在做的事情

让我们来看更多的例子

来说人员招聘吧,

当你需要招聘一个人来你公司时

会有一系列可预见的流程,

这包括你的猎头或者

其他人会发送邮件给候选人

接下来,你会进行电话面试,

让候选人来现场面试

接着,就是接受或是拒绝候选人。

就如同数据科学

可用于优化销售漏斗,

数据科学同样

可用来优化招聘流程,

许多猎头组织已经在这么做了,

比方说,你发现几乎没有人

能通过电话面试这一关,然后

进入现场面试这一关,

你可能会得出结论说,

也许太多人收到电话面试了,

或者电话面试的面试官

太严格了,

所以应该让更多人能到达现场面试这一步

这种类型的数据科学

已经对当今招聘产生很大的影响,

机器学习又在招聘中有什么用呢?

招聘流程的其中一步

是对简历作出筛选,

然后决定先和哪些人联系,

你也许会看着某一个简历然后说,“对,

让我们给这个人发邮件吧,“。然后看着另外一个简历说

“这个候选人不行。“

机器学习正在用其自己的方式

来自动筛选简历

但这其中存在着伦理问题,

比如说确保

你的人工智能系统是不能

有偏见的,它对候选人是一视同仁的。

但机器学习正在

进军招聘市场,

我希望机器学习在跻身这个市场的同时也能确保

系统是合乎伦理与公平的

在这个课程的最后一周

你会学到更多关于AI的

伦理问题

如果你是做市场营销的呢?

最常见的优化网站性能

方法是 A/B 测试

即启动两个版本的网站

比如版本 A 的按钮是红色

版本 B 的版本是绿色

看看哪个版本的点击量更多

通过这些数据

数据科学团队可以帮你获得

建设性的意见,并提出对应的假设

和执行策略,

那机器学习呢?

现今许多网站

会有针对性地给用户

推荐购买率更高的产品

这种营销方式在网站很常见

比方说一个服装销售网站,

在观察我的购买习惯以后,

很有可能就会给我推荐

蓝色衬衫,因为我基本上

只买这种颜色的衬衫

但是也许对其他的用户

会有更繁多

更有趣的推荐

然而当今这种个性化

的产品推荐驱动着

大型电商平台

大比例的销售额。

最后举一个完全不同领域的例子,

农业。

假设你是一个在轻工业农场

工作的农民

数据科学可以怎么帮到你呢?

今天农民已经在

农作物分析种应用数据科学了

你可以从

土壤条件、天气条件,以及

市场上不同农作物的价格中获取数据

然后让数据科学团队推荐

何时种植,以及种植什么作物来提高生产效率

同时又保留你的农场良好的土壤条件

这种数据科学正在并将继续

对农业起到越来越大的作用。

让我们来看看机器学习在农业中的应用,

我认为机器学习在农业上产生的

最令人兴奋的变化之一是将农业精准化,

这是我之前在一个农场上

用手机拍的一张照片

在图片的右上角是

一个棉花作物,中间是杂草

有了机器学习,我们开始

见到能用到农场上的机器学习产品,

它们拍一张这样的照片,然后

以一种很精准的方式在杂草上

喷洒除草剂

既能去除杂草

又不会喷洒过量的除草剂

这种类型的机器学习技术

正在帮助农民

提高作物产量的同时,

又有助于保护环境。

在这段视频中,你看到了

像这些不同的工作职能:销售,

招聘,市场营销,

制造业和农业

这些不同的工作职能是

如何被数据,

数据科学,还有机器学习影响的。

这就给我们一种感觉是AI有

非常广泛的应用,

但是你怎么真正去

选择一个有潜力的AI项目呢?

我们将在下一个视频中讨论这一点

  1. How to choose an AI project

如果你想要尝试做一个人工智能项目的话

你该怎样选择一个有价值的项目呢?

不要指望点子一夜之间就会出现

有时候可能可以,但有时也需要几天

或者几周才能获得一个值得追寻的想法

在这个视频中,你会看到一个帮你

头脑风暴出令人兴奋且有潜力的AI项目的框架

假设你想做一个人工智能项目来帮助你的生意,

你已了解到人工智能 不是所有的事情都能做,

所以只有某一些特定的事情是人工智能可以做的

这个圆代表人工智能可以做的事情

同时,也有一些特定的事情对你的生意

十分有价值的

就让这第二个圆代表这些十分有价值的事情

的关键

你想做的是尝试选择 两个圆相交处的项目

那么这样你选择的项目

即能够由人工智能来完成,又对你的业务有价值

人工智能专家对左边这个圈包含什么

和不包含什么了如指掌,

而你业务方面的专家比如说销售,

营销,农业或者其他东西,

会最了解什么对你的业务来讲有价值

所以在想出一个同时具有AI可行性和业务价值的项目时,

我会召集一些在人工智能领域有渊博知识的人

和业务方面的行业专家们组成一个团队一起讨论

这样他们就可以一起尝试找出在

两个集合相交处的项目

所以有时候我们称这样的团队为交叉功能团队

意思是一个既有人工智能专家

又有业务专家的团队

在对项目进行头脑风暴时,有一个我在众多公司

都使用过的框架,我觉得十分有用

所以让我分享三个如何能帮你

团队对项目进行头脑风暴的原则

第一,虽然有很多关于人工智能化 将如何取代工作岗位的媒体报道,

这确实是个需要被关注的社会问题,

但在考虑具体的人工智能项目时,我发现

如何让人工智能将具体的任务自动化 比如何让它取代工作岗位要有用,

拿呼叫中心举个例子, 一个呼叫中心有许多要执行的任务

从拿起电话,接听电话,回复邮件

到采取一些更具体的行动,

比如给一个客户进行退款申请

但在所有这些呼叫中心员工所做的任务中

可能有一个任务, 比如电话或者电子邮件导向

也许是特别适合用机器学习来进行自动化的,

通过观察这些员工做的所有任务,并从中选择一个

才能让你在短期内

选择出最有成效的自动化项目。

让我们来看看另一个放射科医生的工作例子,

有很多关于人工智能将如何取代放射科医生工作的报道,

但放射科医生实际上要做很多不同的事情,

他们看 x 光片, 这很重要

但他们也从事他们自己的再教育,

他们咨询其他医生,

他们可能会指导年轻一些的医生, 其中一些也会直接给病人进行咨询

所以通过观察放射科医生做的所有任务,

你也许能发现其中一个,比如说 用人工智能助理或者人工智能自动化来看 x 光片

能让你把它作为一个最有成效的项目来进行推进

所以就你的公司业务而言,我会建议你想想

在所有需要执行的任务中, 你是否能找出那么一个或几个

能使用机器学习进行自动化的任务?

当我与一些大型公司的首席执行官们 就公司的人工智能项目进行头脑风暴时

一个我经常会问的问题是: 驱动商业价值的主要因素有哪些?

有时找到人工智能方案或数据科学方案

来增强这些因素是十分有价值的。

最后,我会问第三个问题,

你的公司或业务中有哪些主要痛点?

这些痛点中有一些可以用人工智能来解决 有些不能

但通过了解生意上的主要痛点

可以为成为找出人工智能项目的有用起点。

对头脑风暴人工智能项目,我有最后一条建议

就是即使没有大量的数据, 你也是可以取得进展的

别误会, 拥有更多数据几乎从没有坏处,

除了你也许要为磁盘空间或网络带宽 多支付一些费用, 用以传输和储存数据

拥有更多的数据几乎总是有帮助的。

而且我青睐于有很多数据,

同时,数据也能让有些业务, 比如说网络搜索变得具有防御性

网络搜索是一个长尾业务, 意思是有很多很多十分少见的

网络查询关键词

当人们在搜索这些少见的 关键词的时候,如果能知道他们点击了什么

那这会帮助搜索引擎网站提供一个好得多的

用户搜索体验。

所以你能获取大数据是非常好的,

但有时大数据被炒过头了, 即使你只有一个小的数据集,

你也一样能有进展。假如你在为咖啡杯

做一个自动视觉检查系统,

你想要自动检测到 右边的咖啡杯有缺陷

如果你有一百万张完好的咖啡杯 和一百万张有损伤的咖啡杯的图片

有这么多的好杯子和坏杯子的样品图片

能喂给你的人工智能系统当然是非常棒的

但我希望你没有真的已经 做出了一百万只有问题的咖啡杯

因为这像是一个非常昂贵 但却不得不扔掉的东西

所以有时即使只有1000个, 或100个, 或甚至只有10个样本,

你也能开启你的机器学习项目,

需要多少数据很大程度上, 取决于你要解决的问题

与人工智能工程师或者 AI 专家聊聊会帮助你更好的找到方向

有些问题需要大数据才能获得好的解决方案,

也就是说有1000张图片也不够,

但我的建议是

不因为在一开始的时候 因为没有很多数据就放弃,

很多时候,即使是用很小的数据库 你仍然能够有所进展,

在这个视频中,你看到了头脑风暴的框架

和一些帮你想出既能被人工智能实现,

又有业务有价值的项目甄选标准。

那在头脑风暴出的一系列项目中

如何选择一个或者一小撮来投入呢?

我们将在下一个视频中讨论这一点

6、

也许你对可能的AI项目

有很多想法。

但在你投入项目之前,

你怎么确定这

是一个值得的项目呢?

如果这是一个快速的项目

可能只需要几天功夫,

就可以很快去知道它是否可行,

但是一些AI项目可能 需要很长时间才能完成整个过程。

在这个视频中,我想让你

看看我用的一系列步骤去

仔细检查一个项目是否

值得花费几个月的努力。 让我们来看看吧。

在投入大型AI项目之前,

我通常会对此进行彻底的考察。

“彻底的考察“在法律世界中具有特定的含义。

但这里它意味着你想

花一些时间来确保

你所希望的实现的结果是现实的。

你已经看过了

最好的AI项目都先必须是可行的。

也就是说是在AI可及的范围之内的事情,

同时也是有价值的事情。

我们想要选择的项目必须

是这两组的交叉结合。

因此,要确保项目可行,

我通常会对技术方面进行很彻底的考察,

并确保该项目是有价值的,

我通常还会对业务本身进行彻底的调查。

让我告诉你更多关于这两个步骤的细节,

对技术方面进行的 彻底考察意味着

确保这个想要建立的

人工智能系统的可行性。

因此,你可以与AI专家讨论

AI系统是否能够真正

达到理想的性能水平。

例如,如果你希望构建

一个准确率高达95%的语音系统,

那么咨询AI专家 或者阅读一些

文献可以让你

了解这个系统的可行性。

或者,如果你希望开发一个

准确度达到99%的检测

工厂制造的咖啡杯的系统,

这一构想是否能由今天的技术实现?

全面技术考察的第二个重要问题是

需要多少数据,

才能达到理想的性能水平?

并且你有办法获得那么多的数据吗?

第三,将是开发此系统的时间表,

试图弄清楚需要多长时间

以及需要多少人

来建造一个你想要建造的系统。

除全面技术考察外,

我经常也会进行全面的商业考察,

确保你构想的项目

对企业来说真的具有价值。

所以,很多AI项目

将通过降低成本来推动价值。

例如,通过自动执行一些任务

或者通过在系统上挤出更高的效率。

许多人工智能系统也可以增加收入。

例如,让更多网购的人能最终

把放在购物车里的东西下单,或者

你可能正在构建AI系统以帮助

你推出新产品或新业务。

因此,全面业务考察意味着

仔细思考你正在构建的AI系统的过程。

例如,我们需要考虑

95%准确的语音识别系统

或99.9%准确的

视觉检测系统,哪一个

会帮助你实现你的业务目标。

无论您的业务目标是

改善您当前的业务

或甚至在你公司创建全新的业务。

在进行业务调查时,

我经常会建立

电子表格财务模型

以定量估算价值,例如

估计实际节省了多少美元,或者

我们认为在条目收入方面

是合理的假设,

并建立与项目相关联的

经济模型

另外,在决定投入很多个月的努力到某个项目之前,

(这一点本幻灯片没有明确列出)

我希望你也考虑做

第三种尽职,即彻底的道德考察。

我认为人工智能可以做很多事情

甚至可以赚很多钱,

但这可能不会让社会变得更好。

因此,除了全面

考察技术和业务之外,

我希望你们还要进行

道德考察,并确保无论

你做什么,这实际上都在

让人性和社会变得更好。

我们也会在本课程的

最后一周详细讨论这个问题。

当你计划你的AI项目时,

你还必须决定你想自己亲建还是向别人购买?

这是IT世界中一个老的问题

在人工智能中我们也面对此问题,

例如,现在几乎没有公司

建立自己的计算机,

他们购买别人的电脑,

几乎没有公司建立自己的Wi-Fi路由器,

只需购买商用Wi-Fi路由器。

那机器学习和数据科学呢?

机器学习项目可以让 企业内部做或外包给别人

我已经见证过这两种模式的成功案例。

有时如果你外包一个机器学习项目,

你可以更快地找到合适的人才

并在加速项目的实施。

你也可以最终建立自己的

内部人工智能团队 并在内部完成这些项目

下周我们将更详细地讨论AI翻译手册,

那时你会了解到更多关于这方面的信息。

与机器学习项目不同,

数据科学项目通常在内部完成。

他们并非不可能被外包,

你有时可以将它们外包,

但我所看到的是,

数据科学项目通常

与您的企业密切相关,

这通常需要对你的业务 有非常深入的了解

才能进行最好的数据科学项目。

因此,从大概的比例来看,

我看到数据科学项目

比机器学习项目更多是放在企业内部。

最后,在每个行业中,如果有些东西

是有行业标准的话,

你应该避免构建它们。

构建与购买问题的一个共同答案是,

构建对你来说

非常专业或

对您完全专业的东西,或者它们将允许

你构建独特的防御优势,

但如果所需的是具有

特殊的行业标准的,

那你应该购买它而不是

在内部建造它,这对你更有效率。

我的一个团队有一个非常诗意的短语,

“不要跟火车冲刺赛跑”

这意味着,

如果这是一列

在铁路轨道上运行的火车

带有烟雾的小烟囱。

你不应该做的是那个

试图在火车前

冲刺的人或工程师,

列车是行业标准的解决方案,

因此如果有一家公司, 这也许是一家初创公司,

也许是一家大公司,也或者是

正在构建行业标准解决方案的开源工作,

那么你可能希望避免

企图领先于这列火车。

因为即使你可以

在短期内冲刺得更快,

最终火车也会赶上你,

并撞到试图在火车前冲刺的人。

因此,当有大量建立的

行业标准解决方案时,

你可能最好只

采用行业标准

或其他人的平台,

而不是试图在内部重新建造一个全新的东西。

我们都生活在一个资源有限,

时间有限,数据有限,

工程资源有限的世界里,

所以我希望你能把这些资源集中在

我们最独特的项目上,

以此让你的公司带来最大的收益。

通过全面彻底的对

技术和业务的考察过程,

我希望你能够开始识别

具有潜在价值或

对你的业务有前途的项目。

如果这个项目很大,

也许会需要许多个月来进行,

在决定投身于这种项目之前,

我经常会花上好几周时间

进行这种全面彻底的考察,

现在,假设你找到了一些有前途的项目,

你如何与AI团队配合呢?

您如何与AI团队沟通

配合来完成这些项目呢?

我们将在下一个视频中讨论这一点

  1. Working with an AI team

假设你找到了一个很棒的项目

你想要尝试推进它,

你该如何与一个人工智能团队 一起合作这个项目呢?

在这个视频中,你会学到

人工智能团队是如何运用数据的

从而学习到怎么和人工智能团队 互动从而帮助他们

把项目做成

有一点需要注意的是

也许你有一个很棒的主意

但你手上没有现成的一个人工智能团队

或者人工智能工程师

幸运的是在当今世界

你可以自己或者鼓励

你的工程师朋友

去学一两个

机器学习或深度学习的网络课程

这样他们基本上能够足够的知识

去开始合理地尝试去

推动这类型的项目。

那我们来看看该如何与你的人工智能团队合作

首先,如果你能就项目提供一个验收标准的话

这对你的人工智能团队起到很大的帮助

我做过很多自动视觉检测方面的工作,

所以我将在接下来的幻灯片中

用它们来举例

假设你的目标是 以至少95%的准确率

检测咖啡杯中的缺陷

那么这就可以成为

你这个项目的验收标准

但这95%的准确率,你该如何测量准确率呢?

人工智能团队需要有一组数据集

来测量模型准确率

这里,数据集只不过是一组

有不同标签的图片

这里,我们看到在输出B里面,

前两个咖啡杯是好的

而第三个是有缺陷的

所以, 作为你验收标准的一部分

你需要保证你的人工智能团队

有一组可以用来测量模型表现的数据集

这样他们才能知道模型

是否达到了95%的准确率

这组数据集的正式术语 被称为测试集

测试集可以不需要太大,

也许1000张图片

对这个例子而言就足够了

但是, 如果你咨询一个人工智能专家

他也许能给你更合适的数字,

就是说专家会告诉你 他们需要多大的测试集

来测量模型是否达到95%的准确率

一个十分新颖的人工智能系统的特点是

它们的性能表现通常是

以统计数据的方式来展现的

所以你经常看到的会是

我们想要一个人工智能系统

以一定百分比的准确度来运行

而不是要求它弄出一个完美的结果

就比如所举的这个例子

所以,当你在给出验收标准时

想想你的验收标准是否

需要以一种

统计数据的方式体现出来

比如平均几个小时

或者以什么样的百分比来获得正确答案

现在,让我们更深入地了解 测试集的概念

人工智能团队 就是这么看待数据的,

人工智能团队把一组数据 分成两个部分

第一个被称为 训练集

第二个被称为测试集

这个我们前面已经讲过一些了

训练集只是一堆

配有标签的图片,(比如)

一张咖啡杯是否合格

还是有瑕疵的图片

所以训练集即给出

输入A即咖啡杯图片的例子

也给出输出B

即这个咖啡杯合格与否的标签

就是说,给定一个训练集

机器学习算法要做的将是

学习,换句话说

就是计算或者得出

从 A 到 B的一些映射, 从而你有

一个软件能输入A

并试图计算出什么是合适的输出B

也就是说,训练集是给机器学习软件的输入

使软件能够计算出

什么是A到B的映射

人工智能团队需要的

第二个数据集是测试集

正如你所见过的那样, 这只是一组

不同于训练集的

被标签的图像

人工智能团队评估

学习算法表现的方式是把

测试集里的图像放入人工智能软件中

看看软件会给出什么输出

打个比方,如果在这三张测试集的图片上

人工智能软件在这里输出 ‘合格’

在这里输出 ‘合格’ ,在这里也输出 ‘合格’

那么这就是说 他们在三个例子

里弄对了两个

所以这里的准确率就为66.7%

在这个图表中, 训练集和测试集

都只有三张图片

而在实操中, 这两个数据集

当然会大得多

你会发现, 在大多数问题里,

训练集的数量比测试集要大很多

当然,与人工智能工程师交流

你会知道具体的问题需要多大的数据集

最后, 由于技术原因

一些人工智能团队将需要

两个不同的测试集

如果你听到人工智能团队提到

开发集或者验证集,

那个便是第二个测试集了

需要两个测试集的原因

太深入技术探讨,超出了本课程的范围,

但如果一个人工智能团队找你要

两组测试集,这是十分合理的要求,

你应该尝试提供给他们。

在结束这段视频之前

我想敦促你避免一个陷阱,就是

期望人工智能团队能给你100% 的准确率

我来解释解释,

比如说这是你的测试集

你已经在上一张幻灯片上看到过了

现在我往这个测试集中,多加入一些范例

以下是一些一个人工智能软件 也许不可能

达到100%准确率的原因

首先,尽管机器学习科技

在现今是非常强大的

但仍有其局限性

它们无法做所有的事情

就是说,你也许在试图解决一个

对当今机器学习技术而言十分困难的问题

第二, 数据不足,

如果你没有足够多的数据

特别是如果

训练数据不够的话

要得到一个高准确率会是比较难的

第三, 数据很混乱,

有时数据可能会被错误地标记

比如这个绿色咖啡杯,

我看起来完全没有任何瑕疵,

但把它标记为有瑕疵,

则是一个错误的标记

这就会损害你人工智能软件的表现

还有,数据有时会模凌两可,

比如说,这个咖啡杯

看起来在这里有一个小的划痕,

这是一个很小的划痕

所以也许我们觉得这是没问题的

但也许这应该被视为

一个残次品

也许不同的咖啡杯检测专家

会对这个咖啡杯是否合格,

是否能够通过产检会给出不同的结论,

以上提到的这些问题中, 有些可以得到改善

例如, 如果你的数据不足,

也许你可以尝试收集更多的数据

更多的数据往往会有所帮助

或者, 你也可以尝试清除 标记错误的数据或尝试

得到你的工厂专家来

就这些不明确的标签得出更一致的结论

所以, 是有方法用来改善

这些问题的, 但是,

很多人工智能系统 即使没有实现100% 的准确率

也是极其有价值的

所以, 我鼓励你 与你的人工智能工程师

讨论什么是

合理的准确率

然后试着去找一个

既能通过技术调研又

能通过商业调研并且

不必要达到100%准确率的项目

祝贺你看完了这周所有的视频

你现在知道了构建一个人工智能项目

是什么感觉并且需要什么了

我希望你开始集思广益

并探索一些想法

接下来还有一个选看视频 描述了一些

人工智能团队使用的技术工具

如果你想的话,可以看看

但是不管如何 我非常期待在下周见到你

在那里你会学到 人工智能项目

是如何在更大的公司中得到运用

期待下周还能见到你

  1. Technical tools for AI teams (optional)

当你与AI团队合作时

你也许会听他们提到

构建人工智能系统所使用的工具

在这个视频中,我希望与你们分享

许多基础AI工具的

名字和它们的细节

这样你就能更好地

了解这些 AI 工程师在做什么

很幸运的事, 现今 AI 是非常开放的

许多团队会公开分享他们的点子

也有很棒的机器学习

开源框架,

许多团队会使用它们构建自己的系统

所以,你如果听说过这些工具:TensorFlow,

PyTorch, Keras, MXNet, CNTK, Caffe,

Paddlepaddle, Scikit-learn, R Or Weka,

这些都是开源机器学习

框架,它们能帮助

AI团队更加高效地

写代码

不仅有人工智能技术的突破

现在也可以

在各种网站上自由发布文章,

如: Arxiv。

我希望学院派团队也能自由分享

他们的研究成果,因为我亲眼见证到

这些开源工具是怎样快速促进AI领域发展的

最终,许多团队将

在网络上分享他们的代码,

最常见的平台是GitHub

事实上,Github已经成为 在AI和其相关领域

的开源软件的知识库

通过使用适当许可的开源软件,

许多团队可以更好更快的开展工作,

而不是一切从零开始。

例如,如果我在网上搜索

Github人脸识别软件,

你可能会发现这样的网页

如果你向下滚动,

它实际上有一个非常漂亮,

可读性很高的的软件使用说明

在这个网站上提供给大家

以便进行面部识别,

甚至可以识别人脸各种组成部分

有很多很多软件

可以只有在网络上下载

用来实现各种各样的功能,

这些软件只需要复查许可证,

或者在使用之前

AI团队复查下许可证,

大量软件都是开源的,

也就是说,任何人都能非常

容易得到使用许可

虽然 GitHub 是

为工程师打造的技术网站,

只要你愿意,你也可以自由地

浏览 GitHub, 看看

网站中发布的各种

AI软件的类型

除了这些开源技术工具外,

你也经常听到

AI 工程师谈论 CPU 和 GPU

这些术语的意思是,

CPU 是计算机中的计算处理器,

不管在你的台式机,

笔记本,或者云服务器

CPU 代表中央处理单元,

CPU 是由英特尔

和 AMD, 以及其他一些公司制造的

它们在计算机中执行大量的计算

GPU表示图形处理单元。

从历史上看, GPU 是用来处理图片的,

当你在玩视频游戏时,

很可能是 GPU 在 绘制出那些奇妙的图形

但是几年前

我们发现这个

原本是为了处理图形而设计的硬件,

其实非常适合用来

构建大型神经网络

即大型深度学习算法

因为需要构建

非常大型深度学习或者

大型神经网络系统,

AI社群不得不永无止境的

寻求更强的计算能力

以训练更大的神经网络

而 GPU 已经被证明是

一种非常匹配这种需求的

计算方式,

用以训练很大的神经网络

所以, 这就是为什么 GPU

在深度学习的兴起中 如此重要的原因

NVIDIA是卖GPU的大公司,

其他公司也包括高通,

Google也在研发

处理器来应对不断增长地

硬件能力需求

来应用到大型神经网络上

最后, 您可能会听说云和本地,

或简称,本地化部署

云部署是指如果 你从服务器运营商

比如说亚马逊的AWS、

微软AZure,或谷歌GCP,

租赁服务器并使用别人提供的服务

来进行自己的运算。

本地化部署意味着购买

自己的服务器

并且在你自己的公司本地化运行服务

探索两种方式的优劣势细节

不属于这个视频的谈论范畴

世界上很多公司都在倾向于云部署

你在线搜索时 可能会发现许多文章

在谈论关于

云部署和本地化部署对比利弊

最后,可能你会听说

边缘部署的概念,

如果做自动驾驶项目,

从自动驾驶车辆

发送数据

到云服务器,

再把信息从云服务器发回到车子里,

再用此信息决策是否停车。这个过程的用时太长。

所以,这意味着需要

在车内的电脑中进行计算。

这就是所谓的边缘部署, 就是说,

你需要把处理过程部署到

收集数据的地方,以便可以

快速处理数据

并做出决策,而不必

通过网络传输数据

并在其他地方处理数据

如果你观察一些

智能音响,也许你家里也有,

不是所有的智能音响, 其中也有一些是应用边缘计算

有些语音识别任务

是在智能音箱里的

本地处理器中完成的,

它也许就在你的家里哦!

边缘计算主要优势在于

它可以加快系统的反应时间,

也可以减少

需要通过网络发送的数据量。

但是,像云部署和本地化部署对比一样,

边缘计算同样有很多利弊,

云部署意味着你

可以在网上运用到更多的资源。

感谢你完成这个关于AI工程师

运用技术工具的可选视频

希望当你听到

他们讨论这些工具,

你将更清楚地明白他们的意思

我期待下周还能见到你

发布于 2019-08-30

1 个练习

Week 2 Quiz30分钟


Week3

完成时间为 2 小时

Building AI In Your Company

10 个视频 (总计 90 分钟)

10 个视频

Week 3 Introduction2分钟

Case study: Smart speaker9分钟

Case study: Self-driving car6分钟

Example roles of an AI team8分钟

AI Transformation Playbook (Part 1)10分钟

AI Transformation Playbook (Part 2)14分钟

AI pitfalls to avoid2分钟

Taking your first step in AI4分钟

Survey of major AI application areas (optional)17分钟

Survey of major AI techniques (optional)15分钟

  1. #Introduction

欢迎回来!

在过去的两周里你了学到了什么是人工智能 , 以及如何构建一个人工智能项目

本周我们将看看 我们已经谈过了的这些项目

并且谈论项目如何能在 公司的背景下得到应用

无论是营利的, 非营利的, 或甚至在一个政府实体内

为了具体起见, 我会谈谈无论你在什么样的组织里

都能同样运用的建造人工智能的方法

接下来你可能会听到一些类似CEO 级别的谈话

不要被这些吓倒,

这实际上对每个 希望自己公司能够通过运用人工智

能有所改进的人 都是有用的

一个公司要想擅长于人工智能 可能需要两三年的时间

这样才能不仅仅只是做过一个人工智能项目, 而是一系列有价值的人工智能项目

并且做得很有效率

但这周我希望做到的是 帮助你展望

该如何渡过这个相对较长周期的愿景

并且在本周末,我会提供给你 一些可以立即使用的 具体而简单的步骤

那我们开始吧。

具体而言, 这些将是你本周会看到的话题

首先是 复杂的人工智能产品的案例研究

比起你上周所见的单一的 机器学习或

数据科学模型

本周你会看到多个 模型可以汇集在一起, 来构建

一个复杂得多的人工智能产品, 比如一个智能音响 或者一辆自动驾驶汽车

你还会了解到人工智能 团队中的主要工作类型

所以, 当你认为你的公司可以 建立一个大型的人工智能团队时,

这也许是好几十人 甚至几百人, 这些人都会做些什么事情?

我们将从绘制一个 建立人工智能团队的路线图开始

第三, 你也会了解到 人工智能转型手册

学习如何帮助你的公司 转型成为擅长人工智能的公司

也就是说,你的公司不仅仅是 做一两个有价值的项目

而是怎样让整个公司都擅长人工智能,

最终会因此让你的公司更加有效率和价值。

最后, 虽然当中有些步骤也许会 需要几年的时间才能完成

我将给出如何能在你公司中 迈出建立人工智能项目第一步的具体建议

来作为这周的视频的结尾

除了这些主要内容之外, 在最后还有一些选看视频,

在那里你会纵览一些主流的 人工智能运用领域和技术

在本周的视频之后 我希望你能知道

如何帮助你的公司更好运用人工智, 并且能掌握几个马上采取行动的步骤

让我们开始下一个视频吧!

  1. #Case study: Smart speaker

打造一个复杂的人工智能产品是什么样的感觉呢?

这意味着不仅仅用一个单一的机器学习算法

去学习从A到B的映射

这个算法只是一个大且复杂的

的项目或者产品的一部分

我想在本周用两个打造复杂人工智能产品

的案例作为开始

首先, 打造智能音响

这样你就能开始明白

在你公司内部打造

这样一个复杂人工智能产品会是什么感觉

让我们开始吧!

智能音箱和类似这样的语音激活设备

正风靡世界

如果你家还没有这样一个设备的话

也许有一天你会购买一个的

我希望你看一个案例

关于你该如何写出

使一个智能音箱能

对例如'嘿, 设备, 给我讲个笑话' 这样的口头命令做出反应人工智能软件

举个例子, 像亚历克莎(Alexa)

或者‘好吧,谷歌’,或者‘嘿,西里‘

或者,‘你好,百度’,作为唤醒词或触发词

这里我会不那么具体到某一个品牌,

我将会使用'嘿,设备'

作为触发词或唤醒词

要唤醒一个智能音箱

比如说

你想让它讲一个笑话

所以你该如何打造一个

能让它理解这样的指令 并进行执行的人工智能软件呢?

以下这些是处理指令所需要的步骤

总共有4步

第一步,是探测到触发词或唤醒词

只能音响是用一个 机器学习算法

来输入音频然后再进行输出

当他们听到了唤醒或者触发词 --

-- '嘿,设备' --

那么它就输出就是0或1

一旦它听到触发词或唤醒词

听到 '嘿, 设备‘时

它还必须接着执行第二步,

就是语音识别

也就是说,此时软件要做的是

在得到'嘿, 设备‘的音频之后,

把它映射到'讲个笑话',

这也是通过 机器学习完成的

然而, 这里的第一步是

使用A到B的映射来告诉

设备它听到了这个触发词,

这个,使用的是另一个A到B映射

将你刚才说的话的音频 映射成文本记录

在这个例子里, 就是 ‘讲个笑话‘这四个字

此时,算法已经弄清了

你说这四个字的意图,

所以说第三个步骤

就是意图识别

意思是,用你说的话

然后弄明白你想要软件做什么事情

当今的智能音响 能做有限的指令

比如它们能讲个笑话

或者它们能告诉你时间

所以你可以说'嘿, 设备 现在是什么时间'

它们可以放音乐

它们有时也可以帮你打出电话

能告诉你天气状况,

'嘿, 设备 明天什么天气?'

所以,意图识别的作用就是

用这四个字 --

--就是语音识别的输出结果,

然后用另一个人工智能软件,

即另一个A到B映射,输入这四个字,

然后输出你的意图

所以在这个机器学习算法

的运用中

输入A是

文本记录 ‘讲个笑话‘

B是

刚刚用户所说出的五个指令中的一个,

当然, 你的智能音响也许能理解

比这五个指令更多的指令

如此一来那么B

就会是这五个或一百个或一千个

智能音响懂得执行的指令中的一个。

无论你是以何种方式要求

智能音箱给你讲个笑话的

意图识别组件都能

正确地分辨出你的意图

比如说,除了'嘿,设备,讲个笑话'之外

还可以说

'嘿,设备,你知道什么好的笑话吗?'

或者'嘿,设备,给我讲些好笑的事情‘

显然,你可以用很多不同的

方式让智能音响给你讲笑话

而一个精心设计的意图识别系统

应该能分辨出它们中的大多数

最终,你的智能音箱

知道了你非常非常

想听一个笑话

最后一个步骤就是

让软件程序员写好的编码

来随机挑选一个笑话

然后将这个笑话通过扬声器播出

换句话说,这就是所谓的‘执行’一个笑话

顺便提一下, 我最喜欢的笑话是

为什么在人工智能领域 有这么多像‘电击‘般的成果?

因为人工智能是新型电力

电击般的电力,明白这个笑话的意思了吗?

(Shocking除了令人震惊的之外,还有电击的意思) 希望你喜欢这个笑话

好了,言归正传,你可以这样思考

算法中的这四个步骤,

第一个步骤是检测触发词,

第二个是语音识别,

然后是意图识别,

最后用户对智能音响指令的执行

像这样的由

几个步骤组成的人工智能系统

有时,被称为人工智能管道

就是说,你有好几个人工智能组件

或是好几个机器学习组件,

来一步一步地

处理数据

一个公司里由四个不同的团队,

来专注于这个人工智能管道中的每一个步骤

是很常见的!

这通常是我们在大公司

里组织项目的方法

现在让我们来看一个 更复杂一些的例子

比方有人

发出了一个更复杂的指令,像'嘿设备,

我需要计时十分钟.'

以下是处理这个指令所需步骤,

跟之前一样,第一步是检测触发词,

因此,在输入音频后,音响就检测到

触发词‘嘿设备‘。

接下来是语音识别, 这个步骤会把剩下的音频

即剩下的声音

或者是剩下的音频转换为为文本

'把计时器设到十分钟.'

接下来,意图识别要输入这个文本,

然后输出你的意图,

即设置一个十分钟的计时器,

设置一个十分钟的计时的意图

和之前'讲个笑话'的意图相比,

现在你需要

知道具体要

把计时器设置多久

所以在执行这一步时,

你需要做两件事情,

一个是获取时长,

也就是说,看文本

'把计时器设到十分钟'

然后取出这个

需要设置时长的短语

所以,如果一个用户说

'嘿设备,十分钟到了的时候告诉我'

那么获取时长这个步骤需要

再一次在这里取出'十分钟'这个短语。

当然了,要求设置一个十分钟的计时器的方式有很多,

你可以说‘十分钟到了的时候告诉我'

或者设置一个从现在开始十分钟之后的闹钟

意图识别组件

和时长获取组件都必须

足够强大去识别出所有这些

要求设置十分钟计时器的不同说法。

最后,要最终执行这个指令

智能音响里需要

有一个专门的软件组件

来启动一个计时器并且设置一定的时长

当它明白了你的意图 并且获取了时长信息之后

它就会根据被要求的时长来开始计时了

最后,十分钟之后闹钟就会响起

现在的智能音响有许多功能

除了我们已经讲过的

讲笑话和设置计时器这两个之外,

这是一些它们如今

能执行的其他功能

而这些功能的执行步骤

就是触发词,

或者说唤醒词,

语音识别然后转化成文本指令,

意图识别, 即弄清楚

在这些功能中哪一个

是你想要它执行的

然后就是用一个专门的程序

来执行这个你下达的指令

一个智能音箱领域里的挑战是

如果你想要智能音响

有很多不同的功能

比如说20个功能

那么你确实需要一个软件工程师团队

来写20个专门的软件

一个用来放音乐,一个用来调音量

一个来打电话,一个来告诉你现在的时间

一个来做单位换算, 比如从一茶匙到一汤匙

或者来回答一些非常简单的问题等等

写出每一个这种专门的软件

来执行这些

不同指令,需要

很多的前期工作,

并且智能音响现在会做很多事情,

以至于对很多用户来说

弄清楚它们到底能做什么

不能做什么是有些难度的。

所以有很多智能音箱公司

在用户培训方面投入了大量资金

试图让用户知道什么是智能音箱

可以做到的

因为毕竟它们

不是说什么事情都可以做到

有很多你无法让智能音箱

为你做的事情,比如说

请给我的三个朋友都打电话

并且看看他们是否能一起见面吃晚餐

所以说智能音响公司像用户解释

它们能做什么不能做什么

这是一个持续的过程

尽管如此, 用户用智能音响可以做到的事情

即用声音来给它们下达指令

使很多人的生活都变得便利了许多

我希望这段视频让你大概了解了 创建一个复杂的

人工智能产品的基本过程, 比如说怎么设计一个智能音响

为了更好地帮助你了解

这些复杂的产品有是如何运作的

我们来看看第二个案例

看看如何把多个人工智能组件组装在一起

来做一辆自动驾驶汽车

我们下一节再见

  1. #Case study: Self-driving car

人工智能时代最令人兴奋的产品之一

是自动驾驶汽车

自动驾驶汽车也是

现今人工智能里

最神秘的技术之一

在这个视频中,我想和你们分享的是

一个有些简化的有关自动驾驶汽车的解释

以帮助你

理解如何将

多个人工智能组件组装在一起

而构成如此神奇的事情

让我们开始吧 下面这些是

决定你将如何驾驶自动驾驶汽车的关键步骤

汽车会接收各种各样的传感器作为输入

比如汽车前方

侧面或后方的图片

以及声波雷达

或激光雷达的传感器读数

有了这些作为输入

就能探测出其他车辆的存在或所在位置,

这样的话,你就可以

发现附近有车

同时注意到行人的位置

因为我们想要避开

其他车辆以及行人

汽车探测和行人探测

都可以通过机器学习来完成,即

使用输入输出映射,或A到B映射

这里的输入可能是图片

或者是雷达和激光雷达信息

输出是

其他车辆和行人的位置

最终,既然你已经知道了

其他车辆和其他行人的位置

你可以将这些信息投喂到

另一个专用的软件里,

这个软件称作运动规划,

这个软件的会规划动作

或者帮你规划

你的车行驶的路径

这样你就可以靠近你的目的地了

并且同时避免碰撞

一旦你规划出了你的车的动作

你可以将其转化成

特别的舵机角度

和加速度以及刹车指令

像油门应该踩多少

刹车应该踩多少来使你的车

以预想的角度和速度移动。

接下来,让我们更具体地了解一下 车辆探测、行人探测和动作规划

的三个关键步骤

汽车检测使用监督学习,

所以,你已经看到了学习算法 如何能够

将像这样的图像作为输入

并将探测到的车辆作为输出

对大多数自动驾驶汽车而言,

不仅要使用前置摄像头,

也就是一个向前看的摄像头

还需要左右两侧,

以及向后看的摄像头,与传感器

来探测周围所有的车辆

这一任务通常不只是使用摄像头完成

而是使用了其他的传感器 如雷达以及激光雷达

接下来是行人检测,

行人检测使用的是比较类似的

传感器和技术

使得自动驾驶汽车可以探测行人

最后,我简要介绍一下运动规划步骤

下面是一个例子,

比如你在开车

你的前方有一辆淡蓝色的车

运动规划软件的工作是

告诉你你的行车路径应该是什么

如这里红色部分所示

你应该沿着这个路径驾驶

从而不发生事故

所以运动规划软件的工作是

输出你驾驶的路径

以及速度

为了沿着道路行驶

和应该被设定的速度

所以你不会撞上另一辆车

同时还以合理的速度在路上行驶着

来看另一个例子

如果有一辆灰色的汽车

停在路的右边,

然后你想超过这辆车,

那么运动规划软件的工作是

画出一个像这样的路径

来使你向左开一些,

安全地超过这辆车

到目前为止,我简单描述了自动驾驶

主要的三个组成部分。

让我们看看更多的细节

实际的自动驾驶汽车如何工作

这是你目前为止见到的结构图,

输入图像,雷达或者激光雷达,

传感器读数

关于车辆检测和行人检测

然后将这些投喂给

运动规划软件 以此帮你选择路径和速度

在一个真实的自动驾驶汽车里,

你通常不仅仅只使用

摄像头、雷达和激光雷达,

现在大多数自动驾驶汽车 还会使用GPS

来获得位置,还有加速度计

有时候称作IMU,这就是加速度计

陀螺仪还有地图

因为我们知道

汽车通常更多是在道路上被发现

而行人更可能在人行道上被发现

尽管有时候他们也会出现在公路上,

所有这些都是

附加的信息,用以检测

车辆和行人

和接下来我们即将提到的别的物体。

除了检测车辆或者行人

为了安全驾驶 你还需要知道

这些车和行人接下来要去哪儿

所以,另一个普遍的

自动驾驶汽车的部分是轨迹预测

这是另一个人工智能的部分,

它不仅让你找到车辆和行人

还有他们可能

在接下来的几秒钟到哪儿去

所以就算他们正在移动,你也可以避开他们。

安全驾驶不仅需要

知道其他车辆和行人的位置,

你还需要知道车道,

所以你还需要探测车道标志,

如果有交通灯 你还需要

找到交通灯在哪儿

以及它是红灯、

黄灯还是绿灯

有时候还有其他障碍物

如突然出现的交通锥体,或者

也会有一群鹅从你的车前经过

这也需要被检测

所以你的车可以躲避

除了车辆和行人之外的其他障碍物

在一个大的自动驾驶汽车设计团队里,

让一部分人分别

负责每一个

这些红色的方框里的工作

一点都不例外。因为只有把他们分别做好,

然后组合放在一起,才能够

设计一辆自动驾驶汽车

如你在这些

综合的人工智能例子里,

以及之前的例子里 -- 比如智能音响--里

所看到的四步AI途径,

有时这需要一整个队伍才能构建

出一个复杂的AI产品。

在下一个视频中,我将与你分享

在一个大的AI团队中重要的一些角色。

如果你只是一个人或者

是一个小的AI团队,这对你也是有用的。

我的目的是让你对

如何组建一个大的人工智能团队有个了解,

这在未来会对你有帮助。

我们下一节再见

  1. #Example roles of an AI team

通过观看前面两个视频,你会发现

有些AI产品可能需要一个庞大的AI团队

也许你有100人的开发团队或者

有时候需要不止100人的开发团队需要去搭建

这个视频中,我想要和你分享

一个庞大的AI团队所扮演的角色

和承担的责任

通过这样,你可以更好地理解

创建这些复杂的AI产品

会涉及到哪些工作

即使你只是在一个非常小的团队里工作,

这也许只是1到2个人

或5个人的小团队,

我仍然希望这个视频

对你来说是有用的 我希望它能

帮你了解在一个AI团队中可能需要的

不同类型的工作

即便你最后

只是在一个非常小的团队里执行这些工作

需要警告你的是,因为AI发展太快

它的工作头衔

和各种角色承担的责任

不是100%(如同我)清晰地定义的

它们在不同的公司中

会有一点点不同

比如,你的公司的工作头衔可能

不同于

我现在介绍的工作头衔

但是我想与你分享的是

那些公司是如何使用这些工作头衔的

这样的话,如果有一天你建立自己的AI团队

当听到这些角色的时候

至少你会对这些工作头衔的含义

有更深入的理解

欢迎你们来到今天的社会心理学闲聊

很多AI团队会有软件工程师

因此,举例来说,对于智能音箱

我们需要设计专业软件

来执行(讲)笑话,或者

设定一个计时器, 或者回答关于今天天气的问题

所以,这些都是传统软件工程的任务

或者,如果你正在建造自动驾驶汽车

需要确保你的自动驾驶汽车软件

是可靠的,不会崩溃

这些都是软件工程任务

所以,这些对于AI团队来说

拥有大部分的(有时候50%

有时候远远超过50%)

的软件工程师不是稀罕的现象

第二种角色是,机器学习工程师

机器学习工程师可能会写

一些软件

用于生成A到B的映射

或者用于创建其他机器学习算法

然后运用于你的产品中

因此,他们可能会收集

关于汽车的图片、汽车的位置的数据,

用它们训练一个神经网络,

或者训练一个深度学习算法

并且一直迭代,以确保

学习算法可以持续提供准确的输出

另外,你会经常听到的一个角色是

-- 机器学习研究员

机器学习研究员典型的职能是

负责开发机器学习的前沿技术

机器学习和AI技术

仍然在迅速地发展,

因此,很多营利、非营利公司

都有机器学习研究员来

负责扩展最新技术

一些机器学习研究员会发表论文

也有一些公司的机器学习研究员

专门做研究

很少专注于发表论文

另外还有一种工作头衔,

它介于这两种头衔之间,

那就是 -- 应用机器学习科学家,

这个工作头衔是介于

机器学习工程师

和机器学习研究员之间的

机器学习科学家

会同时做一点点前两者都有的(的工作内容)

他们经常需要负责

学术文献或研究文献

寻找到最前沿的技术

并且想办法用找到的这些技术来解决

他们面临的问题,例如

如何利用最前沿的技术

研究出弱读单词检测算法

并应用到你的智能语音系统中

再看几个例子

目前,各行各业都要用到

数据分析师

但是,对数据分析师这一角色

的定义并不明确并仍有争议

在我看来,数据分析师最重要

的职责不仅仅是

监测数据并分析数据背后的意义

还应包括向其团队或总裁

来展示由这些数据分析得出的见解和点子

帮助驱动商业决策。

也有数据科学家做其他的任务,

所以,有些数据科学家

做的事情更像

机器学习工程师,

就像前面幻灯片提到的一样,

这个工作头衔的定义还在不断发展中,

随着大数据的兴起,

也有越来越多的数据工程师

其主要作用是帮助 你整理你的数据

意思是, 以确保

您的数据安全地保存下来并很容易读取、

(保存和读取的方式)而且是以一种很经济的方式。

那么, 为什么保存数据如此的重要呢?

不能把数据保存在

硬盘上就行了吗?

在一些公司中, 数据量 已经变得如此之大,

这其实需要相当大量 的工作来管理这些数据。

为了让你对这个大小有大概了解

在计算机科学中, 1 MB代表1兆字节

所以你的音乐播放器上 的一个典型的歌曲

例如一个典型的 MP3 文件可能 是几兆字节,

一般说来,5兆字节 不是一个正常的 MP3 文件大小,

1, 000 兆字节是被称为千兆字节,

100万兆字节是被称为 tb,

10亿兆字节是 被称为 pb,

用今天的硬盘大小,

储存几兆字节 是很简单的,

比如说一个MP3 文件,

但存要储1000兆字节

也被称为千兆字节,

硬盘速度会开始变慢

一般你从网上下载的

一小时电影,差不多有千兆字节那么大

这是比较大的数据了,

为了让你对这个大小有大概了解

自动驾驶汽车

在运行过程中可能每分钟

会收集好几千兆字节的数据

所以就好像是每分钟

自动驾驶汽车会产生

像储存好几部电影那样多的数据

所以, 自动驾驶汽车 实际会上制造很多数据

所以为了把几天,几周, 几个月,

甚至几年的运行数据储存起来,

需要大量的数据工程工作,

一TB是一GB(千兆字节)的一千倍

而一PB又是一TB的一千倍

对于这个团队来说

他们每天要负责

储存好几PB的数据

但除了相当大的

互联网公司

对一般的公司而言每天

产生这么多数据是不常见的

当你跟着这个量级走,

就会有了更大得多的数据,

如何保证数据以一种安全, 经济高效

且容易被读取的方式储存起来,

会变得越来越难,

这也是为什么数据工程师

变得越来越重要了

最终, 你也会听到 一些人提到

AI 产品经理

他们的工作是帮助决定用AI做什么,

也就是说,是帮助判断

什么是可行且有价值的

传统的产品经理工作

本身就是要决定打造什么

有时也有一些其他的工作内容

但 AI 产品 经理现在必须要

在人工智能领域做这样的决策, 而且他们需要

学习新的技能 从而才能决策什么是

可行且有价值的,

因为人工智能领域 仍在不断进化之中

这些职称都没有 完全板上钉钉

不同的公司也有各自不同的

使用这些岗位名称的方式

我希望这节视频能给让你有一个大致的了解,

明白打造一个非常复杂的人工智能产品

需要哪些不同类型的工作

并且让你知道有些岗位职称, 也是在不断发展变化的

在这个视频的结束,我想再一次强调

你完全可以从一个小团队开始。

大多数的AI项目不需要100个人来完成

所以不管是

你只有一个软件工程师

或者一个机器学习工程师

或者只有一个数据科学家

或也许只有你一个人,

如果你自己或者跟你一起工作的工程师

学过一些关于机器学习,深度学习或者

有关数据科学的网络课程

这通常就足够让你自己或

跟那个工程师一起

开始就一些小数量的数据进行研究,

得出一些结论,

或者尝试训练一些机器学习 的模型并建立项目

即使我在这里介绍的是一个大的 AI团队

里面大概是怎么分工合作的,

就算你只有一个很小的AI团队

也许就只有你一个人

我也依旧鼓励你开始行动

并且开始探索什么样的项目是你可以做的

在这个视频中, 你看到了一个AI 团队 可能是什么样的

但当你看 一个更大的公司时

你会发现AI 团队并不单独存在

那么, AI团队如何能更好的

融入进大公司中并帮助此公司

变得更擅长使用AI呢?

你也许还记得在第一周 的时候我简单地提过

人工智能转型手册

这是一个是让你能帮助你的公司,

这也许是一个很棒的的公司 变得更擅长AI的路线图

既然你已经学会了 什么是人工智能

如何做人工智能项目

还知道了大公司里, AI团队应该

怎样合作完成项目,

那就让我们回到人工智能转型手册

对手册中的各个步骤

更加深入地探索

这样你就能明白

要帮助一个公司在短短几年之中变得擅长AI

需要做哪些事情

并且也希望公司在这个过程中

能变得更高效也更加的有价值

让我们在下一节视频中

探索人工智能转型手册吧

  1. #AI Transformation Playbook (Part 1)

你如何能帮助你的公司 变得擅长使用人工智能呢?

根据我从领导 谷歌的大脑团队

到百度的人工智能团队

(这两个团队是帮助谷歌和百度在

AI领域变得越来约好的中坚力量)

的经验,

我花了很多时间 怎样能

帮助一个伟大的公司

成为一个伟大的人工智能公司,

并且我想要一个作品和一个人工智能转型手册

来帮助其他的公司完成这个征程

在这个视频中, 我想 与你分享

人工