开始时间: 05/29/2021 持续时间: Unknown
- 所在平台: [Coursera]
- 课程类别: [计算机科学]
- 大学或机构: [CourseraNew]
- 课程主页: https://www.coursera.org/learn/ai-for-everyone
课程简介
Andrew Ng (吴恩达) 老师新推的通俗人工智能课程:AI For Everyone(全民AI) ,面向大众进行AI科普。AI不仅适用于工程师,这门非技术性人工智能课程将帮助学习者了解机器学习和深度学习等相关技术,以及将AI应用于自己组织中的问题和机会。 通过这门课程,学习者将会了解当前人工智能可以或者不能做的事情。 最后,学习者将了解AI如何影响社会以及我们将如何应对这种技术变革。
入门难度
❤️
先修课程
无
课程详情
AI不仅适合工程师。如果您希望您的组织在使用AI方面变得更好,那么这就是告诉所有人(尤其是您的非技术同事)的方法。 在本课程中,您将学习:
- 通用AI术语背后的含义,包括神经网络,机器学习,深度学习和数据科学 -
- 人工智能实际上可以做和不能做的事情
- 如何发现将AI应用于组织中的问题的机会
- 建立机器学习和数据科学项目的感觉
- 如何与AI团队合作并在公司中制定AI战略
- 如何引导有关AI的道德和社会讨论
尽管本课程主要是非技术课程,但工程师也可以选择本课程来学习AI的业务方面。
课程时长约6小时,4周完成
课程大纲
If you are a non-technical business leader, “AI for Everyone” will help you understand how to build a sustainable AI strategy. If you are a machine learning engineer or data scientist, this is the course to ask your manager, VP or CEO to take if you want them to understand what you can (and cannot!) do.
Week1 What is AI?
9 个视频(总计 69 分钟)
Week 1 Introduction7分钟
欢迎观看AI for everyone 人工智能正在改变我们工作和生活的方式 这个通俗易懂(不含有专业词汇)的课程会教你 理解人工智能的发展。 无论你是想更深入了解人工智能流行的背后, 或是 你想把人工智能应用到你的生活, 公司,或其他组织中。 这个课程会教你如何达成这些目标。 如果你想了解人工智能是如何影响社会的, 以及你如何驾驭它, 你也会从这个课程中学到这些。 这个星期, 我们将抛开对人工智能的炒作, 让你 对人工智能有更加客观的了解。让我们开始吧。
你可能看过 关于 AI 创造了多少价值的新闻。 根据麦肯锡全球研究所的一项研究 AI 估计会增加 每年 13 万亿美元的 价值 (在2030 年之前)。 尽管 AI 已经在软件行业创造 了大量的价值, 未来人工智能将会在 在软件产业之外创造更多的价值。 在零售、旅游、交通、 汽车、材料、制造等。 我很难想像 有哪一个行业, 在接下来几年里, 人工智能不能对它产生巨大的影响。 我和我的朋友们常常挑战对方说出 某一个行业不会受到AI 巨大的影响。 我最好的例子是美发行业, 因为我们 不知道如何使用人工智能机器人自动美发。 但是, 我曾经在演讲的时候提过这一点 当天观众中有一个朋友 是一位研究机器人的教授, 那天她站了起来, 看着我的眼睛说, "安德鲁, 大多数人的发型, 我不能让机器人剪出他们的发型 ", 但她看着我说 "你的发型, 机器人倒是可以剪出来 ( 嘲笑Andrew教授的发型)。 现实中有很多令人兴奋的, 但也有很多 关于 AI 的不必要的炒作。
其中一个原因是 AI 实际上是两个独立的概念。 几乎所有我们可以看到的人工智能中的进展 都是弱人工智能 (ANI)。 这些都是用 AI 做 一件事, 如一个智能音箱或 自动驾驶或网络搜索或 AI 在农业或工厂中的应用。 这些类型的 AI 只是 单方面的成果。但当你找到合适的技巧, 这可能是非常有价值的。 但是,AI 也包含它的 第二个概念 强人工智能(AGI)。 这就是构建 AI 的目标。 他们可以做任何人类能做的事情, 甚至可能是 超过人类智能的事和其他 任何人类都做不到的事情。 我看到了大量 ANI(弱人工智能)的进步 但是几乎没有 在 AGI (强人工智能)方面的进展。 这两个都是有价值的目标, 不幸的是, ANI的快速发展 (虽然它相当有价值), 导致人们认为 整体人工智能有很大的进步 (这倒是是对的结论)。 但这让人们 错误地认为, AGI 也有很大的进展 这导致一些非理性的恐惧 比如聪明但邪恶的机器人会 随时替代人类。 我想强人工智能是 一个令人兴奋的目标, 值得更多研究人员的工作, 但它仍需要多方面的 技术突破才能实现。 这意味着几十年或 几百年甚至几千年的探索。 正是因为强人工智能时代还离我们相当遥远 我认为没有必要过分担心这件事。
这一周里, 你将了解到 ANI 可以做什么, 以及如何将它们应用到您的问题中。 后面的教程,你将会 看到一些关于弱人工智能的案例研究 这些单一的人工智能可以用来建立 非常有价值的应用, 如 智能音箱和自动驾驶汽车。 在这一周里, 你将了解什么是 AI。 你可能听说过机器学习 下一个视频将教你什么是机器学习。 您还可以了解什么是数据以及什么类型的数据 是有价值的, 以及 什么类型的数据是没有价值。 你知道是什么让 一个公司成为人工智能公司或人工智能优先的公司 你将会开始思考 是否可以有改善 你的公司或其他组织 使用人工智能的能力 本周你将会学到 机器学习能做什么和不能做什么 在我们的社会,报章杂志 以及学术论文 倾向于只讨论 关于机器学习和人工智能成功的案例,我们几乎 从来没有见过任何失败的案例 这是因为失败的案例没有新闻报道的价值 但是为了能让你从现实的角度重新审视 人工智能和机器学习能干什么不能干什么 我认为 让你同时看到成和败的案例至关重要 你可以更准确钱的判断 哪些技术可以用,那些技术不应该尝试 很多最近兴起的对于机器学习的热潮 其实都来自于 深度学习的发展 深度学习又被称为神经网络 在本周最后的两段视频中 你能看到 对于深度学习直观的解释 你能更好的了解它们能做什么 特别是用于一组弱人工智能任务 所以,这就是你 在这周的课程中将学到的 你将明白 人工智能技术能做什么不能做什么。
第二周, 你将学到如何用这些 AI 技术 创造具有价值的项目。 你将对创造 AI 项目有些感觉, 并且,你将学会怎样选择 在技术上可行的项目, 而且它们能对你本人, 你的公司、或其他组织都是有价值的 当你明白建立一个人工智能项目需要什么之后 在第三周你将学习 如何把人工智能技术应用到你的公司 如果你想 使你的公司擅长人工智能 你会看到人工智能转型手册 学习如何创建一个人工智能团队和复杂的人工智能产品 最后,人工智能正在对社会产生极大的影响 在第四周(最后一周) 你将学到人工智能系统其实会会产生偏差 你会学习如何减轻或者清除这些偏差 你还会学到人工智能是如何影响 发展中的经济体,以及它对劳动力的影响 你能学到怎样帮助你你自己和你的公司 更好地应对人工智能的兴起 在这个为期四周课程最后 你将会比很多大型公司的CEO们 在人工智能科技上更懂行 并且你能比他们更合格地 用你的能力去帮助 你自己, 你的公司或 其他组织去更好地应对人工智能的兴起 我希望在学完这个课程之后 你将能够 领导其他人去应对这些挑战 解决这些问题 驱动人工智能兴起的 主要科技之一是机器学习 但是什么是机器学习? 让我们在下一个视频中一探究竟
欢迎大家使用人工智能。人工智能正在改变我们的工作和生活方式,这门非技术课程将教你如何驾驭人工智能的崛起。不管你是想知道这些流行语背后的意义,还是想在个人场合、公司或其他组织中使用人工智能,本课程都会教你如何使用。如果你想了解人工智能如何影响社会,以及如何驾驭它,你也可以从这门课程中学到这一点。在这第一周,我们将通过切断炒作,给你一个人工智能到底是什么的现实观点开始。我们开始吧。你可能已经看过关于人工智能创造多少价值的新闻报道。根据麦肯锡全球研究所的一项研究,预计到2030年,人工智能每年将创造13万亿美元的额外价值。尽管人工智能已经为软件产业创造了巨大的价值,但是未来创造的价值中有很大一部分是在软件产业之外的。在零售、旅游、运输、汽车、材料、制造等行业。我不认为人工智能在未来几年会对这个行业产生巨大的影响。我和我的朋友们互相挑战,说出我们认为人工智能不会产生巨大影响的行业名称。我最好的例子是美发行业,因为我们知道如何使用人工智能机器人自动化美发。但是,我曾经在舞台上说过这句话,我的一个机器人学教授朋友那天也在观众席上,她站起来,看着我的眼睛说,“你知道,安德鲁,大多数人的发型,我不能让机器人那样剪头发。”但她看着我说,“你的发型,安德鲁,机器人也能做到。”关于人工智能有很多令人兴奋的东西,但也有很多不必要的炒作。其中一个原因是因为人工智能实际上是两个不同的概念。我们今天在人工智能领域看到的几乎所有进步都是人工狭义智能。这些人工智能可以做一件事情,比如智能扬声器、自动驾驶汽车或人工智能,在农场或工厂进行网络搜索或人工智能应用程序。这些类型的人工智能是一个骗局,但当你找到合适的骗局,这可以是难以置信的宝贵。不幸的是,人工智能还涉及到 AGI 或人工通用智能的第二个概念。这就是构建人工智能的目标。它们可以做人类能做的任何事情,甚至可能是超级智能,它们可以做比任何人类都多的事情。我看到了人工智能和狭义人工智能的巨大进步,但对于 AGI 和人工通用智能几乎没有任何进步。这两个目标都是有价值的,但不幸的是 ANI 的快速进步是非常有价值的,这使得人们得出结论,人工智能有很多进步,这是真的。但是这使得人们错误地认为 AGI 可能也有很多进步,这导致了一些非理性的恐惧,害怕邪恶聪明的机器人现在随时会来接管人类。我认为 AGI 对于研究人员来说是一个令人兴奋的目标,但是在我们实现这个目标之前,大多数的技术突破都需要几十年、几百年甚至几千年的时间。考虑到 AGI 离我们有多远,我认为没有必要过分担心这个问题。在本周,你将学习 ANI 能做什么,以及如何将它们应用到你的问题上。在本文后面的部分,当然你还会看到一些关于 ANI 的案例研究,这个小把戏可以用来构建真正有价值的应用,比如智能扬声器和自动驾驶汽车。在本周,你将了解为什么这个人工智能。你可能听说过机器学习,下一个视频将教你什么是机器学习。您还可以了解什么是数据,什么类型的数据是有价值的,但是哪些数据是无价值的。你可以了解是什么让一个公司成为人工智能公司或者人工智能第一公司,这样你就可以开始思考是否有办法提高你的公司或者其他组织使用人工智能的能力,重要的是,这周你也学到了机器学习能做什么和不能做什么。在我们的社会中,报纸和研究论文往往只谈论机器学习和人工智能的成功故事,我们几乎从来没有看到任何失败的故事,因为它们只是没有那么有趣的报道。但是对于你对人工智能和机器学习能做什么或不能做什么有一个现实的看法,我认为重要的是你看到两者的例子,这样你就可以对你可能和也许不应该尝试使用这些技术做出更准确的判断。最后,许多最近兴起的,机器学习已经被深度学习的兴起所驱动。有时也称为神经网络。在本周的最后两个可选视频中,你还可以看到深度学习的直观解释,这样你就可以更好地理解他们能做什么,特别是对于一系列狭窄的 ANI 任务。所以,这就是你们本周学到的,到本周末,你们已经了解了人工智能技术,以及它们能做什么和不能做什么。在第二周,您将学习如何使用这些人工智能技术来构建有价值的项目。你会了解到建立一个人工智能项目是什么感觉,以及你应该做什么,以确保你选择的项目在技术上可行,对你或你的企业或其他组织有价值。
在学习如何建立人工智能项目之后,第三周你将学习如何在你的公司建立人工智能。特别是,如果你想让你的公司在人工智能方面做得更好,你可以看到人工智能的转型剧本,学习如何建立人工智能团队,以及如何建立复杂的人工智能产品。最后,人工智能正在对社会产生巨大的影响。在第四周,也是最后一周,你将学习人工智能系统如何产生偏见,以及如何减少或消除这种偏见。你还可以了解人工智能是如何影响发展中国家的经济,人工智能是如何影响就业的,并且能够更好地为自己和组织驾驭人工智能的崛起。在这四个资源的最后,你将比大多数大公司的首席执行官更加了解人工智能技术,也更有能力帮助你自己或你的公司或其他组织驾驭人工智能的崛起,我希望在这个课程之后,你将能够为他人提供领导力,同时他们也能驾驭这些问题。现在,推动人工智能最近崛起的主要技术之一是机器学习。但是什么是机器学习?让我们看看下一个视频。
Machine Learning6分钟
The rise of AI has been largely driven by one tool in AI called machine learning. In this video, you'll learn what is machine learning, so that by the end, you hope we will start thinking how machine learning might be applied to your company or to your industry. The most commonly used type of machine learning is a type of AI that learns A to B, or input to output mappings. This is called supervised learning. Let's see some examples. If the input A is an email and the output B one is email spam or not, zero one. Then this is the core piece of AI used to build a spam filter. Or if the input is an audio clip, and the AI's job is to output the text transcript, then this is speech recognition. More examples, if you want to input English and have it output a different language, Chinese, Spanish, something else, then this is machine translation. Or the most lucrative form of supervised learning, of this type of machine learning maybe be online advertising, where all the large online ad platforms have a piece of AI that inputs some information about an ad, and some information about you, and tries to figure out, will you click on this ad or not? By showing you the ads you're most likely to click on, this turns out to be very lucrative. Maybe not the most inspiring application, but certainly having a huge economic impact today. Or if you want to build a self-driving car, one of the key pieces of AI is in the AI that takes as input an image, and some information from their radar, or from other sensors, and output the position of other cars, so your self-driving car can avoid the other cars. Or in manufacturing. I've actually done a lot of work in manufacturing where you take as input a picture of something you've just manufactured, such as a picture of a cell phone coming off the assembly line. This is a picture of a phone, not a picture taken by a phone, and you want to output, is there a scratch, or is there a dent, or some other defects on this thing you've just manufactured? And this is visual inspection which is helping manufacturers to reduce or prevent defects in the things that they're making. This set of AI called supervised learning, just learns input to output, or A to B mappings. On one hand, input to output, A to B it seems quite limiting. But when you find a right application scenario, this can be incredibly valuable. Now, the idea of supervised learning has been around for many decades. But it's really taken off in the last few years. Why is this? Well, my friends asked me, "Hey Andrew, why is supervised learning taking off now?" There's a picture I draw for them. I want to show you this picture now, and you may be able to draw this picture for others that ask you the same question as well. Let's say on the horizontal axis you plot the amount of data you have for a task. So, for speech recognition, this might be the amount of audio data and transcripts you have. In lot of industries, the amount of data you have access to has really grown over the last couple of decades. Thanks to the rise of the Internet, the rise of computers. A lot of what used to be say pieces of paper, are now instead recorded on a digital computer. So, we've just been getting more and more data. Now, let's say on the vertical axis you plot the performance of an AI system. It turns out that if you use a traditional AI system, then the performance would grow like this, that as you feed in more data is performance gets a bit better. But beyond a certain point it did not get that much better. So it's as if your speech recognition system did not get that much more accurate, or your online advertising system didn't get that much more accurate that's showing the most relevant ads, even as you show the more data. AI has really taken off recently due to the rise of neural networks and deep learning. I'll define these terms more precise in later video, so don't worry too much about what it means for now. But with modern AI, with neural networks and deep learning, what we saw was that, if you train a small neural network, then the performance looks like this, where as you feed them more data, performance keeps getting better for much longer. If you train a even slightly larger neural network, say medium-sized neural net, then the performance may look like that. If you train a very large neural network, then the performance just keeps on getting better and better. For applications like speech recognition, online advertising, building self-driving car, where having a high-performance, highly accurate, say speech recognition system is important, enable these AI systems get much better, and make speech recognition products much more acceptable to users, much more valuable to companies and to users. Now, a few couple of implications of this figure. If you want the best possible levels of performance, your performance to be up here, to hit this level of performance, then you need two things: One is, it really helps to have a lot of data. So that's why sometimes you hear about big data. Having more data almost always helps. The second thing is, you want to be able to train a very large neural network. So, the rise of fast computers, including Moore's law, but also the rise of specialized processors such as graphics processing units or GPUs, which you'll hear more about in a later video, has enabled many companies, not just a giant tech companies, but many many other companies to be able to train large neural nets on a large enough amount of data in order to get very good performance and drive business value. The most important idea in AI has been machine learning, has basically supervised learning, which means A to B, or input to output mappings. What enables it to work really well is data. In the next video, let's take a look at what is the data and what data you might already have? And how to think about feeding this into AI systems. Let's go on to the next video.
中文字幕:
1、
欢迎观看AI for everyone
人工智能正在改变我们工作和生活的方式
这个通俗易懂(不含有专业词汇)的课程会教你
理解人工智能的发展。
无论你是想更深入了解人工智能流行的背后,
或是
你想把人工智能应用到你的生活,
公司,或其他组织中。
这个课程会教你如何达成这些目标。
如果你想了解人工智能是如何影响社会的,
以及你如何驾驭它,
你也会从这个课程中学到这些。
这个星期,
我们将抛开对人工智能的炒作, 让你
对人工智能有更加客观的了解。让我们开始吧。
你可能看过
关于 AI 创造了多少价值的新闻。
根据麦肯锡全球研究所的一项研究
AI 估计会增加
每年 13 万亿美元的
价值 (在2030 年之前)。
尽管 AI 已经在软件行业创造
了大量的价值,
未来人工智能将会在
在软件产业之外创造更多的价值。
在零售、旅游、交通、
汽车、材料、制造等。
我很难想像
有哪一个行业,
在接下来几年里,
人工智能不能对它产生巨大的影响。
我和我的朋友们常常挑战对方说出
某一个行业不会受到AI 巨大的影响。
我最好的例子是美发行业, 因为我们
不知道如何使用人工智能机器人自动美发。
但是, 我曾经在演讲的时候提过这一点
当天观众中有一个朋友
是一位研究机器人的教授,
那天她站了起来,
看着我的眼睛说,
"安德鲁, 大多数人的发型,
我不能让机器人剪出他们的发型 ",
但她看着我说
"你的发型, 机器人倒是可以剪出来 ( 嘲笑Andrew教授的发型)。
现实中有很多令人兴奋的, 但也有很多
关于 AI 的不必要的炒作。
其中一个原因是
AI 实际上是两个独立的概念。
几乎所有我们可以看到的人工智能中的进展
都是弱人工智能 (ANI)。
这些都是用 AI 做
一件事, 如一个智能音箱或
自动驾驶或网络搜索或 AI
在农业或工厂中的应用。
这些类型的 AI 只是
单方面的成果。但当你找到合适的技巧,
这可能是非常有价值的。
但是,AI 也包含它的
第二个概念
强人工智能(AGI)。
这就是构建 AI 的目标。
他们可以做任何人类能做的事情, 甚至可能是
超过人类智能的事和其他
任何人类都做不到的事情。
我看到了大量 ANI(弱人工智能)的进步
但是几乎没有
在 AGI (强人工智能)方面的进展。
这两个都是有价值的目标,
不幸的是, ANI的快速发展
(虽然它相当有价值),
导致人们认为
整体人工智能有很大的进步 (这倒是是对的结论)。
但这让人们
错误地认为,
AGI 也有很大的进展
这导致一些非理性的恐惧
比如聪明但邪恶的机器人会
随时替代人类。
我想强人工智能是
一个令人兴奋的目标, 值得更多研究人员的工作,
但它仍需要多方面的
技术突破才能实现。
这意味着几十年或
几百年甚至几千年的探索。
正是因为强人工智能时代还离我们相当遥远
我认为没有必要过分担心这件事。
这一周里, 你将了解到 ANI
可以做什么, 以及如何将它们应用到您的问题中。
后面的教程,你将会
看到一些关于弱人工智能的案例研究
这些单一的人工智能可以用来建立
非常有价值的应用, 如
智能音箱和自动驾驶汽车。
在这一周里, 你将了解什么是 AI。
你可能听说过机器学习
下一个视频将教你什么是机器学习。
您还可以了解什么是数据以及什么类型的数据
是有价值的, 以及
什么类型的数据是没有价值。
你知道是什么让
一个公司成为人工智能公司或人工智能优先的公司
你将会开始思考
是否可以有改善
你的公司或其他组织
使用人工智能的能力
本周你将会学到
机器学习能做什么和不能做什么
在我们的社会,报章杂志
以及学术论文
倾向于只讨论
关于机器学习和人工智能成功的案例,我们几乎
从来没有见过任何失败的案例
这是因为失败的案例没有新闻报道的价值
但是为了能让你从现实的角度重新审视
人工智能和机器学习能干什么不能干什么
我认为
让你同时看到成和败的案例至关重要
你可以更准确钱的判断
哪些技术可以用,那些技术不应该尝试
很多最近兴起的对于机器学习的热潮
其实都来自于
深度学习的发展
深度学习又被称为神经网络
在本周最后的两段视频中
你能看到
对于深度学习直观的解释
你能更好的了解它们能做什么
特别是用于一组弱人工智能任务
所以,这就是你
在这周的课程中将学到的
你将明白
人工智能技术能做什么不能做什么。
第二周,
你将学到如何用这些 AI 技术
创造具有价值的项目。
你将对创造
AI 项目有些感觉,
并且,你将学会怎样选择
在技术上可行的项目,
而且它们能对你本人,
你的公司、或其他组织都是有价值的
当你明白建立一个人工智能项目需要什么之后
在第三周你将学习
如何把人工智能技术应用到你的公司
如果你想
使你的公司擅长人工智能
你会看到人工智能转型手册
学习如何创建一个人工智能团队和复杂的人工智能产品
最后,人工智能正在对社会产生极大的影响
在第四周(最后一周)
你将学到人工智能系统其实会会产生偏差
你会学习如何减轻或者清除这些偏差
你还会学到人工智能是如何影响
发展中的经济体,以及它对劳动力的影响
你能学到怎样帮助你你自己和你的公司
更好地应对人工智能的兴起
在这个为期四周课程最后
你将会比很多大型公司的CEO们
在人工智能科技上更懂行
并且你能比他们更合格地
用你的能力去帮助
你自己, 你的公司或
其他组织去更好地应对人工智能的兴起
我希望在学完这个课程之后
你将能够
领导其他人去应对这些挑战
解决这些问题
驱动人工智能兴起的
主要科技之一是机器学习
但是什么是机器学习?
让我们在下一个视频中一探究竟
2、
人工智能的兴起在很大程度上是由
机器学习的人工智能工具推动的
在这个视频中,你会学习到什么
是机器学习, 那么在最后,
希望我们会开始思考怎样把机器学习
应用于您的公司或您的行业。
最常用的
机器学习类型是
学习如何从A到B
也就是从输入到输出的映射
这被称为监督学习
让我们看些例子
如果输入 A 是一封电子邮件, 并且
输出B表示是(1)或不是(0)垃圾邮件
这就是
用于构建垃圾邮件筛选器的AI的核心思想
如果输入A就是一段音频片段,
AI的任务是将语音转化为文本,
这就是语音识别
还有更多的例子, 如果你想
把你输入的英语变成其他的语言
中文, 西班牙语, 或者别的语言,
那么这就是机器翻译
最赚钱的监督学习,
以及类似这种类型的机器学习
也许是在线广告
所有大型在线广告平台都有
一个AI推荐系统, 输入一些关于一个广告的信息,
还有一些关于你的信息
然后试图预测
你是否会点击这个广告
向你展示你最有可能点击的广告,
是非常有利可图的
也许这不是最鼓舞人心的应用
但这会对当前的经济产生巨大的影响
如果你想造一辆自动驾驶汽车,
其中关键的人工智能技术
是将图像作为AI的输入,
和一些从
雷达, 以及其他传感器获取到的信息
然后输出周围汽车的位置,
这样你的自动驾驶就能避开其他车
还可以看到制造业中的例子,
我其实为制造业做了很多
AI的工作
就是把你制造的东西的图片作为输入
例如一张
在装配线上的一部手机的图片
这是一张手机的照片
而不是用手机拍摄的照片
你想要的输出
是看这个手机是否有划痕, 还是凹痕,
或其他一些缺陷在
你制造的这个东西上。
这叫做外观(视觉)检查, 这可以帮助
制造商减少或
防止他们制造的东西出现缺陷
这种被称为监督学习的人工智能技术,
是学习从输入到输出,
或A到B的映射
一方面, 输入到输出,
A 到 B 似乎是相当有限的
但是, 当您找到合适的场景来应用它们的时候,
这可能是非常有价值的。
监督学习的概念
其实已存在几十年了
但它迅猛的发展还是在
这过去的几年里,为什么会这样?
我的朋友问我,“Andrew
为什么监督学习等到现在才飞速发展“
我给他们画了一张图
我现在给你看这张照片
你也可以把这张图
画给其他问你同样问题的人
让我们假设横坐标表示
在某项任务中我们拥有的数据量
也就是说, 对于语音识别,
这就代表
音频数据和语音文本的数量
在很多行业,
您可以拿到的数据量
在过去的几十年里确实有了增长
这得益于互联网的兴起
和计算机的兴起
很多以前记录在纸上的信息
现在已被记录在数字计算机上
我们正在收集越来越多的数据
现在, 让我们假设纵坐标表示
人工智能系统的性能
如果你使用传统的人工智能系统
它的性能会像这样增长
当你输入更多的数据时
它性能会变得好一点
但当数据量超过一定范围之后,
它的性能并不会持续增加
好比说,你的语音识别系统
并不会因为你提供了更多的数据,
就变得更加准确,你的在线广告系统
并不会因为你提供了更多的数据,
就能够显示越来越相关的广告
AI 最近真正地飞速发展, 得益于
神经网络和深度学习的兴起。
我将在以后的视频中更精确地定义这些术语,
现在不必要担心这些看似复杂的术语
但随着现代人工智能技术
以及神经网络,和深入度学习的技术
我们看到的是
如果你训练一个小的神经网络
那它的性能 (蓝线)是这样的
但当你向它提供更多的数据时
它的性能(蓝线)提升会持续更长的时间
如果你训练一个稍大一点的神经网络
例如中型神经网络
那它的性能 (紫线)可能是这样的
如果你训练一个非常大的神经网络
那么它的性能 (绿线)会
不断变得越来越好
对于语音识别,
在线广告, 自动驾驶等应用,
拥有高性能,
高准确率
比如,
如果这些人工智能系统变得更好,
因此制作出很棒的语音识别产品
这样更容易被用户接受,
对公司和用户更有价值
现在来看看这个图的几个含义
如果您想要最好的性能,
那这个性能需要在这里
达到这样的性能水平
你需要知道两点,第一
拥有大量的数据
这就是为什么有时你会听到大数据
数据量总是多多益善的
第二, 你要能够
训练一个非常大的神经网络
所以, 快速计算机的兴起, 包括摩尔定律,
还有
专用处理器的发展, 例如
图形处理单元或 GPUs,
在之后的视频中会深入探讨
使许多公司
,不仅仅是科技巨头
还有许多其他公司
能够用足够大的数据集
来训练大型神经网络, 以获得
非常好的性能和商业价值
人工智能中最重要的概念是机器学习,
这包括监督学习,
也就是,从A到B,
或者是从输入到输出的映射。
数据能使它有很好的表现。
下一个视频中,
让我们来看看什么是数据?
让我们看看哪些数据是你已经拥有了的?
如何将数据输入AI系统
我们下一节再见
3、
你可能听说过, 数据
对于构建AI系统是非常重要的
但是, 到底什么是数据? 让我们一探究竟。
让我们看一个例子,一个数据表格,
我们也称之为数据集。
如果你想知道怎样
给你想要买或者卖的房子定价
你可能会收集类似这样的数据集
这可能是一个电子表格
比如一个微软Excel电子表格
其中一列是房子的大小,
比方说单位是平方英尺或平方米,
第二列是房子的价格。
也就是说, 如果你想建立
一个AI系统或机器学习系统, 以帮助
您设置房子的价格
或者看已有定价是否合理,
你可能会把A设定为房子的大小
把B设房子的价格
然后让一个AI系统去学习
这个输入到输出的过程,或者说 A 到 B 的映射。
但我们不想只是
根据房子的大小来定价
你可能会想要
收集
房间数量的数据。
这样的话, A 就可以代表前两列数据,
B 可以只代表房子的价格。
所以, 当给定一个数据表,
这时侯就取决于你
或者你的业务所需
来决定什么是 A, 什么是 B。
您的企业通常会有很独特的数据,
像这个数据例子,
可能来自于一个称城乡机构
他们想给新建的房子定价。
这就完全由你来决定什么是 A 什么是 B,
以及如何定义 A 和
B,以此增加你的业务有价值。
另一个例子是,如果你有一定的预算
你想知道
你能买得起多大的房子
那么你可能会把
输入 A 定义为在一个房子上的花费
把B 定义为房子的大小,
这将是对A 和 B 完全不同的选择
它们会告诉你
在某一个预算下
多大的房子
是你可能会考虑的
这里有另一个数据集的例子
假设您要构建
识别图片中的猫的人工智能系统。
虽然我不知道你为啥要建这么一个系统,
但也许这是一个有趣的手机app。
你想给猫的照片贴上标签
你可以收集一个数据集, 其中
输入 A 代表一组
不同的图像, 输出 B 是它们的标签, 例如
"第一张照片是一只猫, 第二张不是猫。
这是一只猫, 那不是一只猫 ",
这个AI 系统接收图片 A 然后输出
一个标签。也就是说你可以用以标记
所有
在你的照片集或移动App里猫咪照片
在机器学习的传统中,
有很多关于猫的例子。
我觉得其中的一些是在我
领导谷歌大脑团队的时候
那时我们公布了一些结果,
是有关谷歌猫的。
在这个项目里,人工智能系统
从youtube 视频中学习如何会识别猫。
自那以后,
把猫作为一个谈论
机器学习的例子就成为了习俗。我对
所有的爱狗人士感到抱歉。我也是很喜欢狗狗的。
因此, 数据相当重要
但如何获得数据?
如何收集数据?
获取数据的方法之一是手动标记。
例如, 您可能会收集一组
照片,就像这里所示。
然后你自己或其他人
去一一标记这些图片
也就是说,第一个标记是猫
第二个不是猫
第三个是猫, 第四个不是猫。
通过手动标记这些图像中的每一个,
你现在有了一个用于构建猫探测器的数据集。
实际上这需要四张以上的图片才能真正做到。
你可能需要几十万张照片
但手动标签是
一个让你同时拥有
A 和 B数据集的有效方法。
获取数据集的另一种方法是从
观察用户行为或其他类型的行为。
例如, 假设你运行
一个在网购网站。
像是电子商务
在这个网站上
不同的物品会有不同的价格
你可以观察用户是否购买了你的产品
所以, 仅仅通过购买或不购买
你产品的用户行为
你就可能收集到这样的数据集
你可以在用户访问你网站的时侯
存储用户名
你向用户所提供的某一产品的价格
以及他们是否购买了它
所以, 当用户只是使用了你的网站的时候
这个过程就生成这些数据
这是观察用户行为的一个例子
我们也可以观察
其他事物的行为, 比如机器
如果你在工厂里运行一台大机器
并且你想预测
一台机器是否即将坏掉或出现故障
那么在仅仅只观察机器表现的时候
你就可以记录一个像这样的数据集
这里有机器序列号
机器的温度
机器里的压强
和机器之前是否出现过故障
如果你的程序是为了进行预防性维护
比如你想知道一台机器是否将要坏掉
那么你可以这样,比如,
选择这几列数据作为输入 A
并选择那个作为输出 B
来判断一台机器是否即将出现故障
如果是的话, 你可能需要
对机器进行预防性维护
第三种非常常见的获取数据的方法是
从网站上下载
或从合作伙伴那里获取
多亏了开放的互联网
有非常非常多的数据集可供你免费下载
从计算机视觉或图像数据集
到自动驾驶汽车数据集
到语音识别数据集
到医学成像数据集以及很多其他的
因此, 如果你的应用需要某一类型的数据
只要遵守许可证和版权的规则
便可直接从网上下载
这可能是一个
让你建立应用的不错的方式
最后,如果你有一个合作伙伴
比如你在一个工厂工作
也许这个时候他们已经
收集了一个很大的数据集可以给你
比如机器,温度,
还有机器出现故障与否时的压强
数据是重要的,但是它有些被炒得过热了
而且有时候被误用了
让我给你描述两个
最常见的误用
亦即错误思考数据的方式
当我跟一些大型公司的首席执行官交谈时
他们中有些人甚至对我说
嘿 Andrew, 给我三年时间来建立我自己的IT团队
我们现在正在搜集很多的数据
这样在三年后,我就会有这个完美的数据集了
那时我们就会启用AI了
这其实是一个非常糟糕的策略
相反,我想建议每家公司的是
一旦你开始搜集了一些数据
马上把数据展示给
或者将数据喂给某一个AI团队
因为大多数情况下AI团队可以
反馈给你的IT团队
哪种类型的数据是需要收集的以及
应该继续构建哪种类型的IT基础架构
举个例子,也许一个AI团队能看了你的工厂数据
然后说,嘿,你知道吗?
如果你可以
从这个大制造机器里
不仅仅是每十分钟
而是每分钟就收集一次数据
那么我们可以帮你构建一个
更棒的防御性维护系统
所以, IT团队和AI团队之间
经常会有这种相互作用
我的建议通常是早点从
从AI团队那里获得反馈
因为它可以帮助引导
你IT基础构架的发展
另外,说到数据的误用
很不幸,我看到一些首席执行官
在通过新闻了解到数据使用的重要性后
然后就说,
既然我有这么多数据
那AI团队肯定能用它们创造价值
不幸的是,这并不总是如此
通常数据多确实比数据少要好
但是我会不要因为你有数不完的数据
就理所当然地认为
AI团队能奇迹般的使它们变得有价值
因此, 我的建议是不要认为只要扔数据给AI团队
就假设它们会创造价值
事实上, 在一个极端的例子里
我见过一家公司收购了了
一大堆其它医药公司的数据,
理论上讲,
假设性地来看,他们的数据将会非常有价值。
到如今几年后,
就我所知,工程师们还没有
弄明白如何
使用这些数据并且真正地从中创造价值。
所以,有时候它会奏效,有的时候不会。
但不要为了只是为了获取数据
而过度投资
除非同时聘用
一个AI团队来研究这些数据。
因为,他们可以帮助指引你去思考
那些数据是最有价值的。
最后,数据是散乱的。
你也许听过“垃圾进垃圾出”这句话,
如果你的数据质量差,
那么AI会学习出不准确的结果。
这一些是数据问题的例子。
比方说你有一个数据集,包括房子的大小、
卧室的数量和房价
你可能有不正确的标签或者不正确的数据
例如,这个房子不太可能只卖了
0.001千美元(仅仅1美元)
或者,数据有可能会缺失,比如
这里有一堆未知的值
所以,你的AI团队需要去解决
如何清理数据,
如何处理这些不正确的标签
和这些缺少的值
数据还会有很多不同的类型
例如,有时候你会听说
图片、视频和文本
这些类型的数据,人类
很容易理解。这些类型的数据
我们称之为“非结构化数据”
有一些
AI技术能够
识别图片图片是不是猫或者
将语音转化为文字
或者识别垃圾邮件
还有一些类似右边的数据集
这是一个结构化数据的示例。
简单说,结构化数据储存在
一个巨大的表格里
处理这些
非结构化数据的技术要比
处理这些结构化数据的技术
难一点
但无论是那种类型的数据
,非机构化数据或者结构化数据
AI 技术都表现出色
这集视频中,你学习了什么是数据
你也学习到如何不误用用数据
比如,花重金投资一个
IT基础系统,寄希望于
这在未来会将AI派上用场
但是我们实际需要检查的是,
看这些数据是否对你想要建立的AI程序有用
你会发现数据其实很混乱
但是一个好的AI团队会
帮助你解决这些问题
当人们提到AI的时候会用到一些难以理解的术语
比如AI,
机器学习、数据科学
在下一个视频,我想
和你们分享这些术语真正的含义
这样你就能自信地
准确地和其他人谈论这些概念
我们下一节再见
4、
你可能听说过一些人工智能的术语,
比如机器学习
或数据科学、神经网络、深度学习
这些术语是什么意思呢?
在这个视频中
你会学习到这些人工智能中最重要的术语
这样你就能跟别人谈论它们
并思考怎样把他们应用到企业中
让我们开始吧
假设你有一组房子数据,其中包括房屋大小
卧室的数量, 浴室的数量,
房屋是否重新装修,以及价格
如果你想开发
一个手机应用来给房屋定价
那这些将是输入A
这是输出B
那么,这就是一个机器学习系统
具体来说
这种机器学习系统
学习输出输入
或A到B的映射
所以, 机器学习往往会产生出
在一个运行的AI系统
也就是说,它是一个你可以任何时候
自动输入A(房屋属性)
然后输出B(价格)的软件。
所以, 如果你有一个运行的人工智能系统
去服务几十或几十万
甚至数以百万计的用户
那通常就是一个机器学习系统
与此相比,你还可以做其他一些工作
例如请一个团队分析你的数据集
好从数据里面获取一些提示
也就是说,这个团队可能会得出这样的结论
"如果你有
两栋大小相似的房子,
有类似的面积,
如果其中一间房有三间卧室
那么他的花费比两间卧室的房子要高很多
即使两栋房子的整体面积一模一样
或者, "你知道吗?
新装修的房屋定价高出旧房子15%”
这可以帮助你决策分析, 比如
如果你已经决定要建造一定面积的房子,
那把它们修成两个卧室的房子,
还是三个卧室的, 可产生最大的价值?
或者,
投资翻新一个房子,
是否真正可以提高
你房子的出售价格?
以上这些都是数据科学案例
数据科学项目的结论通常
一些帮助你做商业决定
的见解
比如,建造哪种房屋
或者,否需要投资来翻新房子
这两个术语 --
机器学习和数据科学 --
的界限是有点模糊的,
这些术语
在当今行业并不是使用得很一致
但我在这里提到的
是这些术语最常使用的定义,
但是你不会查到对
它们固定的定义。
现在我想把这两个定义更加系统化,
机器学习是一个
让电脑在不被编程的情况下,就可以自己学习的研究领域
无需显示编程。
这是Arthur Samuel几十年前提出的定义。
Arthur Samuel 是
机器学习的先驱之一,
他以编写了一个跳棋程序而闻名。
这个程序可以玩跳棋,
比Arthur本人,
玩得更好。
所以,机器学习项目
通常会带出一个运行的软件,
用给定的A,得到输出B。
与机器学习相比,数据科学是
通过挖掘数据来获取见解。
所以,通常
一个数据科学项目的结果是一组幻灯片,
它们包括一些
帮助高管们
采取商业行动的结论,或者是一些
帮助产品团队决定 如何改善网站的结论。
让我给一个在线广告领域里的
机器学习与数据科学的例子。
当今,几乎所有大型商业平台,
都有AI系统在内,以此快速
知晓你最有可能点击的广告是什么
所以,这就是机器学习系统
事实证明,这是一个
利润非常丰厚的人工智能系统,
它的输入是关于你和那些广告的信息,
输出就是判断你是否会点击某一个广告
这些系统不停地运作
这些机器学习系统
为这些公司增加广告收入
这其实就是一个软件在背后运作
相比之下,我还在
网络广告行业做过数据科学项目。
例如,如果数据分析告诉你,
旅游业的公司没有购买足够的广告,
这时候,如果你能派出更多销售人员
向旅游公司出售广告,
你可以说服他们使用更多广告,
这便是
数据科学项目
一个例子,这个项目的结果就是
高管们决定要销售团队
花更多的时间去游说旅游业。
即使在同一家公司,
也会有不同的机器学习项目
和数据科学项目,
这两者都非常有价值
你也许还听说过深度学习
那么,什么是深度学习?
假设你想要预测房价
你想给房子定价
所以,你会有一个输入,其中
包括房子的大小,
卧室数量,浴室数量
以及是否是新装修的。
给房屋定价最有效的方法之一是,
把输入A提供给
这个东西,然后让它输出一个价格。
这个东西叫做神经网络,
有时也称之为
人工神经网络
这是为了将它与
人脑中的神经网络区分开来
人类的大脑是由神经元组成的
当我们说人工神经网络时,
只是为了强调
这不是生物大脑
而是一个软件
神经网络的功能,
或者人工神经网络的功能
是运用输入A,
就是全部这四个东西,
然后输出B,
就是房屋的估值。
在本周的后续可选视频中,
我会告诉你更多,
这个人工神经网络究竟是什么
但是所有的人类认知都是由
大脑中的神经元组成的,通过电脉冲,
相互传递小信息
当我们画一个人工神经网络的图片时,
其实是与人的大脑有一个类比。
这些小圆圈被称为人工神经元,
或简称神经元。
这也使神经元相互传递
这个庞大的人工神经网络是
其实是一个大的数学方程
根据输入A,
告诉你如何计算B (价格)
如果你觉得这里有太多繁复的细节,
也不要担心
我们稍后会详细讨论这些细节
现在只需明白的是,神经网络是
一种学习A到B,或输入-输出映射
的非常有效的方法
当今,神经网络和
和深度学习几乎可以互换使用
他们的意思基本上是相同的
几十年前,这种类型的
软件被称为“神经网络”
但近年来,
我们发现深度学习
只是一个更好听的‘品牌’
所以无论好坏
这个术语是最近才兴起的
那么,神经网络(人工神经网络)
与大脑有什么关系呢?
事实证明几乎没有
神经网络最初受到大脑的启发,
但是它工作原理几乎
完全与生物大脑的工作方式无关
所以,今天我在类比
人工神经网络和
生物大脑的时候是非常谨慎的
即使它们之间有一些松散的关联
AI有许多不同的工具
在这个视频中,你了解了
什么是机器学习和数据科学
以及什么是深度学习
以及什么是神经网络
你可能也在媒体上听到
其他流行语如无监督学习,
强化学习,图形模型,
计划,知识图表等。
您不需要知道所有
这些其他术语的含义
但这些只是能够
让计算机智能化的工具
我会试着在后面的视频中让你了解
一些这些术语的含义
但我希望你能知道这些最重要的工具,
比如机器学习,
数据科学
以及深度学习,和神经网络
(神经网络)是一个非常强大的机器学习的方式
有时是数据科学(也会用到神经网络)
如果我们要绘制
维恩图来显示
这些概念是如何组合在一起的,
我们可以这样画这个图
人工智能是一套庞大的工具集
用于使计算机智能化
对于AI,最大的子集
是自机器学习的工具,
但AI还有其他工具,
比如如下的
一系列流行语
当下最重要的
机器学习的分支
是神经网或深度学习,
这是一套非常强大的工具
可以执行监督学习,或学习从A到
B映射,以及学习其他东西
但机器学习的工具里
不仅仅只有深度学习
那么,数据科学属于这个图的哪个部分呢?
大家对此其实没有一致的结论
有些人会告诉你 数据科学是人工智能的一个分支
有些人会告诉你AI 是数据科学的一个分支
所以,这取决于谁来回答这个问题
我的观点是,数据科学可能是
所有这些工具的
交叉子集加上一些额外的东西。
它使用了许多
AI机器学习和深度学习的工具
但还有其他一些独立的工具,
来推动商业方面决策等
一系列重要问题
在这个视频中,你看到了什么是机器学习,
什么是数据科学,
什么是深度学习和神经网络。
我希望这能让你了解
人工智能里最常见和最重要的术语,
你可以开始思考
怎样把他们应用到你的公司
那,对于一家擅长AI的公司来说, 这意味着什么?
我们将在下一个视频中讨论这一点
5、
什么能使一个公司擅长人工智能呢?
也许更重要的问题上是
怎样才能让你的公司
擅长使用人工智能呢?
我曾经领导过谷歌的谷歌大脑团队
和百度的人工智能小组
期间我分别帮助这两个公司
成为了非常棒的的人工智能公司
那么,你能为你的公司做些什么呢?
通过观察互联网的兴起与发展
我学会了一些我认为
能帮助我们更好地应对 人工智能兴起的经验教训
让我们一起来看一看吧!
我们从互联网的兴起中
学到的一课就是
那你最喜欢的商场举个例子
比如我跟我妻子有时候会去
斯坦福购物中心
假如你为这个购物中心 建立了一个网站
也许在这个网站上卖一些东西
这个行为本身并不会 把这个购物中心
变为一个互联网公司
实际上 ,几年前一个大型零售公司
的首席执行官曾像我说,
‘嘿Andrew,我有一个网站
我在网站上卖东西,
亚马逊有一个网站,
亚马逊也在网上卖东西,这是一回事‘
但是当然了,这并不是一回事
一个有网站的商场和
一流的互联网公司是不一样的
所以,如果在网站上售卖物品
无法定义一个互联网公司的话
什么能定义它呢?
我认为一个互联公司是一个
能够把那些互联网 让你做的事情做得很好的公司
比如说,我们会做无处不在的AB测试
意思是我们会常规性地
使用两个不同版本的网站
并且看哪个效果更好, 因为我们可以这么做
这样,我们能快得多学习.
但在一个传统的购物中心里
是很难同时拥有
两个平行宇宙里的两个商场的
并且你可能只有每个季度
或者每六个月才能对物品进行改变
而互联网公司因为有 很短的迭代周期
你可以每周都寄出新产品
或者甚至每天, 因为你可以这么做
而一个购物中心却 只能在好几个月之后
才能被重新设计,
互联网同时也更倾向于
把做决定的权利从首席执行官
推向工程师和 其他一些专门的岗位
比如产品经理
这跟一个传统的购物中心正好相反
在传统的购物中心里
也许首席执行官会做 所有重要关键的决定
其他所有人按照首席 执行官说的做就好了
事实证明,这种传统的模式 并不适用于互联网时代
因为只有那些工程师,以及其他职位
例如产品经理这样的专门岗位
才对技术产品
以及用户,有足够的了解
从而能做出好的决定
所以, 这便是一些
互联网公司所做的事情
这么做能保证它们把那些
互联网能让它们做得事情做得很好
这便是我们从互联网 时代所学到的东西
那么人工智能时代呢?
我认为如今
你可以让任何公司使用
一些神经网路或者
深度学习的算法
而仅仅这么做
并不会让这个公司 变成一个人工智能公司
相反,真正成就一个伟大的人工智能公司,
有时被称为人工智能为先的公司的是
你是否把那些通过人工智能 做到的事情做得特别好?
比如说,人工智能公司
十分擅长有策略性数据采集
这就是为什么它们当中很多
大型的消费型科技公司会有
免费产品来帮助它们采集数据
并在别处产生收入
我也带领过战略团队
去刻意地发行一些
完全不挣钱的产品
而只是为了采集数据
认真考虑如何获取数据,
是一个好的人工智能公司的关键成分
人工智能公司会 建立统一的数据仓库
如果你有50个不同的数据库
或者50不同的数据仓库
由50和不同的副总裁来负责
那么让一个工程师 去从每一个地方获取数据
综合所有数据, 然后进行分析判断,并且得出结论
这几乎是不可能的
所以很多很好的人工智能公司
先发制人地把
所有的数据全都带入一个数据仓库
以此来增加团队综合利用 所有不同数据的能力
当然,这些都是要根据隐私保障 和数据规范来进行的
比如欧盟的《通用数据保护条例》。
人工智能公司十分擅长
发现能自动化的机会
我们十分擅长,比如说,
哦!让我们把监督式学习 算法用在这个上面
和一个自动定理证明制图 (Automated Thereom Proving mapping)
这样的话,我们就不用人力来做这些事情了
我们可以把它们自动化
人工智能公司也有很多新的岗位 比如说MLE, 即机器学习工程师
和很多新的方式
给团队成员分配任务
所以,一个公司来想要变得擅长人工智能
意味着这个公司用 人工智能去做某些事情
并把它们做得很好,
一个公司想要变得擅长人工智能
确实是需要一个过程的
实际上十年前
谷歌和百度
和一些其他我并没有参与的 公司比如脸书和微软
并不像它们今天这样 如此擅长人工智能
所以,一个公司如何能够 变得擅长人工智能呢?
事实证明,变得擅长人工智能并不是一个
神秘的魔法过程
相反的, 有一个系统化的进程
能让很多公司
基本上,任何大公司变得擅长人工智能
这是一个5步人工智能转型手册
我把它推荐给想要
有效运用人工智能的公司
我在这里将做一个概括
下周我们将会讲更多的细节
第一步是启动试点项目来获得势头
只需要几个小的项目
让你大概对人工智能可以做什么,
不可以做什么有更好的了解
并且让你体验一下 做人工智能项目是什么感觉
这个你可以在公司内部做
或者外包给一个团队去做
但无论如何,你都需要做第二步
就是在公司内部 建立一个人工智能团队
并且提供广泛的人工智能培训
这些培训不仅仅要提供给 工程师,也要提供给经理
部门领导和,高级管理人员
同时还需要培训他们 如何思考人工智能
做完这个之后, 或是做这的同时
你将会对人工智能是什么 有一个更加深刻的理解
接下来对很多公司来说,
制定一个人工智能策略 是十分重要的
最后,保证内外部沟通一致
那么所有的相关人员,从员工
顾客到投资人都将清楚知道
你的公司是如何在人工智能的 兴起中找到前行方向的
人工智能在软件行业提供巨大的价值
并且会持续这样
它同时也在软件行业之外
提供了无可估量的价值
如果你能帮助你的公司 变得擅长使用人工智能
我希望你能在创造这样巨大价值的过程中
扮演领导者的角色
在这个视频中,
你了解到什么样的公司 是一个好的人工智能公司
并且简单地了解了 人工智能转型手册
我会在下一周提供 更多这个手册的细节
并且我也会提供一个能帮助公司
变得擅长人工智能的路线图
如果你有兴趣的话, 网上有一个公开的
人工智能转型手册
为你详细罗列出了 这五个步骤的具体细节
下周你也会更多地了解到这方面的内容
在进行人工智能项目时,
比如试点项目, 会遇到的一个难点
就是明白人工智能到底 能做什么,不能做什么
在下一个视频中, 我想为你展示并且举几个
人工智能可以做什么 和不能做什么的例子
来帮助你更好地 选择能让人工智能
被高效运用到你公司的项目
让我们进入下一个视频吧!
6、
在这个视频和下一段视频中
我希望能帮你 明白
AI能做什么和不能做什么
实践中,我和工程师通常
会在某个AI项目开始前
进行足够的技术调研
确保项目在技术上可行
这意味着看看数据,看看输入A和输出B
然后直观思考
这些数据是否能用上AI
不幸的是,有些CEO
会对AI有不合理的期待,
要求工程师做一些 AI技术还达不到的事情
造成这样的困扰, 是因为媒体
和有些学术文献
只报道有关
使用AI成功的案例
我们会看的一系列成功的故事
但却没有失败的案例
人们就会认为AI什么都能做
但事实并不是这样
所以,我希望通过 这个视频以及下一段视频
向你展示一些案例,介绍
哪些可以使用现今 AI 技术
哪些不能
我希望这能够帮助
训练你的直觉,去
帮助公司
选择有几率成功的项目
前面,你已经看的了一个列表
包含了一些 AI 项目
从垃圾邮件过滤、语音识别,
到机器翻译等等
有一个判断监督学习
能做什么不能做什么
的不完美经验法则是:
几乎所有你可以
一瞬间完成的事
我们在现在或者将来
都可以用监督学习来完成
利用这个“输入-输出”的映射关系
如果你想
判断周围车的位置
那这件事你可以在一瞬间完成,
又如,你想知道手机上是否有划痕
你只要看一眼
就可以瞬间得出判断
当你想要理解
或者转述别人说的话
这不会需要超过几秒的时间
虽说这是一个不完美的经验法则
但这确实是一个快速
判断哪些任务是AI可以办到的
相反的
有些事现今AI技术还无法达到:
(比如)分析市场并写一份50页的报告
(因为)人类还不能
在一瞬间写完一份50页的分析报告
这很难,至少我不能。
我不认为当今世界上有任何一个团队
知道如何
让AI系统做市场调研
然后写出一份相信的分析报告
我发现一个最好的
锻炼直觉的方法,就是看具体的例子
那就让我们看一个具体的例子:
智能客户支持的例子
就来看一个卖东西的网站的例子吧,
这是一家电子商务公司
里面有一个客户支持部门,
某天收到了这样一封电子邮件:
“我订购的玩具比预计晚到了2天,
这导致我我不能及时地把它作为生日礼物送给我侄女
我能退货吗?“ 如果你想要一个AI系统
在看这封邮件, 然后判断出这是一个退货申请
并且能将这封邮件直接转到退货部门
那我认为这个问题
用一个AI系统来解决是可行的
这个AI系统
把顾客的邮件的内容 当做输入(A)
然后,AI系统会判断出
这是一个退款申请、还是一个运输问题
还是其他申请
作出这个判断后
才能把这份邮件转到公司最合适的部门
--- 在客户支持中心里
因此,输入A就是邮件内容
输出B就是这三个判断中的一个:
- 退款问题, 2. 运输
或者物流进度查询问题, 3. 是一个其他类型的问题?
那么,这就是今天人工智能所能做的
下面是一些AI系统现在
不能完成的例子:如果你想要
AI系统根据一封电子邮件的内容, 然后自动生成
这样的回复:“哦,非常抱歉,
我希望您侄女的生日过的很好。
是的,我们可以帮您(退货),等等”
如果想让AI系统输出
类似这样一段复杂的文字
这对当下的AI系统来说,还是很难 的。事实上,
就仅仅展现出对你侄女生日的遭遇感同身受
都很难做到的
特别是你会收到很多不同类型的邮件
那有没有可能使用
一种机器学习工具,比如
深度学习算法来尝试完成这件事?
假设你给一个AI系统,
输入这个顾客的电子邮件
然后让它输出两到三个段落来
展现出感同身受和适当的回应
假设您有一个中等大小的数据集,比如
1000个用户电子邮件示例 和适当的回应
你会看到的是,
基于这种类型的数据,给AI系统
一个小的数据 -- 比如1000个示例,
这可能是你能得到的结果:
比如,一位用户发电子邮件说:
"我的箱子坏了"(顾客说)
“感谢您发来的电子邮件”(AI回答)
(顾客问)“我在哪里写评论”,(AI 回答)“感谢您发来电子邮件”
(顾客问)“退货政策是什么?”,(AI 回答)“感谢您发来电子邮件”
出现这种问题的原因是,
仅用1000个数据,来搭建一个AI系统
去学习如何撰写两到三段
合理的并且感同身受的回应
(这种数据量)是远远不够的
所以结果就只能是
不管顾客发送什么内容的邮件,这个AI
只能生成简单且相似的回应 --
-- “感谢您发来的电子邮件”,
还有一种错误的情况,
(另一种AI系统失败的案例)
就是它自动生成错乱的内容,比如:
(顾客问)“我的快递什么时候到?”,
(系统回复)“谢谢,是的,现在,你的”,这是胡言乱语。
这其实是一个很难的问题,就算
有1万个甚至10万个电子邮件示例,
我也不知道这个数据量
是不是足够多,以此确保AI系统可以实现这些功能
判断什么功能AI能和不能达到
是一个漫长且艰难的过程,
我通常不得不问
开发团队,有时候会花费几周的时间
深入了解技术
来帮助我决策这个项目的可行度
但是,为了锻炼你的直觉
来帮助你快速判断项目是否可行
这里有两个其他的经验法则
来判是否一个
机器学习的问题
是容易变得可行的。
第一,(机器)只是学习一个“简单的概念”
这更有可能实现
那什么叫做“简单的概念”?
这没有正式的定义
但可以这样理解,这个概念
不超过一秒
或者几秒的思考
就能得出一个结论,
类似这种概念就可算是一个“简单的概念”
例如,你在
一辆自动驾驶汽车里看向窗外,
那察觉其他车辆的位置,就是一个相对简单的概念
而如何写一个感同身受的回应,
来应对一个复杂的用户投诉
就不是一个简单的概念
第二,有大量的可用数据
会让机器学习问题更可行
这里的数据是指“输入A”和“输出B”
你的目标是让AI系统学会从A到B,
输入和输出映射关系
例如,在客户支持程序中
“输入A”代表的是
客户发来的电子邮件,“输出B”可以是
这些电子邮件的类型 --
-- 退款申请, 运输问题申报,
其他问题的申报 --
这三种结果之一
所以,如果你有成千上万的有A和B的电子邮件
那你建立
一个机器学习系统
来做这件事的概率将会很好
AI相当于是现今的电力
它正在改变每一个行业
但它并不是魔法
它不能完成全世界所有的事情
我希望这个视频,可以开始帮助你
锻炼你的直觉来思考它能做什么不能做什么
同时,帮助你
为你的团队选择
更加可行和有价值的AI项目
为了继续帮助你锻炼你的直觉
我想让你看看
更多的关于AI的能与不能例子
我们下节课见
7、
能开始擅长分辨AI
的能与不能的挑战之一
是我们确实需要亲眼目睹
一些AI成功和失败的真实例子
如果你平均每年做
一个新的人工智能项目,
那么看三个例子就会花费你
三年的工作经验
那真是很长一段时间
我希望
在本视频中(以及前一个视频)中
快速向你展示
一些AI成功和失败的例子,
或者它能做什么和不能做什么
以便在更短的时间内,
你可以看到多个具体的例子
帮助磨练你的直觉并选择有价值的项目
那么,我们来看几个例子吧
假设你正在制造一辆自动驾驶汽车,
这是人工智能可以做得非常好的事情,
它可以拍摄汽车前面的东西
也许只使用相机,
也可以使用雷达等 其他感官或激光雷达。
然后弄清楚,
它们的所在位置。
或其他车在哪里。
那这就是一个AI问题,输入A
就是车辆前方的图片,
或者可能是图片加上
雷达和其他传感器数据
输出B是,
其他车的位置
现如今自动驾驶汽车行业
已经找到了如何
收集足够的数据, 且有相当好的算法
来做到这一点
这个例子就是现今人工智能所能做的
接下来,这是现今人工智能 无法做到的例子,
至少这对现今人工智能还是非常困难,
即输入一张像这样的人类图片
然后输出这个人的
意图。
比如,这张图是一个建筑工人
伸手让你的车停下来,
这张图是一个想搭便车的背包客,
这是一个骑自行车的人,
她伸出左手表示想要左转,
所以,如果你试图构建
一个系统来学习A到B的映射,
其中输入A是
这些不同的人类手势的短视频,
并且输出B是,
对这些手势意图的判断,
那这个在今天还是很难做到的
部分问题在于
人的手势可以有很多不同的动作
就是说,你可以想象出很多不同的手势
要求车辆减速或停止
也就是说,人们可以做出的
不同种类的手势非常之多。
因此,很难从成千上万不同的
对你做姿态的人手中,
去收集足够的数据
来捕捉人类手势的丰富性,
更别说每一个人都可能有很多不同的手势
因此,从视频中来学习这个人的意图
实际上是一个有点复杂的概念
事实上,有时一个真人
也比较难去判断出一个手势的意图。
第二,因为这将
是一个对人生安全很重要的应用程序,
你会想要一个非常准确的
人工智能来确定
一个建筑工人是想让你停车,
还是想要你继续开。
这使这类AI系统更加困难
如果说,今天你只收集
10,000张其他汽车的照片,
许多团队将构建一个至少
具有检测其他汽车的基本功能的AI系统。
相比之下,即使你
收集了10,000人的照片或视频,
但从中也很难找到
10,000个对你的车挥手的人
就算是有了这个数据集,
我还是认为现在很难建立
一个人工智能系统来非常准确地
识别人类手势的意图,
以便在这些人周围安全驾驶。
因此,这就是为什么现今
许多自驾车队都有
一些用于检测其他车辆的部分软件功能
他们确实依靠这些技术来安全驾驶。
但很少有自驾车团队
试图依靠人工智能系统识别出
多种多样的人体姿势
并依靠它来安全驾驶
让我们再看一个例子,
假设你想构建一个AI系统
来查看X射线图像并诊断肺炎。
所有这些都是胸部X光片。
因此,输入A可以是X射线图像
输出B可以是诊断,例如
这名患者是否患有肺炎?
所以,这是AI可以做的事情
但AI不能做的
从10张解释肺炎的
医学教科书章节中
诊断出肺炎
人类可以看一小部分图像,
比如几十张图像,
再读几段医学教科书中相关的内容
就能大概开始理解究竟。
但说真的,我不知道,
如果给AI系统一本医学教科书,
什么应该是它的输入A和输出B?
或者如何将此作为
一个人工智能问题做。比如,
如果只有10个图像和几段文字,
我们怎么写一个软件来
描述胸部X射线中的肺炎
应该是什么样子。
但是,对一个年轻的医生来说,
在看几十张医学图像,
并且读上几段医学教科书,
这个医生可能就会开始学会怎么分辨肺炎。
相比之下,人工智能系统
今天真的无法做到这一点。
总而言之,以下是
机器学习的一些优点和缺点。
机器学习在试图学习一个
简单的概念时会运作良好
例如你可以用不到
一秒的脑力就可办到的事情,
以及有大量数据的事。
机器学习往往在你试图
从少量数据中学习复杂概念时
效果不佳。
人工智能中第二个
未被充分认识的弱点是:
用系统从未见过的新类型数据时执行任务,
这往往会让它表现不佳
让我举个例子,
假设你建立了一个监督学习系统,
使用A到B的映射来学习从图像中诊断肺炎,
这些是非常高分辨的胸部X射线图像。
现在,假设你把这个AI系统
应用于另外一个医院
或不同的医疗中心,
碰巧那里的X射线人员让
患者总是躺在一个奇怪的角度
或有时找出的x光有很大瑕疵。
不晓得此时的你能否观察到图像中的结构,
这里有其他物体在患者的上面。
如果人工智能系统
从左侧的数据中学习,
这些数据可能是从高质量的医疗中心获取的,
然后你把这个人工智能系统应用到
另外一个医疗中心,那里只有
类似如右侧的图像,
那AI的功能不会很好。
一个优秀的AI团队要能够改善
或减少这些问题,
但这并不容易。
这是AI
相比人类弱得多的方面之一
如果人类从左侧的图像中学习,
他们会很快适应
右侧的图像,这是因为人可以
看出来图片的不同是因为患者平躺的角度导致。
但是,人工智能系统
在新的数据面前
举一反三的能力
可能不如人类医生。
我希望这些例子可以帮助你锻炼
你对AI的能与不能有好的直觉
当它的能与不能之间的界限
对你来说还是很模糊,请不要担心
这是完全正常的,没有关系。
即使在今天, 我仍然无法在看到一个项目后
立即判断它是否可行
我在形成对某些项目的可行性
下定论之前,
我经常需要做
数周的技术调查
但我希望这些例子
至少可以帮助您开始想象
公司中可能可行且
值得探索的一些事情。
接下来的两个视频是可选的,
是对神经网络以及深度学习的
非技术性描述
请随意观看。
接下来,我们将更深入地了解
构建AI项目的
过程是什么。
我期待下周还能见到你
8、
深度学习和神经网络这两个术语 在AI中几乎可以交替使用.
并且,即使它们是非常棒的
机器学习工具,它们还是被炒作弄得有点神秘
这段视频将揭开深度学习的神秘面纱,
这样的话,你会真正了解什么是深度学习和神经网络
让我们使用一个预测市场需求的例子,
假设你正经营一家卖T恤的网站
你想知道,根据T恤的定价,
你大概可以卖出多少件T恤
接下来,你可能会有像这样的一组数据集,
T恤的价格越高, 需求越低.
所以你可能会用一条直线去模拟这个数据,
以此模拟价格的越贵,衣服卖得越少的现象
注意,卖出的件数是不可能低于零的,
也就是说当价格超过某个点后,
你认为 几乎没有人会买这种T恤.
这条蓝线其实是神经网络的最简单形式
价格可以作为输入A,
输出结果B就是估计会售出的件数。
也就是说你可以这样画这个神经网络,
把价格输入进这个圆形的东西
然后这个圆形会估计售出的件数
在人工智能的术语中,这个圆形的东西叫做
一个神经元,有时也被称为人工神经元
它的功能就是计算我画在左边的这条蓝色曲线
这种只有一个经元的网络算是最简单的神经网络
只需要输入价格,输出预估的需求
如果你把这个小圆环想成一块乐高积木
那神经网络可以看成是堆加乐高积木
直到你建出一个很大型的神经网络
让我们来看一些复杂的例子
假如你不仅有体恤的价格,
你还有顾客所需支付的邮费,
你也许还有每周在广告营销上的花费,
你可能还会选择不同材质来做T恤,比如高级的棉材料,
或者更加轻薄便宜的材料。
这些都是你认为会影响
客户对体恤的需求的因素
让我们来看看更复杂的神经网络的样子吧,
你知道你的顾客群很在意价钱,
假设这有一个神经元,我现在用蓝色画出它,
它的工作是预估客户群是否愿意买,
而购买力主要由
体恤定价和邮费决定
第二个影响客户需求量的是消息渠道,
也就是说,你的顾客知道你在卖这件体恤吗?
影响消息渠道的是你的广告营销
让我在这里画出第二个人工神经元,
它把你的广告营销预算作为输入
来输出顾客们对体恤的认知程度
最后一点,广告营销会影响顾客
对T恤质量的感觉,也就是说
顾客对你产品的质量的预判是受广告影响的,
东西的价格本身也会影响顾客对产品质量的预判
那这里我要画第三个神经元
来输入价格,营销,和材料,
来试图估计顾客对T恤质量的判断
这些前期神经元,即这些蓝色的神经元
就可以算出价位负担性,客户认知程度,和
客户对质量的判断,然后在这里多用一个神经元(黄色)
给它输入这三个因素,并且最终输出预估需求量
那这就是一个神经网络了,它的工作
就是学习这四个输入值,即A,
到输出值,即B(预估需求量)的映射。
神经网络就是用来学习这种输入输出,即AB映射的
这是一个相对较小的神经网络,只有四个人工神经元
在实际操作中的神经网络往往要大得多
动辄就有成千上万甚至更多的神经元
这里有一个小细节我需要具体讲一下,
在我刚刚描述神经网路的过程中,
你可能觉得你必须先弄清楚哪些因素决定需求,
比如可负担性,认知程度和产品被预判的质量
但是!神经网路的绝妙之处就在于
当你用神经网络来创建一个机器学习系统时,
你只需要给它输入A和输出B就可以了
它自己会把中间所有的事情搞清楚
所以建立一个神经网络,你需要做的就是
给它大量的数据,即输入A,像这样
把这些蓝神经元输给一个黄色神经元
并且你也需要标明输出的数据,比如这里的客户需求
接下来就让软件来弄清楚这些蓝色需要计算什么
从而能完全自动化地,精准地
学习由输入A到输入B的功能映射。
事实证明,只要你给它足够多的数据
并且训练一个足够大的神经网络
它能极好地学习出从输入A到输出B的映射
那么,这就是一个神经网络了。它就是一组神经元,
每个神经元会计算出一个相对简单的函数
但当你把它们像乐高积木那样堆叠在一起的话
它们可以计算出极其复杂的函数,这些函数
能极其精准地学习出输入A到输入B的映射
在这个视频中,你看到了神经网络
用于需求预测的例子
让我们在下一个视频来看一个更加复杂的例子吧!
剧透:用神经网络做人脸识别
9、
上个视频中
你看到怎样用一个神经网络
来预测需求,
但是神经网络是如何识别图片的呢?
并分析出图片里是什么呢?
或者它如何能在听到一段语音后,
明白语音的内容呢?
就让我们来看一个更复杂的例子 --
-- 用神经网络来识别人脸
比如你要建立一个能从
图片里认出人脸的系统
那一个软件是
如何能看到这个图片之后,
去明辨这个人的身份呢?
让我们把图像的小方格放大
来更好地理解电脑是怎样读图的。
这个方格对你我来说是人眼,
而电脑看到的则是
一个由像素亮度值
组成的表格
这个表格告诉电脑
图片里的每一个像素有多亮
如果这是一个黑白或者灰度图像的话
那每一个像素会以一个单独的数来呈现
来告诉你那个像素有多亮
如果是一个彩图的话
那每个像素回以三个数来呈现,
用来表示红,绿,蓝这三个
元素分别在那个像素里有多亮
所以神经网络的工作是把这些数字
作为输入,然后告诉你
图里面人的名字。
上个视频中
你看到了神经网络是如何把
四个数字 -- 分别代表
价格,运费,营销力度,体恤原料--作为输入,
然后输出客户对T恤的需求量。
在这个图像例子中,神经网络
需要输入多得多的数字来分别对应
这张图片里的像素亮度值
如果这个图片的分辨率是
长宽各一千像素(1000 * 1000)
那么总共就是一百万像素
所以,如果有一个黑白或者灰度图像
这个神经网络需要把一百万个数字作为输入
以此来对应这张图片中
所有一百万个像素的亮度
如果是一个彩色图像的话
神经网络需要把三百万个数字
作为输入,因为红蓝绿三原色
每一个都有一百万个像素的亮度
跟之前类似,你将会有很多很多
这些人工神经元来计算很多不同的数值
但不需要你来决定
这些神经元需要计算什么
神经网络自己会计算出来的。
一般来讲,当你给它一个图片时
神经网络前期的神经元
会学会探测出图片的边缘
然后后期一点的会一点点
辨认出物体的各个部分,
它们会学着辨认出鼻子,眼睛
脸颊和嘴巴的形状
然后再晚期一点的神经元,像右边这样的,
会学习辨认出不同的脸型
并且最终将学会
将这些元素融合在一起
来分辨出图片中的人是谁。
再次强调,神经网络的魔法就在于
你并不需要知道神经网络
里面到底在干嘛,
你只需要
给它很多像A这样的图片数据
和像B这样的正确人脸的身份标签,
然后这个学习算法
自己就会弄清楚这中间的
每一个神经元需要计算什么!
恭喜你看完了
这周所有的视频
现在你知道机器学习和数据科学是如何运作的了,
我很期待在下周的视频中见到你
你将学习如何建立
你自己的机器学习或者数据科学项目
下周见
监督学习
监督学习:通俗来讲,我们知道需要输出的什么,也就是说,我们知道所寻求的目标是什么类型的,然后告诉程序,让程序给出准确的判断。比较简单的数学表达是:A表示数据集,或者是一个物体的特征集,B表示输出集,就是我们所期望的输出结果所组成的集合,或者说是空间,(学习的数学多了,感觉用空间来描述还是更舒服一些);机器学习就是为了学习一个从A->B的映射,根据学出来的这个映射,我们就可以抽象出其物体的特征,然后作为输入,得到我们所期待的输出。
常见的例子:垃圾邮件分类,语音识别,机器翻译,在线广告,无人驾驶,视觉检测…
机器学习性能的分析
总而言之一句话:性能和数据量是有关系的,但还与模型的复杂度有关,这里的这个复杂度主要是指神经网络的深度。所以这里也就给了我们一个非常重要的启示,并不是说盲目的收集数据就能够提高模型的性能,还与我们对模型的认识有关,如果对模型有足够的认识的话,我相信,你一定不会盲目的去手机数据,而是想凭借自己的了解改进自己的模型,当然,如果你对模型了解不够深入,这定然很慢取得好的性能。
What is data?11分钟
直观上认识数据
举一个简单的例子:数据集存储在一个巨大的Excel表格中,其中这个数据集中的A和B是哪些列(如果修过机器学习的话,那么会很习惯的将每一列想象成一个个的特征)是A,哪些列是B。这个并不是固定的,还是由你所需要什么而确定的,专业点来讲是由业务决定的。
获取数据的方法
手动标记数据,从用户行为中获取(意为:从现实世界中物体的表现中获取,将这种行为作为数据收集起来,进行学习),从网上下载,比如爬虫 。
滥用数据的例子:
首先收集大量的数据集,然后交给AI团队去进行训练,这种效果往往不好。
这里的意思是:我们可以首先收集一些数据交给AI团队进行训练,然后AI团队会根据模型的表现进行模型估计,发现模型性能不好的问题,产生需求,从而确定所需要的数据的类型,反馈给IT团队去做,这种循环反馈的进行往往比较有效
盲目的认为大量的数据一定是有价值的。诚然,数据是有价值的,但是很多人确很难从中找出这些数据的价值。而比较好的办法是:把已有的一些数据交由AI团队处理,根据团队的反馈,有针对性的去获取数据,这种反馈可以告诉你 什么样的数据在当前是有价值的,什么样的数据在当前是没有价值的。
数据混乱
输入不好的数据,当然也就不会有好的输出,这里的输出并不是指的预测输出,在没有进行机器学习之前,提预测输出不觉得有点早吗!这里的输出是值得学习输出,输出的映射,可以认为是模型,这个模型本来就不是合格的,那么很难用它进行预测!
数据的问题:现实中的问题肯定是非常多的。这里仅仅例举了一些。不正确的标签,不合理的标签,不符合现实意义的标签(比如数学上所谓的不再值域内)。空值,又是所谓的缺失数据,缺失的数据不处理掉,肯定会对模型的训练产生影响。
显然,进行训练之前,需要大量的数据处理工作,数据处理的好与坏,还会影响了模型的性能。
各种各样类型的数据:总体而言,结构化数据和非结构化数据。结构化数据:比如Excel表格,数据库中的数据。非结构化的数据:语音,文本,图片,视频…
The terminology of AI9分钟
AI术语
机器学习和数据科学的直观理解
通常说的机器学习,更多的是指一个正在运行的应用系统,比如一个APP所实现的一些智能化的功能,一个软件所实现的智能化的功能,其实可以非常容易的发现,现在很多应用上都有机器学习的身影。
数据科学更多的是发现数据的某些规律,以对我们的决策提供参考。
机器学习和数据科学的比较正式化的理解
机器学习可以使得计算机学习一些不用通过具体的代码给出的功能。可以认为这是一种数据的规律,计算机利用这种规律做出智能化的行为。更多的是表现在软件的功能上,系统的功能上。
数据科学是从数据中获得某些知识,或者是规律,或者是视野(这里的意思相当于眼界,通俗理解为解决问题的思路,方案),以得出某种结论,帮助我们决策。主要表现为某种用于参考的结论,或者是在PPT中介绍的解决某种问题的方案。
例子:
深度学习
机器学习中有一种算法叫神经网络,主要应用在监督学习上,通过设计更多层,更大型的神经网络我们可以得到更优秀的学习算法,这就是深度学习主要的内容。深度学习的主要内容就是神经网络,可以说这两个概念是相等的,只不过"深度学习"这个更具有品牌效应。
上面这就是一个简单的神经网络,其中一个个的小圆圈叫做神经元,最初设计神经网络是受到了大脑的启发,但是它的工作方式跟生物大脑的工作方式完全无关。所以,请记住了,不要再听别人炒作说:神经网络的实现方式是模仿的大脑。准确来说,他们没有关系。不过,神经网络跟门电路颇有相似之处。
讲的更多一点,利用这么多的神经元,通过设计大型的神经网络,它可以自己输出很多特征,就像物以类聚,人以群分一样,它可以自动的把很多类似的东西聚集到一块去,于是就形成了一派一派的效果,利用这些派别似的东西,可以进行预测和判断某些性质,然后进行输出。
AI的工具
最强有力的三大工具是:机器学习,数据科学,深度学习。这写工具之间有很多交叉的地方,但各有利弊,各有其存在的价值,各有其适应的场合。
其他的一些工具:无监督学习(其实也是属于机器学习内的,不知道为什么划分到这里来了),强化学习,图模型,知识图谱…
包含关系
AI包括机器学习和其他众多的算法,,机器学习包括深度学习。数据科学与AI的机器学习,众多算法,深度学习有很大的交叉,但数据科学又不仅仅限于这些东西
What makes an AI company?7分钟
利用AI帮助公司
正确认识互联网公司
比如说:一个公司利用了一些IT技术,那么他就是一家互联网公司吗?实际上并不是,有的时候,即使你使用了AI实现了某些功能, 可能你还只是一个传统的公司。我认为一家互联网公司应该是:利用互联网这个工具可以是你的公司做的更好。互联网公司的业务周期很短,迭代很快,另外,互联网公司的决策制定可以下推到工程师和其他的专业人员,因为互联网公司中,这些人可能更懂产品和技术,更了解用户的需求。
与上一个类比之下的AI公司
一个公司配置了神经网络,或者说其他的机器学习算法,并不能称的上是AI公司。所以问题还是:你在做AI能够让你做的更好的事情吗,换言之,你利用AI做的事情,能够让你的公司做的更好吗?
AI公司擅长数据集采集的战略,如何费更少的人力和财力以获得最大量的数据集。
统一数据仓库。这里提到了一个非常重要的问题就是隐私保护问题,要十分注意隐私保护。统一的数据仓库更有利于工程师们发现数据的秘密。
会有十分普遍的自动化的产品。这是显然的。
因此,对于一家AI公司而言,擅长AI意味着,为公司设计一些AI可以做的很好的什么事情,以帮助公司的业务。转换到AI并不是一蹴而就的,也是需要过程的。并且也是一个比较系统化的过程。
AI的转换
- 执行一些试点项目以获得动力。这是比较显然的,刚开始进行转变肯定要进行试点,通过这样的试点,你可以更了解自己的公司的情况,更了解AI与公司业务的结合的情况,从而做出合理的调整。
- 建立自己的AI团队,并逐渐扩建强大。一个成熟的团队就像一把尖刀,可以非常厉害的解决问题。
- 提供AI培训。帮助自己的内部人员,高层人员,新手更加了解AI,使得组织交流更有针对性,交流起来也会流畅。也能够加强自己的建设。
- 制定人工智能战略。战略是长期的战略,作为已经稍有成就的团队而言,指定长期的战略也是自然的事情,不过关于战略指定的优劣跟眼界还是有很大的关系。
- 发展内部和外部的交流。发展对内的交流,一方面是内部调整,以方便自己的组织人员了解公司的计划从而做出合理的调整。对外部也是类似的道理,有利于客户做出合理的调整,甚至于有利于吸引客户。
有一个词非常好,叫“拿捏”,纵观以上五条,都可以用这个词来形容一下,无论是在哪一个阶段,只要拿捏的好,我相信效果一定是非常显著的。
软件行业,
What machine learning can and cannot do7分钟
More examples of what machine learning can and cannot do8分钟
Non-technical explanation of deep learning (Part 1, optional)7分钟
Non-technical explanation of deep learning (Part 2, optional)3分钟
Week2
完成时间为 1 小时
Building AI Projects
8 个视频 (总计 52 分钟)
显示更少
8 个视频
Workflow of a machine learning project6分钟
Workflow of a data science project6分钟
Every job function needs to learn how to use data6分钟
How to choose an AI project (Part 1)7分钟
How to choose an AI project (Part 2)8分钟
Working with an AI team8分钟
Technical tools for AI teams (optional)6分钟
1、#
欢迎回来 上周你学到了
一些 AI 和机器学习的基础
但你如何在项目中使用这些技术,
无论你是想在那些“神奇车库”里做项目,
(许多硅谷出身的著名企业都是从创始人的车库发家的,像苹果,谷歌,惠普等)
还是你想在一个更大的公司里做,
或者甚至是做一些
跟你公司战略相符的东西,
让我们一起探索一下, 在这一周里,
你将学到 AI 项目的工作流程
不同的项目有不同的步骤,
就像一个生日派对
有一些特定的流程那样。
首先,你会写出嘉宾列表,
然后选择一个场地, 预定生日蛋糕,
还有发送邀请函等等。
一个 AI 项目也是如此,
有一些既定的步骤
这里,你会学习到
AI 项目的工作流程,
并对构建
AI 项目有些感觉。
其次,你会学到如何选择 AI 项目
表面上看,你会觉得有很多事情需要做。
这周你还会学到一个大概的模式
以帮助你自己,或和朋友一起进行头脑风暴
去选择一个可行的项目去做。
这也可以帮助公司在
选择大项目上有帮助。
最后,你会学到如何组织数据和团队,
这不论对你自己或是和朋友一起,
亦或是企业里更大规模的队伍,
都是重要的。
我们会学习AI 项目管理,
包括组织数据,管理团队。
这一周结束后,
你会知道怎样构建自己的 AI 项目,
也许你可以开始和朋友尝试
一些可行的想法。
我们下一节再见
- #Workflow of a machine learning project
机器学习可以学习从输入
到输出,或A到B的映射
那么,你该怎么搭建一个机器学习的项目呢
在这个视频中,你会学到
机器学习项目的工作流程
让我们开始吧
我用语音识别系统来举例
有些人也许有亚马逊智能音箱或是谷歌Home
或是苹果Siri设备,百度DuerOS设备
几年前,我参与了
谷歌语音识别系统的研发
同时也领导了百度的DuerOS项目
在我的厨房里有一个亚马逊智能音箱
因此,每次我要煮鸡蛋的时候,我会说 'Alexa
计时3分钟' 然后它就会
在3分钟后提醒我鸡蛋熟了。
那么,你该如何搭建
一个能知道你在说
‘Alexa‘,‘嘿,Google‘
或是”嘿,Siri','你好,百度'
的语音识别系统呢
让我们来看一看机器学习项目的
关键步骤
简单起见,我将使用亚马逊智能音箱或者
识别‘Alexa‘这个关键词作为例子
如果你想搭建一个
能在用户说出'Alexa'这个词时进行有效识别的
AI系统或是机器学习系统
第一步就要收集数据
那也就是说,你得到处走
然后让人们
来说这个词'Alexa'
然后你把这些语音记录下来
你同时也需要收集其他的词
例如'你好'等很多其他的词
并且录音下来
当你收集了非常多音频数据
也就是很多不同人说
‘Alexa ‘或其他词语的音频片段后
第二部就是训练模型
就是说你需要利用一个机器学习算法
来学习从输入到输出,或者是A到B的映射
这里输入A就是一段音频片段
当使用上面这第一个音频片段的时候
希望它能够告诉你,片段里说的是
'Alexa', 而在播放第二个音频时
也就是右边那个时
希望系统能够学会
识别用户说的是'你好'
每当一个人工智能团队尝试着去训练模型时,
即学习A到B,或输入到输出的映射时,
很常见的现象是,
第一次尝试的效果都不好
所以团队总是需要尝试很多次
在人工智能领域,
我们把这个叫做反复迭代
你需要多次迭代,直到
模型看起来足够好为止
第三步就是“派送”模型了,
意思是,你需要把这个AI软件
放进一个智能音箱里,然后送到
一小群测试用户,
或是一大群用户手中
在运输之后
很多AI产品都会发生这种情况,
就是它开始收集新的数据
但是效果也许不像你最初所希望的那么好
举例说,我来自英国
所以我将会选择英式英语
但如果你的
语音识别系统是
被美式口音的人训练的
然后你将这个智能音箱运输到英国
那么就会有英式口音的人对它说'Alexa'
这些人就并不会像你所希望的那样
觉得这个语音识别系统很好用
当这种情况发生时
你最好能将这种情况的数据回收
比如对一个英式口音的用户来说
Alexa表现并不理想,这时你可以
收集这个用户的数据
去维护和更新模型
总之, 以下是机器学习项目的关键步骤:
收集数据
训练模型
即A到B映射
然后派送模型
在这些步骤中,
通常会有很多的反复更改完善的过程,
也就是说微调或者是使模型变得更好用
或者是即使寄出模型之后,
你还要继续收集新的数据,
使你能让产品变得更好
但这一步取决于你是否能
获取那些新的数据
让我们来看看如何把这三个步骤 应用于
一个不同的项目中
现在我们想建立 一个自动驾驶汽车的关键组成部分
快速回想这三个步骤是什么,
他们是收集数据,训练模型
和派送模型
在下一幻灯片中我们会再次回顾这些步骤。
假设你在制造一辆自动驾驶汽车,
自动驾驶汽车的关键组成部分之一是
机器学习算法,它能输入,
比如说,一张展示你车前有什么东西的图片
来告诉你其他的车的位置。
那么建立这个机器学习系统
的第一步是什么呢?
希望你还记得住上张幻灯片中的内容
第一步是收集数据
如果你的目标是让这个机器算法
把图片作为输入,
然后输出其他车辆位置的话,
你所需要收集的数据
既要有图片(输入)
也要有人工智能系统能的输出
即其他的车的位置。
假设你用几张
这样的图片开始
这些就是机器学习算法的输入A
你还需要告诉它你想要的
输出B是什么。
所以,在每一个图片上
你得在你想要在被系统识别出的车的周围
画这样的长方形
在这张幻灯片上, 我是徒手在画
这些长方形,但实际操作中
你需要用一些软件
来画出完美的长方形,
而不是像这种手绘的。
在创建了这个数据库之后
什么是第二步?
希望你还记得,
第二步是训练这个模型。
当你的人工智能工程师开始
训练这些模型时,
他们总会发现一开始模型并不能很好的运作
比如,我们现在有这张照片,
也许软件最开始的几次尝试
会认为这(方形里的 )是一辆汽车
只有通过多次改进后你才有希望
得到一个更好的模型
来判断出这里才是汽车所在的位置
最后, 第三步是什么?
它就是派送模型。
当然, 在自动驾驶的世界里
安全是头等重要的。
要在保证安全的情况下再派送
或测试你的模型。
当你把软件装入汽车上路时
你可能会发现软件并不能
很好判别出一些新型汽车,
比如说高尔夫球车。
所以你会回收数据,
比如这些高尔夫球车的图片,
用以维护和更新
这个现有的模型
这样的话,你能让你的人工智能软件
不断地变得更好
好到一定程度时,这个软件
能从这些图片里
辨识出其他的汽车
在这个视频中,你学习了
机器学习项目的关键步骤
即收集数据,
训练模型,
和派送模型。
在下一个视频中我们将学习
数据科学项目的工作流程中,
即它有哪些关键步骤?
我们下一节再见
- Workflow of a data science project
和机器学习项目不同,
数据科学项目成果
常常是一系列可以指导行动的见解和观点。
这些观点可能会
让你的采取不同的行动
所以,数据科学项目与
机器学习的工作流程不同。
让我们看看
一个数据科学项目的步骤。
让我们举个例子,
比如你希望优化一个销售漏斗,
比如你在运营一个卖咖啡杯的电子商务平台
或者是在线购物网站,
所以当一个用户
从你这购买咖啡杯时,
他们常常需要经过一系列步骤。
首先,他们将访问你的网站,
浏览不同的马克杯,然后
他们点进某个产品的详情页面,
然后他们把商品放入购物车,
然后,进入支付界面,
最终他们将支付订单。
所以,如果你想优化销售漏斗
使得尽可能多的人
经过所有这些步骤,
那数据科学怎样帮助你解决这个问题?
让我们一起了解数据科学的关键步骤。
第一步是收集数据,
在我们刚刚看到的那个网站上
你可能有一个数据集记录
不同用户跳转网页的时间。
在这个简单例子里
我假设你可以了知道
用户来自的国家/地区,比方说,
通过查看他们电脑地址,
也就是IP地址,
来了解到用户
的所在地。
但是在实践中,你通常可以得到
很多用户所在地
的数据。
第2步是分析数据,
你的数据团队可能会想出
很多会影响销售漏斗的因素,
例如,数据团队也许
会认为海外顾客
因为国际运费太高而被吓退,
这可以解释为什么很多人虽然
点进了支付页面,但是最终没有下单。
如果真是这样,那么你可能会考虑
是否把部分运费
直接包含进商品价格中,或者数据团队
可能会想到在假期来临的时候,
数据是否会存在短暂的突变。
就是说,也许更多的人会选择
在假期购物因为他们要买礼物,
但也许更少的人会选择在假期购物
因为他们宁愿
待在家里而不需要
用工作电脑购物。
在一些国家,数据可能会在一天的某个时段出现短暂的突变,
这些国家人们习惯小憩一会,
像短暂的休息,比方说午休,
这些情况会导致购物者减少
在线时间,从而导致你的销量下降。
数据科学团队就会建你
在午睡的时段,减少
广告的投放,因为
少量的人会在这个时段网购。
所以,一个优秀的数据科学团队
会有很多的想法,他们会尝试
这些想法,反复迭代
许多次去获得好的见解和观点。
最终,数据科学团队
把这些见解
提炼成一系列的假设,
比如,什么可能对销量
有帮助,什么可能对销量没有用。
数据团队也可能给出经营上的建议,
比如,将运输成本纳入产品
成本中,而不要单独列出。
当你采纳这些建议
并把它们应用到你的网站,
然后你的网站需要开始收集新的数据,
因为用户的行为可能已经发生了变化,
因为你改变了在午休时间发布广告的方式
或者你改变了结算方式。
然后,你的数据科学团队可以继续收集
数据,分析新的数据
定期作出评估,并且随着时间推移提出
更好的假设,甚至更好的经营方法。
所以说,数据科学项目的关键步骤
是收集数据,
分析数据,
然后提出假设和行动,
然后继续定期地获取数据
和分析数据。
就让我们把这个框架应用到另一个新的问题中,
-- 优化生产线。
所以我们将采取这三个步骤
在接下来幻灯片中使用这个方法。
假设你运作一个工厂,
这个工厂每月制造成千上万个咖啡杯,
并销售他们,你希望能
优化生产线。
下面这些是制造咖啡杯的关键步骤:
第一步是混合粘土,
这个过程一定要加适量的水,
第二步是把黏土捏成咖啡杯的形状,
接下来,你需要给杯子上釉,
也就是,添加着色和保护层。
接下来,你需要给杯子加热
我们称之为烧窑。
最终,你应该检查
这个马克杯
是否有凹痕,
确保杯子在交给顾客之前没有损伤。
所以, 制造业中一个常见的问题是
如何优化生产线,
即确保生产出的咖啡杯尽可能没有损伤。
因为这些被损伤的
咖啡杯必须得扔掉,
这导致时间和材料上的浪费。
这个场景中开展数据科学项目的第一步是什么?
(希望你们能够记住上张幻灯片中的内容)
第一步是收集数据
比方说,你可能保存有关
混合的不同批次的黏土的数据,
例如,黏土的供应商,
黏土经过多长时间混合,
或者黏土的湿度,
添加了多少数量的水。
你也许还收集了关于
不同批次的杯子的数据,
例如,那批货的湿度有多大呢?
窑的温度是多少?
杯子在窑里烧了多久?
拥有这些数据,你可以找
数据科学团队去分析。
他们也许会重复进行多次分析来给出最合适的建议。
他们可能发现,
有时如果湿度过低,加上
窑炉的温度过高,
会导致杯子上产生裂痕,
他们可能还会发现,在中午时外部环境比较暖和,
所以在一天中不同时段,
你需要调整
湿度和温度。
基于数据科学团队提出的这些结论
你会得到一些假设性的建议,
以及如何调整生成线的策略
用以
提高生产线的效率。
进行生产线整改之后
你将得到新的数据
所以,你可以继续定期进行分析。
这样他们就可以继续
来优化生产线。
总之, 数据科学项目的关键步骤
是收集数据
分析数据,
然后提出假设和开展行动,
上一讲和这一讲,你看到了
机器学习和数据科学项目的例子。
这样讲吧,机器学习和数据科学
几乎正在影响每一个行业。
下一讲视频,我希望向你们展示
这些技术如何影响很多工作的,
这也许包括你的现有工作
以及大部分你的同事的工作。
我们下一节再见
- Every job function needs to learn how to use data
数据正在改变着很多不同的工作职能
不管你从事的是招聘、销售、
市场营销,还是制造业、农业等行业
数据很可能改写着你的工作职能
过去几十年来
社会正在走向数字化
以前人们经常进行纸质问卷调查
现在更加倾向于
使用数字问卷。
医生仍然会写一些手写记录
但这些记录正逐渐变成
数字档案
其他工作职能也面临同样的趋势
得到这些数据意味着
你的工作很可能类需要
数据科学和机器学习
里的工具来辅助你。
在这个视频中,我想探讨一下
不同的工作职能,以及
数据科学和机器学习会
对不同类型的工作产生怎样的影响
让我们从销售讲起
上一节视频里,你看到了
如何用数据科学优化销售漏斗
那机器学习可用于优化漏斗吗?
如果你是一名销售人员,你可能有
一组潜在客户的名单,
你可以联系他们,
并说服他们去买你公司的产品
机器学习可以帮助你对这些人进行优先级划分
比如优先给
大公司的 CEO 打电话
而不是给小公司的实习生打电话
这种自动的名单优先级排序
可以让销售人员变得更有效率
让我们来看看更多的例子。
假设你是产品生产线的经理
你已经看到了数据科学
可以如何帮你优化一条产线
那么机器学习呢?
生产制造过程有一步
是最终的产品质量检测
在现今的工厂里
可能有成千上百的人
用肉眼检查物体
可能是咖啡杯或者其他东西
上面是否有划痕,这叫做检测
机器学习可以通过
像这样的数据集
学会自动判断
一个咖啡杯是否有缺陷。
通过自动识别划痕,
既降低了劳动成本
又提高了工厂的生产质量
这种类型的自动视觉检测
是我觉得会对制造业有
深远影响的技术之一
这也是我一直在做的事情
让我们来看更多的例子
来说人员招聘吧,
当你需要招聘一个人来你公司时
会有一系列可预见的流程,
这包括你的猎头或者
其他人会发送邮件给候选人
接下来,你会进行电话面试,
让候选人来现场面试
接着,就是接受或是拒绝候选人。
就如同数据科学
可用于优化销售漏斗,
数据科学同样
可用来优化招聘流程,
许多猎头组织已经在这么做了,
比方说,你发现几乎没有人
能通过电话面试这一关,然后
进入现场面试这一关,
你可能会得出结论说,
也许太多人收到电话面试了,
或者电话面试的面试官
太严格了,
所以应该让更多人能到达现场面试这一步
这种类型的数据科学
已经对当今招聘产生很大的影响,
机器学习又在招聘中有什么用呢?
招聘流程的其中一步
是对简历作出筛选,
然后决定先和哪些人联系,
你也许会看着某一个简历然后说,“对,
让我们给这个人发邮件吧,“。然后看着另外一个简历说
“这个候选人不行。“
机器学习正在用其自己的方式
来自动筛选简历
但这其中存在着伦理问题,
比如说确保
你的人工智能系统是不能
有偏见的,它对候选人是一视同仁的。
但机器学习正在
进军招聘市场,
我希望机器学习在跻身这个市场的同时也能确保
系统是合乎伦理与公平的
在这个课程的最后一周
你会学到更多关于AI的
伦理问题
如果你是做市场营销的呢?
最常见的优化网站性能
方法是 A/B 测试
即启动两个版本的网站
比如版本 A 的按钮是红色
版本 B 的版本是绿色
看看哪个版本的点击量更多
通过这些数据
数据科学团队可以帮你获得
建设性的意见,并提出对应的假设
和执行策略,
那机器学习呢?
现今许多网站
会有针对性地给用户
推荐购买率更高的产品
这种营销方式在网站很常见
比方说一个服装销售网站,
在观察我的购买习惯以后,
很有可能就会给我推荐
蓝色衬衫,因为我基本上
只买这种颜色的衬衫
但是也许对其他的用户
会有更繁多
更有趣的推荐
然而当今这种个性化
的产品推荐驱动着
大型电商平台
大比例的销售额。
最后举一个完全不同领域的例子,
农业。
假设你是一个在轻工业农场
工作的农民
数据科学可以怎么帮到你呢?
今天农民已经在
农作物分析种应用数据科学了
你可以从
土壤条件、天气条件,以及
市场上不同农作物的价格中获取数据
然后让数据科学团队推荐
何时种植,以及种植什么作物来提高生产效率
同时又保留你的农场良好的土壤条件
这种数据科学正在并将继续
对农业起到越来越大的作用。
让我们来看看机器学习在农业中的应用,
我认为机器学习在农业上产生的
最令人兴奋的变化之一是将农业精准化,
这是我之前在一个农场上
用手机拍的一张照片
在图片的右上角是
一个棉花作物,中间是杂草
有了机器学习,我们开始
见到能用到农场上的机器学习产品,
它们拍一张这样的照片,然后
以一种很精准的方式在杂草上
喷洒除草剂
既能去除杂草
又不会喷洒过量的除草剂
这种类型的机器学习技术
正在帮助农民
提高作物产量的同时,
又有助于保护环境。
在这段视频中,你看到了
像这些不同的工作职能:销售,
招聘,市场营销,
制造业和农业
这些不同的工作职能是
如何被数据,
数据科学,还有机器学习影响的。
这就给我们一种感觉是AI有
非常广泛的应用,
但是你怎么真正去
选择一个有潜力的AI项目呢?
我们将在下一个视频中讨论这一点
- How to choose an AI project
如果你想要尝试做一个人工智能项目的话
你该怎样选择一个有价值的项目呢?
不要指望点子一夜之间就会出现
有时候可能可以,但有时也需要几天
或者几周才能获得一个值得追寻的想法
在这个视频中,你会看到一个帮你
头脑风暴出令人兴奋且有潜力的AI项目的框架
假设你想做一个人工智能项目来帮助你的生意,
你已了解到人工智能 不是所有的事情都能做,
所以只有某一些特定的事情是人工智能可以做的
这个圆代表人工智能可以做的事情
同时,也有一些特定的事情对你的生意
十分有价值的
就让这第二个圆代表这些十分有价值的事情
的关键
你想做的是尝试选择 两个圆相交处的项目
那么这样你选择的项目
即能够由人工智能来完成,又对你的业务有价值
人工智能专家对左边这个圈包含什么
和不包含什么了如指掌,
而你业务方面的专家比如说销售,
营销,农业或者其他东西,
会最了解什么对你的业务来讲有价值
所以在想出一个同时具有AI可行性和业务价值的项目时,
我会召集一些在人工智能领域有渊博知识的人
和业务方面的行业专家们组成一个团队一起讨论
这样他们就可以一起尝试找出在
两个集合相交处的项目
所以有时候我们称这样的团队为交叉功能团队
意思是一个既有人工智能专家
又有业务专家的团队
在对项目进行头脑风暴时,有一个我在众多公司
都使用过的框架,我觉得十分有用
所以让我分享三个如何能帮你
团队对项目进行头脑风暴的原则
第一,虽然有很多关于人工智能化 将如何取代工作岗位的媒体报道,
这确实是个需要被关注的社会问题,
但在考虑具体的人工智能项目时,我发现
如何让人工智能将具体的任务自动化 比如何让它取代工作岗位要有用,
拿呼叫中心举个例子, 一个呼叫中心有许多要执行的任务
从拿起电话,接听电话,回复邮件
到采取一些更具体的行动,
比如给一个客户进行退款申请
但在所有这些呼叫中心员工所做的任务中
可能有一个任务, 比如电话或者电子邮件导向
也许是特别适合用机器学习来进行自动化的,
通过观察这些员工做的所有任务,并从中选择一个
才能让你在短期内
选择出最有成效的自动化项目。
让我们来看看另一个放射科医生的工作例子,
有很多关于人工智能将如何取代放射科医生工作的报道,
但放射科医生实际上要做很多不同的事情,
他们看 x 光片, 这很重要
但他们也从事他们自己的再教育,
他们咨询其他医生,
他们可能会指导年轻一些的医生, 其中一些也会直接给病人进行咨询
所以通过观察放射科医生做的所有任务,
你也许能发现其中一个,比如说 用人工智能助理或者人工智能自动化来看 x 光片
能让你把它作为一个最有成效的项目来进行推进
所以就你的公司业务而言,我会建议你想想
在所有需要执行的任务中, 你是否能找出那么一个或几个
能使用机器学习进行自动化的任务?
当我与一些大型公司的首席执行官们 就公司的人工智能项目进行头脑风暴时
一个我经常会问的问题是: 驱动商业价值的主要因素有哪些?
有时找到人工智能方案或数据科学方案
来增强这些因素是十分有价值的。
最后,我会问第三个问题,
你的公司或业务中有哪些主要痛点?
这些痛点中有一些可以用人工智能来解决 有些不能
但通过了解生意上的主要痛点
可以为成为找出人工智能项目的有用起点。
对头脑风暴人工智能项目,我有最后一条建议
就是即使没有大量的数据, 你也是可以取得进展的
别误会, 拥有更多数据几乎从没有坏处,
除了你也许要为磁盘空间或网络带宽 多支付一些费用, 用以传输和储存数据
拥有更多的数据几乎总是有帮助的。
而且我青睐于有很多数据,
同时,数据也能让有些业务, 比如说网络搜索变得具有防御性
网络搜索是一个长尾业务, 意思是有很多很多十分少见的
网络查询关键词
当人们在搜索这些少见的 关键词的时候,如果能知道他们点击了什么
那这会帮助搜索引擎网站提供一个好得多的
用户搜索体验。
所以你能获取大数据是非常好的,
但有时大数据被炒过头了, 即使你只有一个小的数据集,
你也一样能有进展。假如你在为咖啡杯
做一个自动视觉检查系统,
你想要自动检测到 右边的咖啡杯有缺陷
如果你有一百万张完好的咖啡杯 和一百万张有损伤的咖啡杯的图片
有这么多的好杯子和坏杯子的样品图片
能喂给你的人工智能系统当然是非常棒的
但我希望你没有真的已经 做出了一百万只有问题的咖啡杯
因为这像是一个非常昂贵 但却不得不扔掉的东西
所以有时即使只有1000个, 或100个, 或甚至只有10个样本,
你也能开启你的机器学习项目,
需要多少数据很大程度上, 取决于你要解决的问题
与人工智能工程师或者 AI 专家聊聊会帮助你更好的找到方向
有些问题需要大数据才能获得好的解决方案,
也就是说有1000张图片也不够,
但我的建议是
不因为在一开始的时候 因为没有很多数据就放弃,
很多时候,即使是用很小的数据库 你仍然能够有所进展,
在这个视频中,你看到了头脑风暴的框架
和一些帮你想出既能被人工智能实现,
又有业务有价值的项目甄选标准。
那在头脑风暴出的一系列项目中
如何选择一个或者一小撮来投入呢?
我们将在下一个视频中讨论这一点
6、
也许你对可能的AI项目
有很多想法。
但在你投入项目之前,
你怎么确定这
是一个值得的项目呢?
如果这是一个快速的项目
可能只需要几天功夫,
就可以很快去知道它是否可行,
但是一些AI项目可能 需要很长时间才能完成整个过程。
在这个视频中,我想让你
看看我用的一系列步骤去
仔细检查一个项目是否
值得花费几个月的努力。 让我们来看看吧。
在投入大型AI项目之前,
我通常会对此进行彻底的考察。
“彻底的考察“在法律世界中具有特定的含义。
但这里它意味着你想
花一些时间来确保
你所希望的实现的结果是现实的。
你已经看过了
最好的AI项目都先必须是可行的。
也就是说是在AI可及的范围之内的事情,
同时也是有价值的事情。
我们想要选择的项目必须
是这两组的交叉结合。
因此,要确保项目可行,
我通常会对技术方面进行很彻底的考察,
并确保该项目是有价值的,
我通常还会对业务本身进行彻底的调查。
让我告诉你更多关于这两个步骤的细节,
对技术方面进行的 彻底考察意味着
确保这个想要建立的
人工智能系统的可行性。
因此,你可以与AI专家讨论
AI系统是否能够真正
达到理想的性能水平。
例如,如果你希望构建
一个准确率高达95%的语音系统,
那么咨询AI专家 或者阅读一些
文献可以让你
了解这个系统的可行性。
或者,如果你希望开发一个
准确度达到99%的检测
工厂制造的咖啡杯的系统,
这一构想是否能由今天的技术实现?
全面技术考察的第二个重要问题是
需要多少数据,
才能达到理想的性能水平?
并且你有办法获得那么多的数据吗?
第三,将是开发此系统的时间表,
试图弄清楚需要多长时间
以及需要多少人
来建造一个你想要建造的系统。
除全面技术考察外,
我经常也会进行全面的商业考察,
确保你构想的项目
对企业来说真的具有价值。
所以,很多AI项目
将通过降低成本来推动价值。
例如,通过自动执行一些任务
或者通过在系统上挤出更高的效率。
许多人工智能系统也可以增加收入。
例如,让更多网购的人能最终
把放在购物车里的东西下单,或者
你可能正在构建AI系统以帮助
你推出新产品或新业务。
因此,全面业务考察意味着
仔细思考你正在构建的AI系统的过程。
例如,我们需要考虑
95%准确的语音识别系统
或99.9%准确的
视觉检测系统,哪一个
会帮助你实现你的业务目标。
无论您的业务目标是
改善您当前的业务
或甚至在你公司创建全新的业务。
在进行业务调查时,
我经常会建立
电子表格财务模型
以定量估算价值,例如
估计实际节省了多少美元,或者
我们认为在条目收入方面
是合理的假设,
并建立与项目相关联的
经济模型
另外,在决定投入很多个月的努力到某个项目之前,
(这一点本幻灯片没有明确列出)
我希望你也考虑做
第三种尽职,即彻底的道德考察。
我认为人工智能可以做很多事情
甚至可以赚很多钱,
但这可能不会让社会变得更好。
因此,除了全面
考察技术和业务之外,
我希望你们还要进行
道德考察,并确保无论
你做什么,这实际上都在
让人性和社会变得更好。
我们也会在本课程的
最后一周详细讨论这个问题。
当你计划你的AI项目时,
你还必须决定你想自己亲建还是向别人购买?
这是IT世界中一个老的问题
在人工智能中我们也面对此问题,
例如,现在几乎没有公司
建立自己的计算机,
他们购买别人的电脑,
几乎没有公司建立自己的Wi-Fi路由器,
只需购买商用Wi-Fi路由器。
那机器学习和数据科学呢?
机器学习项目可以让 企业内部做或外包给别人
我已经见证过这两种模式的成功案例。
有时如果你外包一个机器学习项目,
你可以更快地找到合适的人才
并在加速项目的实施。
你也可以最终建立自己的
内部人工智能团队 并在内部完成这些项目
下周我们将更详细地讨论AI翻译手册,
那时你会了解到更多关于这方面的信息。
与机器学习项目不同,
数据科学项目通常在内部完成。
他们并非不可能被外包,
你有时可以将它们外包,
但我所看到的是,
数据科学项目通常
与您的企业密切相关,
这通常需要对你的业务 有非常深入的了解
才能进行最好的数据科学项目。
因此,从大概的比例来看,
我看到数据科学项目
比机器学习项目更多是放在企业内部。
最后,在每个行业中,如果有些东西
是有行业标准的话,
你应该避免构建它们。
构建与购买问题的一个共同答案是,
构建对你来说
非常专业或
对您完全专业的东西,或者它们将允许
你构建独特的防御优势,
但如果所需的是具有
特殊的行业标准的,
那你应该购买它而不是
在内部建造它,这对你更有效率。
我的一个团队有一个非常诗意的短语,
“不要跟火车冲刺赛跑”
这意味着,
如果这是一列
在铁路轨道上运行的火车
带有烟雾的小烟囱。
你不应该做的是那个
试图在火车前
冲刺的人或工程师,
列车是行业标准的解决方案,
因此如果有一家公司, 这也许是一家初创公司,
也许是一家大公司,也或者是
正在构建行业标准解决方案的开源工作,
那么你可能希望避免
企图领先于这列火车。
因为即使你可以
在短期内冲刺得更快,
最终火车也会赶上你,
并撞到试图在火车前冲刺的人。
因此,当有大量建立的
行业标准解决方案时,
你可能最好只
采用行业标准
或其他人的平台,
而不是试图在内部重新建造一个全新的东西。
我们都生活在一个资源有限,
时间有限,数据有限,
工程资源有限的世界里,
所以我希望你能把这些资源集中在
我们最独特的项目上,
以此让你的公司带来最大的收益。
通过全面彻底的对
技术和业务的考察过程,
我希望你能够开始识别
具有潜在价值或
对你的业务有前途的项目。
如果这个项目很大,
也许会需要许多个月来进行,
在决定投身于这种项目之前,
我经常会花上好几周时间
进行这种全面彻底的考察,
现在,假设你找到了一些有前途的项目,
你如何与AI团队配合呢?
您如何与AI团队沟通
配合来完成这些项目呢?
我们将在下一个视频中讨论这一点
- Working with an AI team
假设你找到了一个很棒的项目
你想要尝试推进它,
你该如何与一个人工智能团队 一起合作这个项目呢?
在这个视频中,你会学到
人工智能团队是如何运用数据的
从而学习到怎么和人工智能团队 互动从而帮助他们
把项目做成
有一点需要注意的是
也许你有一个很棒的主意
但你手上没有现成的一个人工智能团队
或者人工智能工程师
幸运的是在当今世界
你可以自己或者鼓励
你的工程师朋友
去学一两个
机器学习或深度学习的网络课程
这样他们基本上能够足够的知识
去开始合理地尝试去
推动这类型的项目。
那我们来看看该如何与你的人工智能团队合作
首先,如果你能就项目提供一个验收标准的话
这对你的人工智能团队起到很大的帮助
我做过很多自动视觉检测方面的工作,
所以我将在接下来的幻灯片中
用它们来举例
假设你的目标是 以至少95%的准确率
检测咖啡杯中的缺陷
那么这就可以成为
你这个项目的验收标准
但这95%的准确率,你该如何测量准确率呢?
人工智能团队需要有一组数据集
来测量模型准确率
这里,数据集只不过是一组
有不同标签的图片
这里,我们看到在输出B里面,
前两个咖啡杯是好的
而第三个是有缺陷的
所以, 作为你验收标准的一部分
你需要保证你的人工智能团队
有一组可以用来测量模型表现的数据集
这样他们才能知道模型
是否达到了95%的准确率
这组数据集的正式术语 被称为测试集
测试集可以不需要太大,
也许1000张图片
对这个例子而言就足够了
但是, 如果你咨询一个人工智能专家
他也许能给你更合适的数字,
就是说专家会告诉你 他们需要多大的测试集
来测量模型是否达到95%的准确率
一个十分新颖的人工智能系统的特点是
它们的性能表现通常是
以统计数据的方式来展现的
所以你经常看到的会是
我们想要一个人工智能系统
以一定百分比的准确度来运行
而不是要求它弄出一个完美的结果
就比如所举的这个例子
所以,当你在给出验收标准时
想想你的验收标准是否
需要以一种
统计数据的方式体现出来
比如平均几个小时
或者以什么样的百分比来获得正确答案
现在,让我们更深入地了解 测试集的概念
人工智能团队 就是这么看待数据的,
人工智能团队把一组数据 分成两个部分
第一个被称为 训练集
第二个被称为测试集
这个我们前面已经讲过一些了
训练集只是一堆
配有标签的图片,(比如)
一张咖啡杯是否合格
还是有瑕疵的图片
所以训练集即给出
输入A即咖啡杯图片的例子
也给出输出B
即这个咖啡杯合格与否的标签
就是说,给定一个训练集
机器学习算法要做的将是
学习,换句话说
就是计算或者得出
从 A 到 B的一些映射, 从而你有
一个软件能输入A
并试图计算出什么是合适的输出B
也就是说,训练集是给机器学习软件的输入
使软件能够计算出
什么是A到B的映射
人工智能团队需要的
第二个数据集是测试集
正如你所见过的那样, 这只是一组
不同于训练集的
被标签的图像
人工智能团队评估
学习算法表现的方式是把
测试集里的图像放入人工智能软件中
看看软件会给出什么输出
打个比方,如果在这三张测试集的图片上
人工智能软件在这里输出 ‘合格’
在这里输出 ‘合格’ ,在这里也输出 ‘合格’
那么这就是说 他们在三个例子
里弄对了两个
所以这里的准确率就为66.7%
在这个图表中, 训练集和测试集
都只有三张图片
而在实操中, 这两个数据集
当然会大得多
你会发现, 在大多数问题里,
训练集的数量比测试集要大很多
当然,与人工智能工程师交流
你会知道具体的问题需要多大的数据集
最后, 由于技术原因
一些人工智能团队将需要
两个不同的测试集
如果你听到人工智能团队提到
开发集或者验证集,
那个便是第二个测试集了
需要两个测试集的原因
太深入技术探讨,超出了本课程的范围,
但如果一个人工智能团队找你要
两组测试集,这是十分合理的要求,
你应该尝试提供给他们。
在结束这段视频之前
我想敦促你避免一个陷阱,就是
期望人工智能团队能给你100% 的准确率
我来解释解释,
比如说这是你的测试集
你已经在上一张幻灯片上看到过了
现在我往这个测试集中,多加入一些范例
以下是一些一个人工智能软件 也许不可能
达到100%准确率的原因
首先,尽管机器学习科技
在现今是非常强大的
但仍有其局限性
它们无法做所有的事情
就是说,你也许在试图解决一个
对当今机器学习技术而言十分困难的问题
第二, 数据不足,
如果你没有足够多的数据
特别是如果
训练数据不够的话
要得到一个高准确率会是比较难的
第三, 数据很混乱,
有时数据可能会被错误地标记
比如这个绿色咖啡杯,
我看起来完全没有任何瑕疵,
但把它标记为有瑕疵,
则是一个错误的标记
这就会损害你人工智能软件的表现
还有,数据有时会模凌两可,
比如说,这个咖啡杯
看起来在这里有一个小的划痕,
这是一个很小的划痕
所以也许我们觉得这是没问题的
但也许这应该被视为
一个残次品
也许不同的咖啡杯检测专家
会对这个咖啡杯是否合格,
是否能够通过产检会给出不同的结论,
以上提到的这些问题中, 有些可以得到改善
例如, 如果你的数据不足,
也许你可以尝试收集更多的数据
更多的数据往往会有所帮助
或者, 你也可以尝试清除 标记错误的数据或尝试
得到你的工厂专家来
就这些不明确的标签得出更一致的结论
所以, 是有方法用来改善
这些问题的, 但是,
很多人工智能系统 即使没有实现100% 的准确率
也是极其有价值的
所以, 我鼓励你 与你的人工智能工程师
讨论什么是
合理的准确率
然后试着去找一个
既能通过技术调研又
能通过商业调研并且
不必要达到100%准确率的项目
祝贺你看完了这周所有的视频
你现在知道了构建一个人工智能项目
是什么感觉并且需要什么了
我希望你开始集思广益
并探索一些想法
接下来还有一个选看视频 描述了一些
人工智能团队使用的技术工具
如果你想的话,可以看看
但是不管如何 我非常期待在下周见到你
在那里你会学到 人工智能项目
是如何在更大的公司中得到运用
期待下周还能见到你
- Technical tools for AI teams (optional)
当你与AI团队合作时
你也许会听他们提到
构建人工智能系统所使用的工具
在这个视频中,我希望与你们分享
许多基础AI工具的
名字和它们的细节
这样你就能更好地
了解这些 AI 工程师在做什么
很幸运的事, 现今 AI 是非常开放的
许多团队会公开分享他们的点子
也有很棒的机器学习
开源框架,
许多团队会使用它们构建自己的系统
所以,你如果听说过这些工具:TensorFlow,
PyTorch, Keras, MXNet, CNTK, Caffe,
Paddlepaddle, Scikit-learn, R Or Weka,
这些都是开源机器学习
框架,它们能帮助
AI团队更加高效地
写代码
不仅有人工智能技术的突破
现在也可以
在各种网站上自由发布文章,
如: Arxiv。
我希望学院派团队也能自由分享
他们的研究成果,因为我亲眼见证到
这些开源工具是怎样快速促进AI领域发展的
最终,许多团队将
在网络上分享他们的代码,
最常见的平台是GitHub
事实上,Github已经成为 在AI和其相关领域
的开源软件的知识库
通过使用适当许可的开源软件,
许多团队可以更好更快的开展工作,
而不是一切从零开始。
例如,如果我在网上搜索
Github人脸识别软件,
你可能会发现这样的网页
如果你向下滚动,
它实际上有一个非常漂亮,
可读性很高的的软件使用说明
在这个网站上提供给大家
以便进行面部识别,
甚至可以识别人脸各种组成部分
有很多很多软件
可以只有在网络上下载
用来实现各种各样的功能,
这些软件只需要复查许可证,
或者在使用之前
AI团队复查下许可证,
大量软件都是开源的,
也就是说,任何人都能非常
容易得到使用许可
虽然 GitHub 是
为工程师打造的技术网站,
只要你愿意,你也可以自由地
浏览 GitHub, 看看
网站中发布的各种
AI软件的类型
除了这些开源技术工具外,
你也经常听到
AI 工程师谈论 CPU 和 GPU
这些术语的意思是,
CPU 是计算机中的计算处理器,
不管在你的台式机,
笔记本,或者云服务器
CPU 代表中央处理单元,
CPU 是由英特尔
和 AMD, 以及其他一些公司制造的
它们在计算机中执行大量的计算
GPU表示图形处理单元。
从历史上看, GPU 是用来处理图片的,
当你在玩视频游戏时,
很可能是 GPU 在 绘制出那些奇妙的图形
但是几年前
我们发现这个
原本是为了处理图形而设计的硬件,
其实非常适合用来
构建大型神经网络
即大型深度学习算法
因为需要构建
非常大型深度学习或者
大型神经网络系统,
AI社群不得不永无止境的
寻求更强的计算能力
以训练更大的神经网络
而 GPU 已经被证明是
一种非常匹配这种需求的
计算方式,
用以训练很大的神经网络
所以, 这就是为什么 GPU
在深度学习的兴起中 如此重要的原因
NVIDIA是卖GPU的大公司,
其他公司也包括高通,
Google也在研发
处理器来应对不断增长地
硬件能力需求
来应用到大型神经网络上
最后, 您可能会听说云和本地,
或简称,本地化部署
云部署是指如果 你从服务器运营商
比如说亚马逊的AWS、
微软AZure,或谷歌GCP,
租赁服务器并使用别人提供的服务
来进行自己的运算。
本地化部署意味着购买
自己的服务器
并且在你自己的公司本地化运行服务
探索两种方式的优劣势细节
不属于这个视频的谈论范畴
世界上很多公司都在倾向于云部署
你在线搜索时 可能会发现许多文章
在谈论关于
云部署和本地化部署对比利弊
最后,可能你会听说
边缘部署的概念,
如果做自动驾驶项目,
从自动驾驶车辆
发送数据
到云服务器,
再把信息从云服务器发回到车子里,
再用此信息决策是否停车。这个过程的用时太长。
所以,这意味着需要
在车内的电脑中进行计算。
这就是所谓的边缘部署, 就是说,
你需要把处理过程部署到
收集数据的地方,以便可以
快速处理数据
并做出决策,而不必
通过网络传输数据
并在其他地方处理数据
如果你观察一些
智能音响,也许你家里也有,
不是所有的智能音响, 其中也有一些是应用边缘计算
有些语音识别任务
是在智能音箱里的
本地处理器中完成的,
它也许就在你的家里哦!
边缘计算主要优势在于
它可以加快系统的反应时间,
也可以减少
需要通过网络发送的数据量。
但是,像云部署和本地化部署对比一样,
边缘计算同样有很多利弊,
云部署意味着你
可以在网上运用到更多的资源。
感谢你完成这个关于AI工程师
运用技术工具的可选视频
希望当你听到
他们讨论这些工具,
你将更清楚地明白他们的意思
我期待下周还能见到你
发布于 2019-08-30
1 个练习
Week 2 Quiz30分钟
Week3
完成时间为 2 小时
Building AI In Your Company
10 个视频 (总计 90 分钟)
10 个视频
Case study: Smart speaker9分钟
Case study: Self-driving car6分钟
Example roles of an AI team8分钟
AI Transformation Playbook (Part 1)10分钟
AI Transformation Playbook (Part 2)14分钟
AI pitfalls to avoid2分钟
Taking your first step in AI4分钟
Survey of major AI application areas (optional)17分钟
Survey of major AI techniques (optional)15分钟
- #Introduction
欢迎回来!
在过去的两周里你了学到了什么是人工智能 , 以及如何构建一个人工智能项目
本周我们将看看 我们已经谈过了的这些项目
并且谈论项目如何能在 公司的背景下得到应用
无论是营利的, 非营利的, 或甚至在一个政府实体内
为了具体起见, 我会谈谈无论你在什么样的组织里
都能同样运用的建造人工智能的方法
接下来你可能会听到一些类似CEO 级别的谈话
不要被这些吓倒,
这实际上对每个 希望自己公司能够通过运用人工智
能有所改进的人 都是有用的
一个公司要想擅长于人工智能 可能需要两三年的时间
这样才能不仅仅只是做过一个人工智能项目, 而是一系列有价值的人工智能项目
并且做得很有效率
但这周我希望做到的是 帮助你展望
该如何渡过这个相对较长周期的愿景
并且在本周末,我会提供给你 一些可以立即使用的 具体而简单的步骤
那我们开始吧。
具体而言, 这些将是你本周会看到的话题
首先是 复杂的人工智能产品的案例研究
比起你上周所见的单一的 机器学习或
数据科学模型
本周你会看到多个 模型可以汇集在一起, 来构建
一个复杂得多的人工智能产品, 比如一个智能音响 或者一辆自动驾驶汽车
你还会了解到人工智能 团队中的主要工作类型
所以, 当你认为你的公司可以 建立一个大型的人工智能团队时,
这也许是好几十人 甚至几百人, 这些人都会做些什么事情?
我们将从绘制一个 建立人工智能团队的路线图开始
第三, 你也会了解到 人工智能转型手册
学习如何帮助你的公司 转型成为擅长人工智能的公司
也就是说,你的公司不仅仅是 做一两个有价值的项目
而是怎样让整个公司都擅长人工智能,
最终会因此让你的公司更加有效率和价值。
最后, 虽然当中有些步骤也许会 需要几年的时间才能完成
我将给出如何能在你公司中 迈出建立人工智能项目第一步的具体建议
来作为这周的视频的结尾
除了这些主要内容之外, 在最后还有一些选看视频,
在那里你会纵览一些主流的 人工智能运用领域和技术
在本周的视频之后 我希望你能知道
如何帮助你的公司更好运用人工智, 并且能掌握几个马上采取行动的步骤
让我们开始下一个视频吧!
- #Case study: Smart speaker
打造一个复杂的人工智能产品是什么样的感觉呢?
这意味着不仅仅用一个单一的机器学习算法
去学习从A到B的映射
这个算法只是一个大且复杂的
的项目或者产品的一部分
我想在本周用两个打造复杂人工智能产品
的案例作为开始
首先, 打造智能音响
这样你就能开始明白
在你公司内部打造
这样一个复杂人工智能产品会是什么感觉
让我们开始吧!
智能音箱和类似这样的语音激活设备
正风靡世界
如果你家还没有这样一个设备的话
也许有一天你会购买一个的
我希望你看一个案例
关于你该如何写出
使一个智能音箱能
对例如'嘿, 设备, 给我讲个笑话' 这样的口头命令做出反应人工智能软件
举个例子, 像亚历克莎(Alexa)
或者‘好吧,谷歌’,或者‘嘿,西里‘
或者,‘你好,百度’,作为唤醒词或触发词
这里我会不那么具体到某一个品牌,
我将会使用'嘿,设备'
作为触发词或唤醒词
要唤醒一个智能音箱
比如说
你想让它讲一个笑话
所以你该如何打造一个
能让它理解这样的指令 并进行执行的人工智能软件呢?
以下这些是处理指令所需要的步骤
总共有4步
第一步,是探测到触发词或唤醒词
只能音响是用一个 机器学习算法
来输入音频然后再进行输出
当他们听到了唤醒或者触发词 --
-- '嘿,设备' --
那么它就输出就是0或1
一旦它听到触发词或唤醒词
听到 '嘿, 设备‘时
它还必须接着执行第二步,
就是语音识别
也就是说,此时软件要做的是
在得到'嘿, 设备‘的音频之后,
把它映射到'讲个笑话',
这也是通过 机器学习完成的
然而, 这里的第一步是
使用A到B的映射来告诉
设备它听到了这个触发词,
这个,使用的是另一个A到B映射
将你刚才说的话的音频 映射成文本记录
在这个例子里, 就是 ‘讲个笑话‘这四个字
此时,算法已经弄清了
你说这四个字的意图,
所以说第三个步骤
就是意图识别
意思是,用你说的话
然后弄明白你想要软件做什么事情
当今的智能音响 能做有限的指令
比如它们能讲个笑话
或者它们能告诉你时间
所以你可以说'嘿, 设备 现在是什么时间'
它们可以放音乐
它们有时也可以帮你打出电话
能告诉你天气状况,
'嘿, 设备 明天什么天气?'
所以,意图识别的作用就是
用这四个字 --
--就是语音识别的输出结果,
然后用另一个人工智能软件,
即另一个A到B映射,输入这四个字,
然后输出你的意图
所以在这个机器学习算法
的运用中
输入A是
文本记录 ‘讲个笑话‘
B是
刚刚用户所说出的五个指令中的一个,
当然, 你的智能音响也许能理解
比这五个指令更多的指令
如此一来那么B
就会是这五个或一百个或一千个
智能音响懂得执行的指令中的一个。
无论你是以何种方式要求
智能音箱给你讲个笑话的
意图识别组件都能
正确地分辨出你的意图
比如说,除了'嘿,设备,讲个笑话'之外
还可以说
'嘿,设备,你知道什么好的笑话吗?'
或者'嘿,设备,给我讲些好笑的事情‘
显然,你可以用很多不同的
方式让智能音响给你讲笑话
而一个精心设计的意图识别系统
应该能分辨出它们中的大多数
最终,你的智能音箱
知道了你非常非常
想听一个笑话
最后一个步骤就是
让软件程序员写好的编码
来随机挑选一个笑话
然后将这个笑话通过扬声器播出
换句话说,这就是所谓的‘执行’一个笑话
顺便提一下, 我最喜欢的笑话是
为什么在人工智能领域 有这么多像‘电击‘般的成果?
因为人工智能是新型电力
电击般的电力,明白这个笑话的意思了吗?
(Shocking除了令人震惊的之外,还有电击的意思) 希望你喜欢这个笑话
好了,言归正传,你可以这样思考
算法中的这四个步骤,
第一个步骤是检测触发词,
第二个是语音识别,
然后是意图识别,
最后用户对智能音响指令的执行
像这样的由
几个步骤组成的人工智能系统
有时,被称为人工智能管道
就是说,你有好几个人工智能组件
或是好几个机器学习组件,
来一步一步地
处理数据
一个公司里由四个不同的团队,
来专注于这个人工智能管道中的每一个步骤
是很常见的!
这通常是我们在大公司
里组织项目的方法
现在让我们来看一个 更复杂一些的例子
比方有人
发出了一个更复杂的指令,像'嘿设备,
我需要计时十分钟.'
以下是处理这个指令所需步骤,
跟之前一样,第一步是检测触发词,
因此,在输入音频后,音响就检测到
触发词‘嘿设备‘。
接下来是语音识别, 这个步骤会把剩下的音频
即剩下的声音
或者是剩下的音频转换为为文本
'把计时器设到十分钟.'
接下来,意图识别要输入这个文本,
然后输出你的意图,
即设置一个十分钟的计时器,
设置一个十分钟的计时的意图
和之前'讲个笑话'的意图相比,
现在你需要
知道具体要
把计时器设置多久
所以在执行这一步时,
你需要做两件事情,
一个是获取时长,
也就是说,看文本
'把计时器设到十分钟'
然后取出这个
需要设置时长的短语
所以,如果一个用户说
'嘿设备,十分钟到了的时候告诉我'
那么获取时长这个步骤需要
再一次在这里取出'十分钟'这个短语。
当然了,要求设置一个十分钟的计时器的方式有很多,
你可以说‘十分钟到了的时候告诉我'
或者设置一个从现在开始十分钟之后的闹钟
意图识别组件
和时长获取组件都必须
足够强大去识别出所有这些
要求设置十分钟计时器的不同说法。
最后,要最终执行这个指令
智能音响里需要
有一个专门的软件组件
来启动一个计时器并且设置一定的时长
当它明白了你的意图 并且获取了时长信息之后
它就会根据被要求的时长来开始计时了
最后,十分钟之后闹钟就会响起
现在的智能音响有许多功能
除了我们已经讲过的
讲笑话和设置计时器这两个之外,
这是一些它们如今
能执行的其他功能
而这些功能的执行步骤
就是触发词,
或者说唤醒词,
语音识别然后转化成文本指令,
意图识别, 即弄清楚
在这些功能中哪一个
是你想要它执行的
然后就是用一个专门的程序
来执行这个你下达的指令
一个智能音箱领域里的挑战是
如果你想要智能音响
有很多不同的功能
比如说20个功能
那么你确实需要一个软件工程师团队
来写20个专门的软件
一个用来放音乐,一个用来调音量
一个来打电话,一个来告诉你现在的时间
一个来做单位换算, 比如从一茶匙到一汤匙
或者来回答一些非常简单的问题等等
写出每一个这种专门的软件
来执行这些
不同指令,需要
很多的前期工作,
并且智能音响现在会做很多事情,
以至于对很多用户来说
弄清楚它们到底能做什么
不能做什么是有些难度的。
所以有很多智能音箱公司
在用户培训方面投入了大量资金
试图让用户知道什么是智能音箱
可以做到的
因为毕竟它们
不是说什么事情都可以做到
有很多你无法让智能音箱
为你做的事情,比如说
请给我的三个朋友都打电话
并且看看他们是否能一起见面吃晚餐
所以说智能音响公司像用户解释
它们能做什么不能做什么
这是一个持续的过程
尽管如此, 用户用智能音响可以做到的事情
即用声音来给它们下达指令
使很多人的生活都变得便利了许多
我希望这段视频让你大概了解了 创建一个复杂的
人工智能产品的基本过程, 比如说怎么设计一个智能音响
为了更好地帮助你了解
这些复杂的产品有是如何运作的
我们来看看第二个案例
看看如何把多个人工智能组件组装在一起
来做一辆自动驾驶汽车
我们下一节再见
- #Case study: Self-driving car
人工智能时代最令人兴奋的产品之一
是自动驾驶汽车
自动驾驶汽车也是
现今人工智能里
最神秘的技术之一
在这个视频中,我想和你们分享的是
一个有些简化的有关自动驾驶汽车的解释
以帮助你
理解如何将
多个人工智能组件组装在一起
而构成如此神奇的事情
让我们开始吧 下面这些是
决定你将如何驾驶自动驾驶汽车的关键步骤
汽车会接收各种各样的传感器作为输入
比如汽车前方
侧面或后方的图片
以及声波雷达
或激光雷达的传感器读数
有了这些作为输入
就能探测出其他车辆的存在或所在位置,
这样的话,你就可以
发现附近有车
同时注意到行人的位置
因为我们想要避开
其他车辆以及行人
汽车探测和行人探测
都可以通过机器学习来完成,即
使用输入输出映射,或A到B映射
这里的输入可能是图片
或者是雷达和激光雷达信息
输出是
其他车辆和行人的位置
最终,既然你已经知道了
其他车辆和其他行人的位置
你可以将这些信息投喂到
另一个专用的软件里,
这个软件称作运动规划,
这个软件的会规划动作
或者帮你规划
你的车行驶的路径
这样你就可以靠近你的目的地了
并且同时避免碰撞
一旦你规划出了你的车的动作
你可以将其转化成
特别的舵机角度
和加速度以及刹车指令
像油门应该踩多少
刹车应该踩多少来使你的车
以预想的角度和速度移动。
接下来,让我们更具体地了解一下 车辆探测、行人探测和动作规划
的三个关键步骤
汽车检测使用监督学习,
所以,你已经看到了学习算法 如何能够
将像这样的图像作为输入
并将探测到的车辆作为输出
对大多数自动驾驶汽车而言,
不仅要使用前置摄像头,
也就是一个向前看的摄像头
还需要左右两侧,
以及向后看的摄像头,与传感器
来探测周围所有的车辆
这一任务通常不只是使用摄像头完成
而是使用了其他的传感器 如雷达以及激光雷达
接下来是行人检测,
行人检测使用的是比较类似的
传感器和技术
使得自动驾驶汽车可以探测行人
最后,我简要介绍一下运动规划步骤
下面是一个例子,
比如你在开车
你的前方有一辆淡蓝色的车
运动规划软件的工作是
告诉你你的行车路径应该是什么
如这里红色部分所示
你应该沿着这个路径驾驶
从而不发生事故
所以运动规划软件的工作是
输出你驾驶的路径
以及速度
为了沿着道路行驶
和应该被设定的速度
所以你不会撞上另一辆车
同时还以合理的速度在路上行驶着
来看另一个例子
如果有一辆灰色的汽车
停在路的右边,
然后你想超过这辆车,
那么运动规划软件的工作是
画出一个像这样的路径
来使你向左开一些,
安全地超过这辆车
到目前为止,我简单描述了自动驾驶
主要的三个组成部分。
让我们看看更多的细节
实际的自动驾驶汽车如何工作
这是你目前为止见到的结构图,
输入图像,雷达或者激光雷达,
传感器读数
关于车辆检测和行人检测
然后将这些投喂给
运动规划软件 以此帮你选择路径和速度
在一个真实的自动驾驶汽车里,
你通常不仅仅只使用
摄像头、雷达和激光雷达,
现在大多数自动驾驶汽车 还会使用GPS
来获得位置,还有加速度计
有时候称作IMU,这就是加速度计
陀螺仪还有地图
因为我们知道
汽车通常更多是在道路上被发现
而行人更可能在人行道上被发现
尽管有时候他们也会出现在公路上,
所有这些都是
附加的信息,用以检测
车辆和行人
和接下来我们即将提到的别的物体。
除了检测车辆或者行人
为了安全驾驶 你还需要知道
这些车和行人接下来要去哪儿
所以,另一个普遍的
自动驾驶汽车的部分是轨迹预测
这是另一个人工智能的部分,
它不仅让你找到车辆和行人
还有他们可能
在接下来的几秒钟到哪儿去
所以就算他们正在移动,你也可以避开他们。
安全驾驶不仅需要
知道其他车辆和行人的位置,
你还需要知道车道,
所以你还需要探测车道标志,
如果有交通灯 你还需要
找到交通灯在哪儿
以及它是红灯、
黄灯还是绿灯
有时候还有其他障碍物
如突然出现的交通锥体,或者
也会有一群鹅从你的车前经过
这也需要被检测
所以你的车可以躲避
除了车辆和行人之外的其他障碍物
在一个大的自动驾驶汽车设计团队里,
让一部分人分别
负责每一个
这些红色的方框里的工作
一点都不例外。因为只有把他们分别做好,
然后组合放在一起,才能够
设计一辆自动驾驶汽车
如你在这些
综合的人工智能例子里,
以及之前的例子里 -- 比如智能音响--里
所看到的四步AI途径,
有时这需要一整个队伍才能构建
出一个复杂的AI产品。
在下一个视频中,我将与你分享
在一个大的AI团队中重要的一些角色。
如果你只是一个人或者
是一个小的AI团队,这对你也是有用的。
我的目的是让你对
如何组建一个大的人工智能团队有个了解,
这在未来会对你有帮助。
我们下一节再见
- #Example roles of an AI team
通过观看前面两个视频,你会发现
有些AI产品可能需要一个庞大的AI团队
也许你有100人的开发团队或者
有时候需要不止100人的开发团队需要去搭建
这个视频中,我想要和你分享
一个庞大的AI团队所扮演的角色
和承担的责任
通过这样,你可以更好地理解
创建这些复杂的AI产品
会涉及到哪些工作
即使你只是在一个非常小的团队里工作,
这也许只是1到2个人
或5个人的小团队,
我仍然希望这个视频
对你来说是有用的 我希望它能
帮你了解在一个AI团队中可能需要的
不同类型的工作
即便你最后
只是在一个非常小的团队里执行这些工作
需要警告你的是,因为AI发展太快
它的工作头衔
和各种角色承担的责任
不是100%(如同我)清晰地定义的
它们在不同的公司中
会有一点点不同
比如,你的公司的工作头衔可能
不同于
我现在介绍的工作头衔
但是我想与你分享的是
那些公司是如何使用这些工作头衔的
这样的话,如果有一天你建立自己的AI团队
当听到这些角色的时候
至少你会对这些工作头衔的含义
有更深入的理解
欢迎你们来到今天的社会心理学闲聊
很多AI团队会有软件工程师
因此,举例来说,对于智能音箱
我们需要设计专业软件
来执行(讲)笑话,或者
设定一个计时器, 或者回答关于今天天气的问题
所以,这些都是传统软件工程的任务
或者,如果你正在建造自动驾驶汽车
需要确保你的自动驾驶汽车软件
是可靠的,不会崩溃
这些都是软件工程任务
所以,这些对于AI团队来说
拥有大部分的(有时候50%
有时候远远超过50%)
的软件工程师不是稀罕的现象
第二种角色是,机器学习工程师
机器学习工程师可能会写
一些软件
用于生成A到B的映射
或者用于创建其他机器学习算法
然后运用于你的产品中
因此,他们可能会收集
关于汽车的图片、汽车的位置的数据,
用它们训练一个神经网络,
或者训练一个深度学习算法
并且一直迭代,以确保
学习算法可以持续提供准确的输出
另外,你会经常听到的一个角色是
-- 机器学习研究员
机器学习研究员典型的职能是
负责开发机器学习的前沿技术
机器学习和AI技术
仍然在迅速地发展,
因此,很多营利、非营利公司
都有机器学习研究员来
负责扩展最新技术
一些机器学习研究员会发表论文
也有一些公司的机器学习研究员
专门做研究
很少专注于发表论文
另外还有一种工作头衔,
它介于这两种头衔之间,
那就是 -- 应用机器学习科学家,
这个工作头衔是介于
机器学习工程师
和机器学习研究员之间的
机器学习科学家
会同时做一点点前两者都有的(的工作内容)
他们经常需要负责
学术文献或研究文献
寻找到最前沿的技术
并且想办法用找到的这些技术来解决
他们面临的问题,例如
如何利用最前沿的技术
研究出弱读单词检测算法
并应用到你的智能语音系统中
再看几个例子
目前,各行各业都要用到
数据分析师
但是,对数据分析师这一角色
的定义并不明确并仍有争议
在我看来,数据分析师最重要
的职责不仅仅是
监测数据并分析数据背后的意义
还应包括向其团队或总裁
来展示由这些数据分析得出的见解和点子
帮助驱动商业决策。
也有数据科学家做其他的任务,
所以,有些数据科学家
做的事情更像
机器学习工程师,
就像前面幻灯片提到的一样,
这个工作头衔的定义还在不断发展中,
随着大数据的兴起,
也有越来越多的数据工程师
其主要作用是帮助 你整理你的数据
意思是, 以确保
您的数据安全地保存下来并很容易读取、
(保存和读取的方式)而且是以一种很经济的方式。
那么, 为什么保存数据如此的重要呢?
不能把数据保存在
硬盘上就行了吗?
在一些公司中, 数据量 已经变得如此之大,
这其实需要相当大量 的工作来管理这些数据。
为了让你对这个大小有大概了解
在计算机科学中, 1 MB代表1兆字节
所以你的音乐播放器上 的一个典型的歌曲
例如一个典型的 MP3 文件可能 是几兆字节,
一般说来,5兆字节 不是一个正常的 MP3 文件大小,
1, 000 兆字节是被称为千兆字节,
100万兆字节是被称为 tb,
10亿兆字节是 被称为 pb,
用今天的硬盘大小,
储存几兆字节 是很简单的,
比如说一个MP3 文件,
但存要储1000兆字节
也被称为千兆字节,
硬盘速度会开始变慢
一般你从网上下载的
一小时电影,差不多有千兆字节那么大
这是比较大的数据了,
为了让你对这个大小有大概了解
自动驾驶汽车
在运行过程中可能每分钟
会收集好几千兆字节的数据
所以就好像是每分钟
自动驾驶汽车会产生
像储存好几部电影那样多的数据
所以, 自动驾驶汽车 实际会上制造很多数据
所以为了把几天,几周, 几个月,
甚至几年的运行数据储存起来,
需要大量的数据工程工作,
一TB是一GB(千兆字节)的一千倍
而一PB又是一TB的一千倍
对于这个团队来说
他们每天要负责
储存好几PB的数据
但除了相当大的
互联网公司
对一般的公司而言每天
产生这么多数据是不常见的
当你跟着这个量级走,
就会有了更大得多的数据,
如何保证数据以一种安全, 经济高效
且容易被读取的方式储存起来,
会变得越来越难,
这也是为什么数据工程师
变得越来越重要了
最终, 你也会听到 一些人提到
AI 产品经理
他们的工作是帮助决定用AI做什么,
也就是说,是帮助判断
什么是可行且有价值的
传统的产品经理工作
本身就是要决定打造什么
有时也有一些其他的工作内容
但 AI 产品 经理现在必须要
在人工智能领域做这样的决策, 而且他们需要
学习新的技能 从而才能决策什么是
可行且有价值的,
因为人工智能领域 仍在不断进化之中
这些职称都没有 完全板上钉钉
不同的公司也有各自不同的
使用这些岗位名称的方式
我希望这节视频能给让你有一个大致的了解,
明白打造一个非常复杂的人工智能产品
需要哪些不同类型的工作
并且让你知道有些岗位职称, 也是在不断发展变化的
在这个视频的结束,我想再一次强调
你完全可以从一个小团队开始。
大多数的AI项目不需要100个人来完成
所以不管是
你只有一个软件工程师
或者一个机器学习工程师
或者只有一个数据科学家
或也许只有你一个人,
如果你自己或者跟你一起工作的工程师
学过一些关于机器学习,深度学习或者
有关数据科学的网络课程
这通常就足够让你自己或
跟那个工程师一起
开始就一些小数量的数据进行研究,
得出一些结论,
或者尝试训练一些机器学习 的模型并建立项目
即使我在这里介绍的是一个大的 AI团队
里面大概是怎么分工合作的,
就算你只有一个很小的AI团队
也许就只有你一个人
我也依旧鼓励你开始行动
并且开始探索什么样的项目是你可以做的
在这个视频中, 你看到了一个AI 团队 可能是什么样的
但当你看 一个更大的公司时
你会发现AI 团队并不单独存在
那么, AI团队如何能更好的
融入进大公司中并帮助此公司
变得更擅长使用AI呢?
你也许还记得在第一周 的时候我简单地提过
人工智能转型手册
这是一个是让你能帮助你的公司,
这也许是一个很棒的的公司 变得更擅长AI的路线图
既然你已经学会了 什么是人工智能
如何做人工智能项目
还知道了大公司里, AI团队应该
怎样合作完成项目,
那就让我们回到人工智能转型手册
对手册中的各个步骤
更加深入地探索
这样你就能明白
要帮助一个公司在短短几年之中变得擅长AI
需要做哪些事情
并且也希望公司在这个过程中
能变得更高效也更加的有价值
让我们在下一节视频中
探索人工智能转型手册吧
- #AI Transformation Playbook (Part 1)
你如何能帮助你的公司 变得擅长使用人工智能呢?
根据我从领导 谷歌的大脑团队
到百度的人工智能团队
(这两个团队是帮助谷歌和百度在
AI领域变得越来约好的中坚力量)
的经验,
我花了很多时间 怎样能
帮助一个伟大的公司
成为一个伟大的人工智能公司,
并且我想要一个作品和一个人工智能转型手册
来帮助其他的公司完成这个征程
在这个视频中, 我想 与你分享
人工智能转型手册的细节
这样你就能更好地理解
你的公司需要如何才能变得擅长AI
以防这当中有些事情看起来好像是
只有CEO需要知道的
我想告诉你并不是这样的
公司中的每个人如果都能了解
自己的工作能如何影响到
不仅仅是几个项目而是对整个公司
的影响的话
那这是十分有帮助的
让我们开始吧.
这是人工智能转型手册里的五个步骤
我们之后将深入到更多的细节
但简洁地说
第一步是让你的公司开展
试点项目来获得势头,
逐渐了解做一个AI 项目 大概是怎么一回事
第二步, 是建立 公司内部的 AI 团队
第三步, 是提供 广泛的人工智能培训
不仅是针对工程师,
也针对公司中很多的级别 ,包括公司高层
第四步, 是发展你的 AI战略
第五步是对内外部关于
你公司与AI的宣传。
你的公司将也许不采取 跟这里完全一致的顺序
执行这些步骤
并且这些步骤有时会重叠
但这个排序提供给你
一个大概的感觉,来帮助你推动项目,
在这个视频中, 我们将更详细的讲解
前三个步骤,然后在
下一个视频中我们会讲解第四,五步骤
让我们从第一步开始--
--开展试点项目来获得势头
如果你想要你的公司 在人工智能能有所发展
在考虑初期项目或几个最初项目时,
最需要的考量是
它们是否能成功 而不是
它们是否最有价值,
比如说,当我在主导谷歌大脑团队时
对于深度学习
业界仍持有很多怀疑
所以,我的第一个内部客户
是谷歌语音识别团队
有语音识别是挺好的
你知道,有用,但这并不是
最重要的, 或者说对公司营收来讲
最有价值的项目
比如它并不像,网络搜索
或者线上广告那样的有价值
但通过我的团队
让谷歌语音团队 变得更加成功时
我们开了个好头, 把整个势头带动了起来
因为当语音识别团队的其他兄弟姐妹团
开始看到我们让语音识别团队
变得更加成功时
他们也会开始青睐人工智能
并且想要与我们AI团队合作,
所以,我的第二个内部客户
是谷歌地图团队,帮助他们
通过深度学习改善
地图数据的质量
经过这头两个成功案例,
我便开启了与其他团队, 比如说线上广告团队的沟通,
所以说,在选择你的初始项目时
尝试选择你觉得成功几率
较高的项目
它们能把整个势头带动起来
它们也许不是最有价值的项目,
但这样能最终把最有价值的项目人工智能化
因为做前几个项目的目的
只是要开始这个势头
并且如果你能选择在6到12月内
就能展示成效的项目会是很好的
这样你就能让整个转型很快地动起来
最后, 你的第一,二个试点项目
既可以是公司内部做的,也可以是外包的
如果你还没有一个
大型的内置AI团队
也许你可以,甚至我建议你, 外包你的最初的一些
甚至所有人工智能项目
这样你就能更快地获得专业知识技术
并且更快地开始转型的势头
那么,超过了一定的时间点
你是需要你的内部AI团队的来
开展一系列长期
或者更多的AI项目的
所以,第二步是--搭建一个内部的AI团队
很多公司是的结构是这样的 --
-- 有一个CEO
和好几个业务部门,向CEO汇报情况,
在这里我简写为BU(业务部门)
那么,我给大多数公司的建议是
去搭建一个集中统一的AI团队,
再从这个集中的团队里挑选
出人员让他们去帮助那些不同的业务部门(这叫做矩阵组织)
为什么要一个集中的AI团队呢?
举个例子来看
也许这个单位是 礼品卡部门,
这个部门的单位领导人可能
十分擅长他/她份内的职务,
也就是说,他们在礼品卡业务方面十分擅长
但是, 除非他/她有足够的 AI方面的知识
并且知道如何搭建,保留并且管理一个AI团队,
要叫这个部门领导人去招聘,保留
并且合适地管理他自己的AI人才
是十分困难的。
所以, 在这种情况下, 我认为
有一个AI团队负责人能
把控全公司的对AI这一块的
人才招聘和保留,这会
对全公司在人工智能方面的成功有很大帮助,
创建一个集中统一的AI团队
为团队提供了一个可以相互交流的平台,
用以探讨如何能在你公司的
业务范围内应用AI,
把统一AI团队里的人才
分配到礼品卡业务部门
也许是更有效率的
这样你的AI人才就能与
礼品卡领域专家们
在一起创建一个有趣的AI项目。
AI团队的另一个职责
是要建造一个全公司范围的平台
如果有什么软件平台,其他工具,
或是数据基础设施
能对整个公司有帮助的话,
也许一个单独的业务部门
并没有足够的资源或者动机
来搭建这样一个能
帮助全公司的
平台或资源
但一个集中统一的AI团队
也许能用来构建这些
在整个公司范围内使用的工具或平台 来帮助多个部门开展业务
最后, 这个新AI 业务部门
可以直接汇报给CTO,或是CIO
首席数据官或者首席数字官
或者也可以让一个新的首席人工智能官(CAIO)来负责
我越来越多地
在不同的公司中看到
首席人工智能官(CAIO)这个职位
但如果其他高级别的 管理人员有合适的技能的话
他们也可以来管理这个AI部门
最后一个建议是
我认为如果在AI部门刚成立时
公司或者CEO能提供经费给它,
这会是很有帮助的。
而不是要AI部门自己
从其他部门获得资金
最终,在渡过了初期投资阶段
和最初的上升阶段之后
AI是一定要展现
它为其他部门提供的价值
但如果CEO能从开始
提供资金让他们启动的话
这能更快地帮你
获取转型初期的势头
除了创建一个内部的 AI 团队
我还建议你提供 全面的AI培训
现在, 伴随着很多公司 变得擅长人工智能
你不仅仅需要你的工程师们懂AI
你需要在公司不同层级的一些人
来理解AI是如何
与他们的工作岗位互动的
比如说,对于高管和高级商业领袖而言
我建议让他们学习AI
能为你的企业做些什么
并且让他们了解基本的AI战略
并且让他们
足够了解AI,以便于来决定
如何进行资源分配
那么,高管们
需要接收到多少培训呢?
我认为培训多少小时
并不是一个衡量培训
很好的方式,但考虑到这个因素
我认为你可以进行很多这样
四小时的培训
在AI 项目里展开工作的各部门领导
也应该知道如何在 他们各自的角色里与AI互动
我认为这些领导人们应该懂得
如何制定项目方向
即如何进行技术和商业调查
以及如何在部门级别
进行资源的分配
并且
知道如何跟进,并且 监督AI项目的进程
所以,这种类型的培训
需要花至少十二个小时
再一次强调,培训的时间
并不是一个用来衡量 他们到底学了多少的指标
最后,很多公司在从
公司外部纳入AI人才,
但我并不想就此低谷
培养内部工程师的AI技能
所能带来的影响
对一个软件工程师来说,
要精通AI领域确实需要一些时间
所以计划好至少 一百个小时的训练
但我看到很多公司
在给工程师们提供培训
来帮助工程师们构建AI软件
收集和管理数据
并帮他们在开展特定的AI项目上
变得更有效率
如今世界所拥有的
AI工程师是远远不够的
所以内部培训是很多公司
建造它们AI能力的关键部分
那么最后,你将如何完成这些培训呢?
多亏了网络在线内容的快速发展,
这包括
网络课程到各种书籍,
再到YouTube视屏和博客文章
网上有大量的很棒的
关于所有这些议题的内容
我认为一个好的COO,应该
和专家一起策划利用这些内容并
激励团队们来完成这些学习活动
而不是非要自己创建新的内容
因为这样的话,成本会高很多,
以上这些就是AI转型手册 的第一步到第三步
我希望你的公司能开始
展开一个初始项目,创建一个团队
提供培训,并且真的开始
获得很多势头和进展
来帮助你的公司变得更有价值
也能更有效地运用AI
从更大的格局来看
AI 还会影响 公司战略和你如何
能在这个公司的转型中 协调不同的利益相关者
包括投资者,
员工和客户
让我们进入下一个视频 谈论 AI 策略
- #AI Transformation Playbook (Part 2)
在上一个视频中,你学习了如何
执行试点项目以获得
内部AI团队的动力
并提供广泛的AI培训。
但是你想要你的业务,
不仅仅是在短期内 利用人工智能获得动力,
而是从长远来看,
它也是一项非常有价值 甚至成为公司业务成败的关键。
这时你能做什么
让我们谈谈人工智能战略
以及对于人工智能的内部和外部沟通,
这对某些公司是很重的环节
先回顾一下,这是
AI转换手册的五个步骤,
在本视频中,
我们将深入探讨这最后两步,
人工智能传输手册的第四步
是制定人工智能战略,
我希望你可以利用人工智能来创造
一个特定于你所在行业的优势。
这本手册的一个不寻常的部分是制定
人工智能战略放在了第四步, 而不是第一步。
当我与许多CEO分享这个手册
他们的一致要求和反馈是
请你把制定策略作为第一步吗?
因为他们想弄清楚公司策略是什么,
然后我想找到匹配的资源,
然后执行策略。
但是我发现那些尝试将
策略定义为第一步的公司,
就是说,他们先制定公司战略,
然后才开始尝试去了解
什么是可行的AI项目,
像这样的公司往往最终会
采用一些不太
不符合常识的学术策略。
例如,我看到一些CEO
将报纸标题复制粘贴到策略中,
比如这个CEO会说,
“我的策略是专注于收集大量数据",
但对于你公司而言,
这些数据可能有价值,也可能没有价值,
所以对你公司来说 大量采集数据不一定是好的策略
因此,我倾向于建议公司首
先启动其他步骤,
执行试点项目,
开始建立一个团队,
开始提供一些培训,
这样只有在你了解
AI并了解它如何 适用于你的业务之后,
然后你再制定你的战略。
我认为这对你的公司来说
比你试图先制定 人工智能战略要好得多,
在你的公司,
特别是最高层的执行团队
在对AI可以做什么和不能什么
有一些稍微深入的了解后,再执行公司战略
此外,你可以考虑设计一种
与AI的良性循环相一致的公司策略。
让我用网络搜索的例子来说明,
原因之一
意思是说这种生意
对想进入这个市场的新公司
来说是很难跟企业龙头竞争的,
这其中一个原因是:
如果一家公司有更好的产品,
可能仅仅只是稍微好一点的产品,
那么该网络搜索引擎可以获得更多用户,
拥有更多用户意味着你可以收集更多数据,
因为你可以观察
不同用户在
搜索不同术语时所点击的内容,
并且可以将这些数据
输入AI引擎以生成更好的产品。
因此,这意味着公司
如果有产品稍好一些,
最终会有更多的用户,
从而会因此获得更多数据,
并且通过现代人工智能技术
创建更好的产品,
这使得新进入者很难
进入这种自我强化的正反馈循环,
称为人工智能的良性循环。
值得庆幸的是,
人工智能的这种良性循环也可以
被小型团队用于进入新的垂直行业。
因此,我认为今天很难建立
一个新的网络搜索引擎来与谷歌,
百度,Bing或Yandex竞争。
但是如果你正在进入一个新的垂直领域,
一个新的软件应用领域,
在那里还没有一个已经存在的企业,
那么你可能可以制定出一个策略,
让你成为利用这个良性循环的公司,
让我来进一步解释这一原理
有一家名为Blue River的公司
被John Deere以超过3亿美元的价格收购,
Blue River使用AI制造农业技术,
他们做的就是建造
这些可以拖在拖拉机后面的机器,
在大型农田里。
这台机器将拍摄庄稼的照片
并分辨出哪些是农作物,哪些是杂草,
并使用精确的AI来杀死杂草,
而不是农作物。
所以,我认识Blue River的
一些创始人,当时他们是
上我课的斯坦福大学的学生。
因此,为了让项目开始,
他们实际上只是使用皮带做苦力,
和他们的个人相机
去了一些农场,
并在这些农田里拍了
很多作物的照片。
在那里,他们开始在卷心菜周围
收集白菜和杂草的照片,
一旦他们有足够的数据,
从一个小的数据集开始,
他们可以训练一个基本的(AI)产品。
坦率地说,第一个产品并不是那么好,
它是由一个小型数据集上训练出来的,
但它成功
说服了一些农民,
开始使用他们的产品,
将这台机器拖到拖拉机后面,
以便开始杀死农民的杂草。
一旦这个东西在农场周围运行,
通过拍摄白菜,
和杀死杂草的一系列过程,
他们自然会获得越来越多的数据。
在接下来的几年里,
他们进入了
这个积极的反馈循环,
也就是说因为拥有更多的数据,
以导致拥有更好的产品,
然后,拥有更好的产品便可以
说服更多的农民使用它。
让农民使用它可以让你收集更多的数据,
几年下来,进入一个像这样的良性循环,
可以让你收集
庞大的数据资产,
从而使你的业务非常具有防御性。
事实上,在收集数据的时候,
我很确定他们拥有
更大的数据资产
在菜地里种满白菜的照片,
甚至比大型科技公司还要多,
而且确实使得这项业务,
相对来说甚至可以防范
拥有许多网络搜索数据的
大型科技公司,
但没有像这家公司一样,
拥有这么多的
菜地里的白菜照片。
还有一条建议,
很多人认为
一些大型科技公司
非常擅长人工智能,我认为这是真的。
一些最大的科技公司非常擅长人工智能,
但这并不意味着你需要,
或者应该尝试与这些 大型科技公司竞争AI,
因为许多人工智能需要
根据你的行业专业化或垂直化。
因此,对于大多数公司来说,
在你的行业建立专门的AI是最好的,
并用AI在你的专业领域内做最好的工作,
而不是试图竞争,
或觉得你需要与大型科技公司
在AI方面相互竞争,
这对大多数公司都不适用。
(现在开始讨论)人工智能战略的其他要素。
我们将生活在人工智能世界中,
正确的策略可以
帮助你的公司
更有效地应对这些变化。
你还应该考虑创建数据策略。
领先的人工智能公司非常擅长
战略数据采集。
例如,
一些面向消费者的大型AI公司
将推出服务,
如免费电子邮件服务,
或免费照片共享服务,
或许多其他的免费服务,
但这允许他们以各种方式收集数据
从而可以更多地了解你,
因此他们可以为你提供更多的服务,
从而直接货币化他们关于该产品的数据,
这与直接货币化提供服务的产品
是完全不同的方式。
您获取数据的方式
因行业垂直而异,
但是我参与了
这些类似多年国际象棋比赛的过程,
就是说,其他与我竞争的公司和
我正在玩多年游戏,
看谁能获得最具战略意义的数据资产。
你还可以考虑构建
统一的数据仓库。
如果你有50个不同的数据仓库
并由50个不同的领导来管理,
那么叫AI工程师或AI软件
将所有这些数据汇集在一起,
来达成一间整体的项目,
几乎是不太可能的。
例如,如果
用于制造业的数据仓库
与用于客户投诉的数据仓库
完全不在一起,
那么AI工程师如何
将这些数据汇总在一起来弄清楚
到底在制造过程中可能发生了哪些事
从而导致你运送出有故障的手机,
并因此导致客户在两个月后投诉?
因此,许多领先的人工智能公司
已投入大量的前期工作
将数据拉入单个数据仓库,
因为这有效提升工程师或软件
全面利用不同数据的能力, 以此去发现
当前制造过程中的高温
如何导致设备设备故障,
并导致客户
在未来两个月内投诉,
从而让你回头
去改善你的制造流程。
在多个行业中有很多这样的例子。
你还可以使用AI来创建
网络效果和平台优势。
在赢家通吃的行业中,
AI可以成为一个巨大的加速器,
例如,乘车共享
业务 (类似Uber)
今天,像Uber,
Lyfts,Ola,DiDi,
和Grab这样的公司似乎
都有相对防御性的业务
因为它们是
将驾驶员与乘客联系起来的平台,
这对新进入者很难,因为
积累大量的驾驶员并
同时吸引大量乘客是很难的。
Twitter和Facebook等
社交媒体平台也非常具有防御性
因为它们具有非常强大的网络效应
在一个平台上,
拥有大量用户,
使该平台对其他人更具吸引力。
因此,新进入者很难闯入。
如果你正在从事这类
赢家通吃动态或赢家最多动态的业务,
如果AI可以用来帮助你,你就会更快地成长。
例如,加速用户获取
可以转化为对公司
更大的机会,
使你的公司在这个业务 垂直领域取得成功。
企业战略是特定于
公司、行业的具体情况的,
因此,很难为每个公司
提供一个完全通用的战略,
但我希望
这些原则为你提供一个框架
以便帮你的公司思考
人工智能战略有哪些关键要素。
现在,AI也可以
适用于更传统的战略框架,
例如,Michael Porter
多年前撰写了关于
低成本和高价值战略的文章。
如果你的公司有一个低成本战略,
那么也许人工智能可以用来
降低你的业务成本,或者
如果你的公司有高价值战略
来提供成本更高的
真正有价值的产品,
那么你可以使用AI来专注于
提高你产品的价值。
因此,人工智能也可以帮助
提升现有的
企业战略要素。
最后,当你正在建立
这些有价值和有防御性的业务时,
我希望你也只想建立
出让人们变得更好的企业,
人工智能是超能力,
做出一个伟大的人工智能公司,
是一件非常强大的事业。
所以,我希望无论你做什么,
你做这个只为了让人类生活更好。
AI传输手册的最后一步是
开发内部和外部宣传和沟通。
AI可以改变一个公司和它的产品,
因此,与利益相关者
进行适当沟通是很重要的,
比如,这也许包括与
投资者建立好的关系,来确保
你的投资人可以
正确诠释你的公司的AI价值和地位。
投资者关系也可以
包括与政府之间的关系,
例如,AI正在进入医疗保健领域,
这是一个受到严格监管行业,因为政府
有需要来保护患者,
因此为了让人工智能
影响到这些受到高度监管的行业,
我认为重要的是能
让公司与政府有效沟通,
并以公私合作伙伴关系
与彼此合作
以确保AI方案
为人们带来应有的好处,
同时,也确保政府
能够保护消费者,和保护患者。
因此,对于医疗保健来说这是真的,
对于自动驾驶汽车来说也是如此,
对于金融和
许多其他AI垂直行业 来说也是如此。
如果你的产品发生变化,
那么消费者或 用户受培训将是重要的。
AI人才在当今世界上 是非常缺乏的,
所以如果你能够展示
你的一些初步成功,
可以真正帮助人才和招聘找到你
最后,内部沟通也很重要
如果你的公司发生转变,
内部的许多员工可能会开始担忧,
有些对AI的担心是理性的,
有些却不太理性,
所以在适当的情况下 让员工放心只会有所帮助。
通过这五个步骤,
我希望它能让你了解
如何帮助公司变得擅长人工智能,
如果你有兴趣阅读
详细的AI传输手册,
你也可以从这个AI网站下载。
我希望你喜欢
这两个关于AI传输手册的视频
我已经看到公司通过接纳 和变得擅长人工智能
而变得更有价值和更有效,
我希望所讨论的这些想法能够
帮助你公司变得擅长 人工智能迈出第一步
话虽如此,我还看到了许多常见的陷阱,
这些是公司在尝试
将人工智能使用到整个 企业中遇到的困难。
让我们在
下一个视频中来看看
这些常见陷阱,
希望你可以避免它们。
让我们继续下一个视频。
- #AI pitfalls to avoid
我希望你能够用AI
为自己或公司
创建令人兴奋和有价值的项目
让自己和他人的生活更美好。
同时,我希望你也能避免一些
我见过的AI团队陷入的陷阱。
如果你正在尝试为您的公司构建AI,
那么让我们重点讨论五件事。
首先,不要指望AI能解决所有问题。
你已经知道人工智能
可以做很多, 但也有很多是无法做到的
相反,
你应该对AI能与不能有现实客观的理解
这要考虑到技术,
数据和工程资源的限制。
这就是为什么我认为除了
业务之外的技术调查
选择可行且有价值的AI项目 也很重要。
其次,不要只雇用
两三个机器学习工程师
只依靠他们来
为你的公司提供使用用例。
机器学习工程师是
一种稀缺资源,但你应该
让工程师与业务人才交流
并让他们跨职能地工作
以寻找可行和有价值的项目。
往往是当
机器学习人才与商业人才
一起工作的时候,
才可以选择最有价值和可行的项目。
第三,不要指望AI项目一次就能成功,
正如你已经看到的,
AI开发通常是
一个迭代过程,因此应该
通过迭代过程来规划它,
并且需要多次尝试才能成功。
第四,不要指望传统的计划流程
在没有变化的情况下应用。
相反,你应该与AI团队合作,
以建立有意义的时间估计,
里程碑,KPI或指标。
与AI项目相关的时间线估计,里程碑,
KPI或指标的类型
与非AI项目相关的内容
略有不同。
因此,希望
当你个人对AI有一些了解,
可以帮助你想出
更好的方法来规划AI项目。
最后,不要以为你需要 超级厉害的AI工程师,
才能开始一个项目,
相反,继续建立团队并开始
与团队合作,你可能会开始意识到
当今世界上有许多AI工程师,
其中包括许多主要从 网络课程中学习的人,
他们其实可以建立很
有价值和可行的项目。
如果你可以避免这些AI陷阱,
那么与许多其他公司相比,
你已经领先一步了,
最重要的是要迈出第一步!
你的第二个AI项目会比你的第一个更好,
你的第三个AI项目会比第二个更好。
所以,重要的是能迈出第一步
并尝试你的第一个AI项目。
在本周的最后一个视频中,
我想与你分享一些
可以在AI中采取的具体的第一步。
我们下一节再见
- #Taking your first step in AI
在本周的课程中,你会看到一些
建立复杂人工智能产品的例子
例如智能音响或者自动驾驶汽车这样的,
同时你也会了解到在大型AI团队中
会存在着什么样的角色与关系
以及如何形成这样一个团队
并且通过AI转型指南来成功地
帮助公司转型为很棒的AI公司
有时候这可能让人望而生畏
因为这样的转型有时
可能需要两到三年来实现
所以看上去会很困难
不用担心,最更关键的事情是
勇敢地迈出你的第一步
其实通过上完这门课程
你其实已经将这一步迈出去了
所以我希望在上完课后
你也同样能够勇敢地迈出第二步
在这段视频中,我将和你分享一些
相对具体的建议
指导你完成下一步的工作
这对你或你的公司都很有帮助
下面这些采取初始步骤的建议, 我要强烈推荐给你!
与其一个人单干,
不如从你的公司或私人朋友中
找一些人和你一起学习AI知识
这也许意味着,邀请他们和你一起
参与这门课程,
亦或者组织一个阅读小组
来阅读一些有关AI的材料
基于你这门课的学习经验
你也可以邀请有工程经验的朋友
开始头脑风暴一些项目
没有项目是过于小的项目,
从小项目开始 然后取得成功
比从大项目开始 结果失败要好一些
有很多项目 其实可以由你自己
或者与你的朋友完成
如果你或某个朋友
学习过机器学习的网络课,
这完全足以让你们开始去做
许多有潜力有价值的AI项目
在一家公司中, 你也可能招聘到
一些机器学习人员
或数据科学人员来帮助你,
除了提供内部培训
来培养内部团队的人才,
当你准备扩大规模时,
你可能也需要尝试
为公司招聘AI方面的领军人物
但在你仅有几名机器学习人员
或数据科学家时,
尚还不需要招聘一名高级AI领导者
小规模团队的效率会更快一些。
最后我想提到的是,
我跟许多CEO和高层们说过,
如果你希望你的公司 在AI方面做得更好
你可能需要考虑和CEO聊一聊
试图实施AI转型的计划
的可能性。
我认为问题的关键在于
询问你的CEO或者高层,
一旦公司在AI方面变得更强
这是否能够产生更多的价值
如果你们的答案是肯定的
那么这就是一个很好的理由
去促使公司实施AI转型工作
这里列出的这些,
体现了不同程度的执行困难
但是我希望你能够从一些
当前能够提升AI作用的方面开始行动
我看到过一些人,
其中一些是有技术背景的 一些不是搞技术的,
他们都帮助公司学到了许多AI知识
并且高效利用了这些知识
在观看完这些视频后
你也可以考虑做相同的事情
我希望你能够从中汲取长处
从而来帮助你的公司,
帮助你自己,同时也帮助其他人。
最后,我们这周还有两个额外视频,
关于主流AI应用领域的调查
以及主流的AI技术调查
因此如果你想知道
术语“计算机视觉”
和“自然语言处理”有何种含义
或者是“强化学习”
或“无监督学习”等概念
请观看后面的视频
因为我们将在下面的两个视频中
对技术和其应用进行详细介绍
这些内容是可选的
因为它们可能会显得更技术性
但在观看完它们之后
你将能够更好地与AI工程师进行交流
因此不妨去看一看
十分感谢你
能够观看完这周所有的视频
希望在下周的视频中再次见到你:)
- #Survey of major AI application areas (optional)
AI如今正成功地
应用于图像和视频数据
语言和语音数据
等很多领域
在这个视频,你将看到一个关于
AI应用于这些领域的一份总揽报告
我希望
这能激发起你的一些
关于你自己的项目的想法,
关于怎么运用这些技术到你的项目,
让我们来看看吧!
深度学习的主要成就之一 在于计算机视觉
我们来看一些
关于计算机视觉应用的一些例子
图像分类和物体识别指的是
将一幅类似这样的图像作为输入
然后告诉我们图片里有什么
在这个例子中,这是一只猫
不仅仅只是能识别出猫咪,
我还看到人工智能算法能够
认出各个种类的花,
也能认出不同种类的食物
这种将输入的一幅图像
归类到某一种类别的能力
已被用到各种应用中
其中一个得到广泛认可的
图像分类技术就是
面部识别技术
这是现在的面部识别系统的工作方式
一个用户可以注册
一张或多张本人面部图片
来向AI展示自己的长相
在得到一张新的图像后
AI可以判断这是否为同一个人
即,这是你
还是另一个人?
因此它可以据此做出一个
解锁门或者解锁手机的决定,
或是解锁笔记本电脑,或其他
基于个人身份认证的东西
当然我希望面部识别技术
能以尊重个人隐私的方式使用
下一周我们也将会进一步 谈论AI的社会影响
另一种不同类别的
电脑视觉算法 被称作物体检测。
不仅只是尝试
分类或者识别一个物体,
你还要检测是否有 物体出现在一个图像里,
例如,在建造一辆自动驾驶汽车过程中,
我们可以看到AI系统是如何 将这样的图像作为输入
然后不只是告诉我们这是否是一辆车,
是否是一个行人,
它还会告诉我们那些车辆的位置,
还有那些行人
在图像中的位置
此外,物体检测算法还可以
输入一幅这样的图像,然后说,
不,在这张图中没有发现任何车辆
或者任何行人
也就是说,不仅仅只是把一整张图片标记,
即图像分类,
相比,物体识别算法则是
将输入一幅图像并且告诉我们
不同的物体在图像中的位置
以及这些物体的类别,
图像分割 进一步推进这一技术,
给出这样一张图像
这是图像分割算法的输出,
在这里它不仅告诉我们 车辆和行人的位置
还告诉我们 图中所有的像素中
哪些是车的一部分
哪些是行人的一部分
所以它不仅
只在物体和检测物周围画了矩形
还围绕着它所找到物体的周围
画出十分精确的边界
所以在读取X光片的例子中,
所用的技术是图像分割的算法
这种算法可以观察X光片
或者其他一些
人体影像,并且仔细地把
肝脏、心脏
或是骨头的位置 在图像中分割出来
计算机视觉还可以处理
视频,而其中的应用之一便是寻迹
在这个例子中,不只是
检测在视频中的奔跑者
它还追踪
视频中奔跑者是否 随着时间的推移运动
所以,这些红色方框后面的小尾巴
显示了算法是如何追踪
在视频中出现了几秒钟的
不同的奔跑的人
这种追踪视频中人、车 或是其他运动物体的能力
帮助计算机标算出
物体将去向哪里
如果你使用一个摄像头
追踪野生生物
比如周围飞的鸟,
追踪算法将有助于追踪
视频里不同鸟的飞行轨迹
这些便是计算机视觉领域
里的主要在做的方面,
也许他们可能对你的项目有所帮助
AI,特别是深度学习也同样
在自然语言处理领域取得重大的进步
自然语言处理,或者说NLP
指的是AI理解自然语言的能力
即,你和我使用的
用来互相交流的语言
一个例子是文本分类
AI的任务是输入一串文本
比如说一封邮件
接着告诉我们
邮件的归类
比如垃圾邮件 或非垃圾邮件
同样也有网站
输入对产品的描述
比如你可能写下
“我有一个代售的二手手机”
AI自动地在一系列产品中
决定产品的类别
因此会将其分类到“手机”
或“电子产品”类目下
如果你写“我有一件新的T恤准备卖掉”
AI会将它自动归属到“衣物”类别
在文本分类有一个
倍受关注类的技术是情绪识别
比如,一个情绪识别算法
能够将对某家餐馆的评论
如,“食物味道很不错”,作为输入,
然后自动地分辨出
应该对应给出几星的评论
“食物味道很不错”是非常好的评价
可能是四星到五星之间
如果有人写下“服务很差”
那么情绪识别算法
可能会告诉我们
对应的是一星评价
自然语言处理, 或者说NLP
的第二种类型是信息检索
网页搜索可能是
最为人所知的
信息检索方式
你输入文本关键词
并希望AI自动地 帮你找出相关文档
许多企业同样地也会有
内部的信息检索系统,
它可能提供一个界面,
帮助你在数不清的公司文档中
找到你需要的文档
只需要输入关键词, 并按下回车就可以了
下面讲名称实体识别,
这是另一种自然语言处理技术,
用一个例子来解释它吧!
假设你有上图 所示的句子,并想找出
其中所有的人名
比如“伊丽莎白二世”
“保罗·麦卡特尼爵士”
所以这个句子“伊丽莎白二世
授予保罗·麦卡特尼为爵士
在白金汉宫举行的音乐仪式上”
这将会由一个名称实体识别系统
来找出一个句子中
所有的人名
如果你想要找出所有的地名
找出句子中出现的地方名
名称实体识别系统 也可以做到
名称实体识别系统还可以
自动地提取公司、
电话号、姓名和国籍等,
如果你有一个大文档集,
并想要自动找出所有的公司名
或者是同时出现的公司名
或者是人员的姓名
名称实体识别系统将会是
你用来完成目的的有效工具
另一个主流的AI应用是机器翻译
例如,如果你看到一个句子
是用日语写的“AIは新しい電気です”
机器翻译能将其作为输入
接着输出对应的翻译--“AI是新的电力”
这一页幻灯片中提到了四点:文本分类
信息检索,名称实体识别
以及机器翻译,
他们是四大类主流的有效NLP应用
如果你和一个自然语言 处理团队工作,你有可能听到
他们谈论--解析和语音部分标注--技术
让我来解释一下他们是什么
我们用一个句子举例
“The cat on the mat.”(毯子上的猫)
部分语音标注算法将扫描
所有的单词并告诉你
其中哪些词是名词
哪些词是动词,等等
比如,英文中的“cat”(猫)
和“mat”(毯子)在句中是名词
部分语音标注将
把这两个词标注为名词
这都是根据英语理论做出来的,
“The”这个词是一个限定词,
如果你从未听说过限定词,不要担心
这只是英语理论中的一种词性
而单词“on”是一个介词
因此部分语音标注会
像图中所示一样进行标注, 为什么要做这些标注?
如果你正在开发句子分类器
用于餐馆的评论
那么部分语音识别标注算法
将能够告诉你
哪些是名词,哪些是动词
哪些是形容词
哪些是副词等等, 因此最终可以
帮助你的AI系统
找出哪个词是值得留意的
例如你可能应该更多地
关注句子中的名词
因为它们看起来很重要, 也有可能是动词
当然,还有像“好的”、“坏的”
“美味的”这样的形容词
你的AI系统可能会忽略限定词,
“The”, 这样的词可能没什么含义
它体现不出一个用户
对餐馆有什么样的体验
一个部分语音标注系统
通常不是最终形式的应用程序
就像你不可能早上醒来后去想
“奥,我希望能得到
句子标注中所有的词“
还有一个关键的前期处理过程,
即一个关键的中间过程,
在一个很长的AI 流水线中
其中第一步可以是 部分语音标注
也可以是解析器, 这是我们下面要介绍的
流水线接下来的步骤
可能是文本分类
或机器翻译,或网页搜索
现在,来讲讲什么是解析器?
给出以下五个词,
解析器会把单词组合成短语
比如,”the cat“是一个短语
”the mat“是一个短语
而解析器会
在上面划一些连线
以表示它们是一起的
而”on the mat“是另一个短语
最终,两个短语”the cat“
还有”one the mat“
这两个短语连在一起
形成了一个完整的句子
因此我在最上面画出的
结构体现出了 句子中单词的构成
以及不同的单词 之间有着什么关系
那么,一个解析算法
通常也不是最终使用的产品形式
它是其中常用的一个
来帮助AI算法的步骤,
从而翻译分类标签等等
现代AI技术,尤其是深度学习
也完全地改变了
软件处理音频数据,比如一段语音。
语音在计算机中又该如何表示?
上面是一段音频的波形,
这个语音是我一个朋友 说”机器学习“这个短语的录音
X轴是时间
Y轴,也就是纵轴,
是麦克风记录下的信息
麦克风记录的是一些微小的变化
比如高速的空气压力变化,
你的大脑将这些变化解读为语音
这张图以函数的形式
用横轴作为时间,
来表示气压是如何根据
一个人说出”机器学习“时
快速发生变化的,
语音识别存在的问题
和语音至文本一样
将上面的图表作为输入
输出某人正说的词语
大量语音识别近期的进展
都归功于深度学习
语音识别比较热门的一个应用
是触发词检测 或者说唤醒词检测
你在之前的视频中已经看到过
AI系统检测触发词或
唤醒词,比如”Alexa“
或”Hey Google“,或”Hey devise“
Speaker ID 是一种特殊的语音识别问题
它的任务是倾听某人的讲话
接着找出讲话人的身份
这就好像人脸识别一样,
通过拍照来识别你的身份
Speaker ID也可以帮助
通过听你讲话验证你的身份
最后,语音合成技术,也被称为
文本至语音或TTS,最近广受关注,
文本至语音任务是输入
文本形式的句子
并将之转化为音频文件
有趣的是,
文本至语音通常被缩写成TTS
而语音至文本很少缩写成STT
快速举一个例子,
我们用这个句子
"The quick brown fox jumps over the lazy dog."
这个有趣的句子 在NLP领域经常看见人用
因为这个句子中包括了
所有的从A到Z的字幕
也就是说从abc到xyz
你可以检查以下 这个句子是否有26个字母
其中有些字母不止出现了一次
如果你讲整个句子丢进TTS系统
有可能得到这样一段音频
"The quick brown fox jumps over the lazy dog."
现代TTS系统的进步很大,
越来越接近于自然人声
AI同时也被应用在
人们了解的机器人领域
一个例子是自动驾驶汽车
在机器人中,术语”感知“意味着
根据你的所有感官,
找出你周遭世界中的事物
可以通过相机、声波雷达或激光雷达
右边显示了一张3D激光扫描
或者说,雷达扫描的自动驾驶系统
中间这辆自动驾驶汽车
在车附近检测到的车辆
运动规划算法将会
找到接下来机器行进的路径
也就是说,如果你想要左转
运动规划器会规划一条路径,
以及对应的速度,然后左转。
最后, 控制指的是发送指令给机器
比如方向盘马达,
你的油门踏板,
还有你的刹车,
让它们帮助车子 根据规划的路径顺利前行
在这张幻灯片中,
我关注了机器人里软件与AI方面的应用,
当然还有其他重要的工作,比如
开发硬件来保证机器人正常运行,
但是大量的AI感知,运动规划和控制
将聚焦于软件
而不是机器人的硬件,
除了这些主要的应用领域
机器学习也被广泛运用于其它地方
你在这个视频中看到的例子
主要是非结构化数据 比如图像,音频,和文本
机器学习同样地也能够
很好地处理结构化数据
比如图中这些数据表
这在之前的视频中也见到过
但是由于非结构化数据
比如图片,更易于人类理解
这种类型的数据
对任何人来说都很 容易理解和感同身受,
就比如AI系统识别猫这一个例子。
所以大众媒体 倾向于报道人工智能
在非结构化数据的进展
而不是在结构化数据的进展
而且,结构化数据通常是
具体到单个公司的业务领域,
所以大众很难写出 或理解结构化数据
但是AI和机器学习
如今正使用结构化数据创造着
巨大的经济价值
当然AI在非结构化数据 这一块也有着同样影响
我希望这些对于
AI应用领域的调查可以帮助你
明白AI如今已经被成功地应用到
各种各样的数据类型,
也许这会激发你思考
这些应用怎么
对你的项目有所帮助
到目前为止谈论的AI技术当中,
也就是我们之前大部分时间提到的
都属于”监督学习“
即,学习从输入到输出
或者说,根据标签学习从A到B的映射
这需要同时给AI系统A和B的数据
但那并不是唯一被使用的AI技术
实际上,术语”无监督学习“
引出了”什么是无监督学习“这一问题
你也可能从媒体文章和新闻中
对”强化学习“有所耳闻
那这些其它的技术究竟是什么呢?
下一个视频中,
也就是这周最后的可选视频中
我们将对AI技术进行一个调查总结
我希望通过这个视频你能发现
其它的AI和
监督学习的技术,
也许可以对你的项目有所帮助
让我们一起进入本周最后的可选视频内容
10、#Survey of major AI techniques (optional)
现如今有很多AI和机器学习技术
尽管监督式学习(学习从输出A到输出B的映射)
在现今环境下是最有价值的技术,
还有许多其他技术 从经济角度也值得了解。
让我们一起来看看。//业余翻译,小强,QQ :1149847734
在非监督式学习里最著名的是聚类, 下面列举一个相关案例。
假设你正经营一家 卖薯片的杂货店
您收集不同客户的数据, 并跟踪
每个消费者购买 不同类型薯片的数量
以及每包薯片所支付的平均价格。
你既卖低端薯片,也卖高端薯片,
或者说,更昂贵的薯片。
不同的人可能会 买不同数量的薯片,
这对经营杂货店是典型的场景。
使用以上数据,聚类算法
在数据中观察到两种群体
一些顾客倾向于购买 便宜点的薯片
但是会买很多包,
假如杂货店靠近大学校园 ,你可能发现
许多大学生都在买便宜薯片,
但是,他们肯定会买很多。
在数据中也会发现 一个完全不同的购物群体,
他们购买少量薯片, 但是选择价格昂贵的那种。
聚类算法以这样的方式分析数据 ,自动地将数据分成
两个群体,或者更多群体, 它通常用于分析市场分层
算法会帮助你挖掘市场特点, 比如,有一群大学生群体
他们会购买某类型的薯片, 也有一群专业工作人员,
他们购买少量的薯片, 但是更愿意付钱。
这些信息将帮助你 对不同市场进行划分。
聚类被称为非监督式算法,相比
监督学习算法是寻找 A(输入) 到 B(输出) 映射模式,
你必须告诉算法 你需要的输出B是什么,
非监督学习算法并不需要准确地 告诉 AI 系统要什么输出
你只需给 AI 系统提供了一堆数据, 如:客户数据,
并告诉AI在里面找到一些有趣的信息,
有意义的结论
在这个案例里, 聚类算法事先
不知道有大学生和上班族,
相反, 它只是尝试找到不同的市场分层,
而事先不知道市场有哪些分层
非监督学习算法
是输入无标签的数据, 即没有输出标签B,
也可以从数据中找到有趣的结论。
非监督学习算法的应用, 我知道一个非常
有趣的案例是关于声名狼藉 谷歌猫的故事。
在这个项目中, 我让团队使用大量YouTube视频数据
进行非监督式学习,
我们希望算法能告诉我们, 在YouTube视频中找出了什么,
结果,在里面找到最多的是猫,
因为不知为何, YouTube有很多与猫有关的视频。
这是一个了不起的结果, 因为我们没有提前告诉算法
去找猫, 在AI系统中,无监督学习算法,
可以自动发现猫的概念。
仅仅通过分析YouTube视频, 它能告诉你:
我的老天啊,YouTube有超多猫的视频。
很难准确地用可视化方式 展示AI算法的思路
但是,右边的猫概念图是
系统学习到的内容。
尽管监督学习算法是 非常有价值的技术,
但对监督学习算法的批评之一
是它真的需要许多标签数据(输出B
比如说,如果你尝试用 监督学习算法让AI系统
识别出马克杯,那么你需要 1000个,
甚至10000个马克杯的图片。
也就是说,我们需要大量
马克杯图片输入AI系统。
对于已成为父母的人, 我几乎可以确定的是,
这个星球上,不管多么喜欢和关心自己的孩子,
也不会有哪个父母指着10000个马克杯 来教孩子认识什么是马克杯
比起人类小孩, 或者绝大多数动物宝宝,
AI系统需要大量 被标记的数据(标签B)进行学习
这就是为什么AI研究者 对无监督学习抱很大希望,
也许将来AI会更高效, 或者用更像人的方式学习,
采用需要更少的标签数据 的更生物化学习方式。
现在, 我们几乎不知道生物大脑是如何工作的,
所以,为了实现这个愿景
人工智能将有重大突破, 而今天没有人知道将如何实现。
很多人对无监督学习的未来 抱有很大的希望。
话虽如此, 无监督学习 现在是很有价值的。
例如,一些特定领域和自然语言处理领域中
无监督学习帮助提升网络搜索质量,
例子
但现在为止,无监督学习产生的价值
远不如监督学习带来的价值
AI技术的另一个重要领域是迁移学习,
让我举个例子,
假设你买了一辆自动驾驶车,
并训练AI系统来检测车辆,
但你没把新城市的数据部署到这个车上,
而且, 这个新城市有 很多高尔夫球车,
所以你还需要构建 一个高尔夫车检测系统,
也许你的车检测系统 已经使用了大量图片进行训练,
比如说100000张图, 但是在这座新城市里
刚开始开这辆车时, 也许只有少量高尔夫车图片
迁移学习让你从任务A,比如说一般车辆检测,
使用从A中的知识 用以完成另外的任务B,
比如说高尔夫车检测
如果可以从一个车辆检测大数据集(任务A)中
进行迁移学习,你可以 更漂亮的进行高尔夫车辆检测,
尽管你只拥有少量的高尔夫车辆数据
因为算法已经从先前的任务中学习到
车辆, 车轮的样子, 以及车辆是如何移动的。
这些只是对高尔夫球车检测也许很有用。
迁移学习并没有受到很大的关注,
但它是当今人工智能中 非常有价值的技术之一。
例如, 许多计算机视觉系统 都是使用转移学习构建的,
这对他们的表现有很大的影响。
你可能还听说过一种 叫做强化学习的技术。
到底什么是强化学习呢?
让我用另一个例子来说明,
这是一张斯坦福自主飞行直升机的照片,
它装备了GPS、加速度计和指南针,
这使它能自我定位,
假设你要开发软件 让它自己飞起来,
使用监督学习算法 就很难实现这个功能,
因为指定它的最佳飞行方式很难,
当直升机处于某个位置时, 给它指定一个最好的驾驶方式是很难的
强化学习提供了不同的解决方案,
我认为强化学习和训练
宠物狗的行为类似。
我小时候家里养了一只宠物狗,
那么, 如何训练狗呢?
我们先让狗做任何它想做的事,
每当它表现得很好的时候, 我们就会表扬它,称它好狗崽,
每当它做坏事的时候, 叫它坏狗崽
这样它就逐渐学会了好的行为,
而害怕表现不好。
强化学习采用同样的原则,
用于直升机或其他事情。
所以, 我们会让直升机在模拟器里飞来飞去,
它可以在不伤害任何人的情况下坠毁。
但我们会让 AI 飞行直升机,
如果某次它能驾驶的很好, 我们就‘奖励它‘,
当它坠毁了,就‘惩罚它’。
AI的职责就是学着如何驾驶直升机
让飞机获得更多的奖励,更少的惩罚。
更正式地说, 强化学习算法使用奖励信号,
来教会AI该做什么,不该做什么。
这意味着, 每当它做得很好,
就给它一个正数权重作为奖励。
每当它做得很糟糕的时候,
就给它一个负数权重作为惩罚。
AI 的职责就是自动学习一个行为
以最大限度地提高奖励。
所以, 好狗崽是就是给一个正面权重,
坏狗狗,或者 ‘坏直升机’ 就意味着给与负面权重
从大量的正负面反馈中,
AI 将学会更多的行为。
给你们看看经过训练之后, 斯坦福自主飞行直升机的飞行视频。
直升机在强化学习算法控制下飞行。
当天我是摄像师,
当缩小焦距后,你会看到树木向天空伸展,
这里, 我们给了它一个奖励信号,
奖励直升机颠倒地飞行。
使用强化学习,
我们研发了世界上最棒的 自主飞行直升机,
除了自动机器人, 加强学习
在玩游戏, 或者黑白棋、跳棋、 国际象棋、围棋方面也应用很多。
你也许听说过AlphaGo,
通过强化学习它非常擅长玩围棋。
强化学习竞技游戏方面也非常厉害。
是强化学习的缺点之一
是它需要大量数据
例如玩电子游戏, 强化学习算法可以玩
无限量的电子游戏。
因为它只是一台玩计算机游戏的计算机,
它可以获取大量数据来获得更好的效果。
像玩跳棋,或者其他游戏一样。
它可以自由的与自己对弈,
来获得更多的数据进行强化学习。
在自主飞行直升机训练时, 有直升机的模拟器, 所以
它可以长时间进行飞行模拟,
来找出最合适的飞行模式
关于强化学习,有很多让人兴奋的研究方向,
尽管有时没有精准的模拟器,
来获取到大量的数据。
尽管媒体聚焦关注在强化学习上, 但
到如今, 它创造的经济价值明显低于监督学习。
但未来可能会有突破, 改变这种状况。
AI 发展如此迅速, 我们当然希望
各个领域都将出现突破。
生成对抗网络 -- 另一种令人兴奋的AI技术--
它是我的学生伊恩·古德费罗创造的,
生成对抗网络非常擅长于 在什么都没有的情况下合成全新的图像
让我给你们展示一个 由 NVIDIA 团队制作的视频,
这些是使用生成对抗神经合成的明星脸。
这些人从未在世界上真正存在过,
但通过从名人图像数据库进行学习之后,
这个算法能够合成全新的图片。
现在娱乐产业对于生成对抗神经网络
的应用非常感兴趣。
从计算机图形,到电脑游戏,到多媒体,
一切都可以无中生有,制造出新内容。
最后,知识图谱是另一个重要的
AI技术,我认为它常常被低估。
如果你在谷歌上搜索莱昂纳多·达·芬奇, 你可能会发现
右图所示的关于达芬奇的信息。
如果你搜索艾达·洛夫(Ada Lovelace)
你也会发现一个类似右边的信息,
这些信息是从知识图中产生的, 这基本上意味着
列出这些人和与其有关的关键信息
比如他们的生日,逝世日期,简历
,和个人其他属性。
如今, 不同的公司已经建立了 许多类型的知识图谱,
不仅只是与人有关。
他们同样建立电影、名人、
酒店、机场、风景区等方面的知识图谱。
例如,酒店的知识图谱可能有
包含大量其关键信息的数据库
所以, 如果在地图上查找它们,
你可以轻松找到准确信息。
"知识图谱" 一词最初是由谷歌推广的, 但
这概念已传播到许多其他公司。
有趣的是, 即使知识图谱为大型企业
创造了大量的经济价值,
它是学术界研究相对较少的一个课题。
与知识图谱相关的论文数量,
对比它所产生的实际经济价值 是非常不对称的。
也许你所处的行业来说,
构建知识图谱的技术, 对贵公司
建立数据库也有很大关系。
这个视频里你学习到非监督学习,迁移学习,
强化学习,生成对抗神经网络, 知识图谱。
看起来内容很多,不是么?
我希望这有些想法对你项目有用,
知道这些算法,也将让你
和AI工程师进行更有成果的讨论。
这周我们讨论 关于AI如何影响公司的知识。
你能用AI如何影响公司。
AI 也对社会产生了巨大的影响。
那么, 我们如何理解人工智能对社会的影响,
以及确保我们不做违反道德的事情?
而我们使用 AI 只是为了帮助人们, 让人们生活得更好?
下周我们将讨论 AI 和社会。
谢谢你一直陪着我到现在,
我期待着在本课程的最后一周看到你们。
1 个练习
Week 3 Quiz30分钟
Week4
AI and Society
8 个视频 (总计 50 分钟)
显示更少
8 个视频
A realistic view of AI7分钟
Discrimination / Bias9分钟
Adversarial attacks on AI7分钟
Adverse uses of AI4分钟
AI and developing economies7分钟
AI and jobs7分钟
Conclusion3分钟
- #Introduction
欢迎回来,这是最后一周-第四周
的课程,我们即将进入尾声。
AI是一种超能力,
它能让一个小团队影响众多人生活
所以,不管你是AI的开发人员
还是用户
或只是关心AI的社会影响
了解AI的发展趋势都很重要
这样可以确保你的贡献
能够使社会变得更好
让我们看看,AI确实正在改变世界
但现在还存在过度的炒作
为了让普通民众、商业领袖
和政府领导导航AI的上升
对于AI的前景有一个客观现实
的理解是相当重要的
在week 1中,你已经学到了
一些AI技术的局限,
AI也有一些其他的问题
例如,AI可能对少数群体
或其他团体,
存在着不公平的歧视
那么, 我们如何去解决这个问题呢?
同样,AI技术也十分容易受到 对抗攻击(Adversarial attacks)的影响
例如,我们很喜欢的垃圾邮件过滤器,
因为它使电子邮件系统能正常工作
但也有些垃圾邮件发送者
正尝试去攻击这些过滤器
即便我们继续开发新的AI技术
其中一些新技术将很可能
受到一些新型攻击
的影响
如果某些人故意去愚弄这些AI,
一些发达经济体,例如美国和中国
已经很广泛地应用了AI技术
但对于发展经济体以及 全球各地的就业而言
AI的发展还将会带来 巨大的影响
这些问题中的许多问题是 与人工智能和道德有牵连的。
所以要保证我们用人工智能 所做的工作都是合乎道德的
这是一个复杂的,
没有简单答案的话题。
我认为人工智能及伦理的话题
值得单独的四周或者更长的课程。
但我希望本周可以 讲到一些主要问题,
在你开发或使用人工智能时,
你能明白与人工智能兴起
相关的一些主要问题
最后,在课程结束前
我们将对整个课程做一个回顾
我期待你们
能够学习最后几个视频
让我们开始更详细地
讨论关于人工智能的现实看法
这些讨论不仅仅只是关于
人工智能的技术和性能的局限性
我们下节课见
- #A realistic view of AI
AI 对人类社会和人们的生活
都会产生巨大的影响。
所以,要做出好的决策
我们需要对 AI 有一个客观的认识
不能过于乐观,也不能太悲观。
如果你有听说过
金发姑娘和三只熊的故事
你就会知道
故事里提到的粥
既不能太热,也不能太冷
故事里的床
既不能太硬,也不能太软
AI 也需要类似的 “金发姑娘原则”
因为我认为
对于AI 技术能够做的事我们不能太乐观
我们的考量不能太乐观,
也不能太悲观。
比如说,
我们对AI技术太乐观
而且不顾实际的话,
可能会让人觉得AI是
感知智能和超人工智能
或强人工智能时代即将到来,
并因此认为我们要投入大量的资源
来抵御可怕的AI杀人机器
我觉得以做学术研究的
角度来看,研究遥远未来的可能性
并没有什么害处,
比如研究AI如果哪一天 实现感知智能后的状况
关于这个来做些研究
没有什么害处,
但我们也不能过度投入资源
来抵御一些中长期内 都不会出现的风险
可能几十年、几百年都不会出现
我觉得没有必要去恐惧
感知、超级人工智能
或强人工智能
这些不必要的恐惧让我们分心
不去关注一些真正的问题
也引起了社会对AI的不必要恐惧。
反过来说,
我们也不能对AI太过悲观
对AI的极端消极看法
认为AI什么都做不了
有些事情AI不可能完成
所以AI的冬眠期将要到来
AI冬眠期是指
在AI发展的历史中 陆续有几段时期
AI被过度炒作,
而当人们发现
AI不能做到一切
人们就对AI丧失信心
并减少对AI的投资
如今的AI技术
与几十年前冬眠期不同的是
AI创造了巨大的经济价值
我们可以很清楚地预知
它将继续在多个行业
创造更多价值
所以结合以上两点我们确定
人工智能将在 可预见的未来继续增长
即使我们已经知道了
AI并不能做所有的事情
与其过于乐观或悲观
金发姑娘的故事告诉我们
介于两者之间的事情是对的
我们现在意识到的是
AI不能做所有的事情
尽管很多事情无法做到
但它将改变行业和社会
当你和朋友谈论AI的时候
我希望你也告诉他们
这个AI的金发女孩规则
这样他们也可以对人工智能 有一个更现实的看法
人工智能有很多局限性
在之前的学习中 我们已经见到了
其性能限制
例如给定少量数据
仅依靠AI可能无法完全
自动化呼叫中心并
对客户发送来的所有邮件
做出非常灵活的响应
AI也有其他方面的限制,
其中之一是难以进行解释
许多高性能的AI系统 都是黑盒模型
这意味着它工作得很好
但AI不能够
解释为什么能如此有效, 或为什么会产生这样的结果
假设人工智能系统
通过这张 X 光图像
来诊断病人的状态
在这个例子中
AI系统认为
病人有右侧气胸
这意味着他们的右肺塌陷了
我们怎么知道系统诊断是否正确?
又怎么知道是否应该相信它
做出了正确的判断?
到如今有许多的研究
试图让AI系统具有更好的解释性
在这个例子中,热图是AI
表明它用了图像中的哪个部分
来产生这个诊断的结果
由于图中很明显可看出
诊断是基于右侧的肺部产生的
而且是右肺的一些关键特征
这个图片让我们对
AI做出了合理的诊断更有信心
事实上
人类也并不是很擅长
解释我做出某些诊断的原因
比如这个咖啡杯
它在上周的视频中已经出现过
那你又是怎么知道 它是一个咖啡杯的呢
人类是如何观察
并认为这是一个咖啡杯的呢?
你可能会说这像一个
盛水的容器,而且有一个把手,
但我们人类并不擅长与解释
我们是如何看待并定义一件事物的
由于人工智能是一个相对较新的事物
缺乏可解释性
有时使它难以被大家接受
另外,如果有的时候
AI系统效果不好,
它如果能够被解读的话, 则可以帮助我们
弄清楚如何让AI系统更好地工作
因此可解释性是
一大主流研究领域
研究者在其中做了许多的工作
根据我在实践中看到的
当AI团队想要部署AI模型的时候,
他们必须首先
能够解释
为什么这个模型足够好,
使得它部署后会奏效
因此可解释性研究很困难
但也不是一定不可能实现,
但我们确实需要更好的工具
来帮助AI系统解释其中的原理
AI还有其他一些严重的限制
作为人类社会,我们不希望
基于性别,
或是基于种族,去歧视一个人
而是希望人们得到公平对待
但当给AI系统输入的数据
不能反映这些价值时,
AI就会产生偏见
或者学会歧视某些人
AI社区正在努力
想要在这方面的问题上取得进步
但路途还十分遥远
还有大量的工作要去做
你已经了解了
AI存在的偏见
以及如何让AI系统
变得不那么有偏见性
最后我想说的是,一些AI系统正
做出重要的经济决策,
一些AI系统将暴露在对抗性攻击下
就是说,某个人故意要
愚弄你的AI系统
因此,根据你的应用
一件很重要的事情是确保
你的AI系统没有 暴露于这种攻击之下
对AI的偏见和歧视的讨论,
以及对AI的对抗性攻击的讨论
对你我而言都很重要,因为
我们是AI社会潜在的 开发者和用户
下一个视频中,
让我们对AI的偏见进一步的探讨
- #Discrimination / Bias
人工智能系统如何产生偏见
导致对一些人的歧视呢?
我们又该如何减少
或者消除这种影响呢
让我们从一个例子开始
微软的一个研究小组 有这样一个发现
当人工智能从互联网上的 文本内容中学习时
它可以学习到刻板印象,
值得赞扬的是, 研究小组还提出了
减少这类人工智能系统偏见 的技术解决方案
他们发现
人工智能通过阅读互联网上的文本
可以学习单词
并且你可以让它进行推理类比
比如现在你问它
根据在互联网上阅读的文本,
男人与女人的对应关系, 相当于父亲和谁的对应关系?
人工智能系统会回答母亲
这反映了互联网中
单词的常用方式
问同样的系统
男人对女人
就像国王对什么
它会回答王后
同样,基于互联网中
单词的常用方式 这个答案是说得通的
但研究人员发现
如果你问它
男人对程序员就像女人对什么
输出的答案是:
女人对家庭主妇
我认为得出这种答案 是很不幸的
含有较低偏见的答案应该是
女人对程序员
如果我们想让人工智能理解
男人和女人都能是程序员
就和男人和女人 都能是主夫/主妇一样
那我们就需要让它
输出男人对程序员的结果是
就像女人对程序员,或者
男人对家庭主夫, 女人对也家庭主妇
那人工智能的
这种偏见是如何产生的?
让我们从技术层面探讨一下
人工智能系统存储单词的方式
是使用一组数字
比如说储存男人这个单词
或用数字组(1,1)来代表这个词,
人工智能通过统计互联网上
男人这个单词的用法
得出的这组数字
计算这些数字的
具体的计算过程非常复杂
这里就不细讲了
但这些数字坐标
代表了这些词的典型用法
实践中,人工智能可能会
数以百计或数千种 数字来存储一个单词,
但此处我仅用两个数
来简化表示这个例子
我们取一个数并在图表中标出它
因此“man”(男人)这个词
可以放在右侧图中坐标为1,1处
通过统计“Computer Programmer”
即程序员这个短语
在整个互联网中被使用的频率
AI会得到一对不同的数字
比如使用(3,2)来存储
或者表示“Computer Programmer”
类似地,通过词语“woman”(女人)的使用
又一次得到不同的数字对
比如使用(2,3)来表示“woman”这个词
当你使用类比来询问计算机
“man”对应于“computer”
那么“woman”对应于什么?
接下来AI系统要做的事情
就是构造像这样的平行四边形
接着询问对应于坐标(4,4)
应该是哪一个词语
因为它会认为这个点 就是这个类比的答案
数学化地理解这个过程是,
AI从是这样思考的,
“man”到“computer programmer”之间的关系
就是从“man”对应的坐标
先向右走两步,再向上走一步
因此以同样的方式 可以找到与“woman”的类比词
即先向右走两步
再向上走一步
不幸地是
当这些数字是从
互联网上的文字得出的话,
人工智能系统学习到
家庭主妇在互联网上的用法
就被定位到了(4,4)这个坐标
这就导致了人工智能产生
具有偏见的类比情况
如今的AI系统执行了许多关键决策
在将来也会继续这样做
偏见问题值得重视
比如有一家公司
使用人工智能招聘员工,
结果却发现他们的招聘系统
明显歧视女性
这显然不公平
于是这个公司就停用了 他们的人工智能招聘工具
又比如,还有一些
人脸识别系统
对浅肤色的人的特征辨别
比对深肤色的人更加准确
如果人工智能系统针对
浅肤色的数据进行训练
则在这一类人中
表现的更加准确
比如在刑侦调查领域
这就可能对深肤色的人
造成极大的偏见与不公
因此许多人脸识别团队现今都在
努力探索以确保系统
不展现这样的偏见
人工智能在进行
贷款审批时
也有可能
歧视少数民族
开出了更高的利息
银行需要努力探索以确保
减少或者消除他们审批 系统里的这种偏见
最后,我认为很重要的一点是人工智能系统
不应该加剧过去存在的
刻板与错误印象 带来的有害作用
比方说,一个八岁的女孩
上图像搜索引擎上
搜索首席执行官
如果她看到的只是男人的图片或者
看不到一张和她一样种族 或者性别的人的图片
我们不希望当她
有一天想从事一种职业并
成为一个大公司的首席执行官
的梦想就此被挫伤
人工智能社区正投入大量的
精力解决这些问题
对抗偏见
我们逐渐有
越来越好的技术解决方法
来减少人工智能系统中的偏见
在这个视频开始,
你已经见到AI产生 带有偏见的类比
简单地说,
研究人员发现 当人工智能系统
从大量不同的数字学习,
并用来存储单词时,
其中有一些数字 跟这些偏见有关联
如果零初始化它们,
即将它们设置为零,
产生的偏见将显著减少。
第二个解决方案是尽量使用
存在较少偏差和(或)更具包容性的数据
如果你正在
建立一个人脸识别系统
并确保包含来自多个种族、
所有性别的数据,那么
你的系统将会有更少的偏见,更具包容性
其次,许多人工智能团队
要求系统有良好透明度
和审计流程
从而可以随时
检查存在何种类型的偏见
如果发现AI系统中有偏见,
至少我们能够
及时发现,并且采取一定
的措施来纠正它
举例来说,许多的人脸识别团队
会系统地检查
它们系统的数据
是否对深肤色和
浅肤色的人种
有较准确的代表。
举一个例子。
一个透明性的
并带有审计的系统
能够提升快速发现问题的几率
就像刚提到的例子一样,因此我们便能解决它
最后,根据我的经验
拥有多元员工背景的团队 也有助于减少偏见
如果你有一个多样化的劳动力
那么其中的个人
更有可能发现不同的问题
也许他们首先会帮助你的数据
更多样化,更具包容性
通过在构建人工智能系统时
拥有更多独特的视角
这将帮助所有人开发
具备更少偏见的应用程序
AI系统如今正 做着许多重要决策
因此偏见或潜在的偏见
是我们必须花功夫避免的
值得乐观的是
我们实际上有着许多更好的方法
减少AI的偏见
这比减少人类自身的偏见要简单
但我们不能就此满足
认为AI所有的偏见都消失了
我们需要做的事情还有很多
对此我也保持乐观态度
如果我们能够让AI
和人类有类似的水平,
因为它们从人类身上学习
然后降低其中的偏差,
不论是通过技术, 还是非技术的方法
从社会的角度看,
我们很有希望把那些
不论是通过人类或 使用AI做出的决策
变得偏见更少,但更加的公平
除了偏见以外
AI还存在着另一个问题
那就是对抗性的攻击
下一个视频中,
你将了解什么是对抗性攻击
并且能针对性地
去防御它们
我们下一节再见
- #Adversarial attacks on AI
尽管现代AI非常强大,
但也有一定的局限性,
特别在深度学习领域,
有时它可以被愚弄。
现代人工智能系统
有时容易受到对抗性攻击
如果在有人故意
愚弄你的AI系统的时候
让我们来看看,假设你给了AI系统一张
鸟的图片,并要它对这只鸟分类识别
系统输出这是一只蜂鸟。
但是, 让我们对这个图像做一个小的改动。
这个小改变是指图片像素
就改变很小,小到
人眼无法分辨的改动
这同一个AI系统这时会认为这是一个锤子
现在,你可能会说
"这怎么可能,
左图跟右图
看起来完全一样
事实上,这些变化
是人眼无法察觉的
但是,AI系统看世界是
有别于你我的,而且差距非常大
因此,极大的可能是,
如果对手对于图片
做了令人
无法察觉的改动
但它会愚弄AI
让其认为这两张图 是完全不一样的
这被称之为对AI智能系统的对抗性攻击
在计算机安全学中, 对安全性的攻击
意味着让系统规避
做它应该做的事情
同样地,一种针对AI系统的对抗攻击是
试图让它做一些
它本来不打算做的事情
比如说试图愚弄它
去输出不正确的分类
来看另一个例子
这里是一张野兔的图
经过一点细微的变动,即
像素上一点微小的改动
AI就会认为这是一个桌子
事实上,计算机看待
图片的方式和人类很不同
这给了计算机优势和劣势
比如,计算机系统
比你和我都擅长
读取条形码和二维码
但是深度学习系统运作的方式
也使得它受到
这些特别的,
没有人类会被愚弄的攻击
今天, AI被用于过滤垃圾信息
尝试去过滤仇恨言论
而这种攻击将会减小
这一类过滤机制的有效性
像幻灯片上的这类攻击
需要攻击方有直接 修改图片的能力
举个例子,垃圾邮件制作者 在他们尝试上传它到
网站,或是在一个邮件里发送它之前
也许会直接修改一张图片
有一些攻击的运作方式是通过
改变物理世界
比如,在卡耐基梅隆的一个小组
设计出一副像这样的时髦的眼镜
所以,当一个人戴着这幅眼镜的时候,
他可以愚弄一个AI系统让它
认为这是女演员米拉·乔沃维奇
我认为这太不可思议了,
仅仅戴一副这样的眼镜
就可以愚弄一个AI系统,让它认为
这个男人是一个著名的女演员
另一组不同的研究员 (来自加州大学伯克利分校,
密歇根大学和其它的大学)
发现如果你把一些
像这样的贴纸 贴在停车标志上
你可以愚弄一个AI系统
让它完全忽略掉这样的标志
相反,它会认为这是别的什么东西
但不是一个停车标志
这个例子有趣的一点是 它看起来完全
像一个停车标志, 唯一只是有
一些涂鸦贴在它的上面
大多数的人类 仍然能够容易地认出
这是一个停车标志
但是如果你有一个 计算机视觉系统
比如说,一个自动驾驶系统
它将导致十分不幸的如果,
就因为这些贴在上面的贴纸,
这辆车不能够认出 这个停车标志
给你看最后一个例子, 这是一个
来自于谷歌的一组研究员的研究,
如果你给一个AI系统看这张图片
它会说这是一个香蕉
但是这些研究员 设计了一个贴纸
如果把贴纸放在这个香蕉图里,
它会对错误分类这个香蕉,
让我给你看一个这些研究者做的视频
左边显示的是
分类器的输入,
右边显示的是输出
这里,分类器认为 这很有可能是一根香蕉,
然后在很小概率下, 可能是一个子弹。
这结果看起来还行。我们来看下
当放一个贴片图会如何。
当把一个贴片图放在图中时,
AI系统几乎肯定
这是一张烤面包片机的照片。
这个成果有趣的一点是,
这篇研究的作者们
(参见幻灯片底部的引用)
在他们的论文上
加了这张贴纸的图片,
因此,任何人都可以
下载他们的论文,
打印出附上的贴片图,
放在任何他们想误导
AI系统的地方,
这样,AI会认为这是一个烤面包片机。
郑重说明,我不支持任何人攻击
AI系统,比如用贴片图来误导它们
让AI认为这是一个烤面包片机,
但不幸的是,这个实验研究说明
任何人都可以轻松地攻击这些AI系统
那我们可以做些什么来防御
这些对抗性攻击呢?
幸运的是,AI世界一直以来在努力研究
新技术使它们更难被攻击。
防御系统往往技术含量比较高,
但有一些方法可以 修改神经网络和
其它AI系统,使他们更难被攻击。
但这种防护功能会让 AI系统付出一定的‘代价’,
比如,AI系统的运行速度也许会变慢一些。
不过,这是一个
正在被研究的领域, 我们还有很长的路要走。
我们距离拥有一个好到足以防护
所有AI应用程序的
防御系统还有很远的距离,
对于很多AI系统,
大多人并没有进行攻击的动机。
比如,如果你运行
一个自动的视觉检查系统
用于检查你工厂的咖啡杯是否有刮痕
也许不会有很多人
有动机去尝试
误导你的AI系统,导致它错误认为
一个有刮痕的咖啡杯并没有刮痕。
但是有一些
AI程序确实会受到攻击。
对这些程序,类似于垃圾邮件
和反垃圾邮件,
垃圾邮件制作者试图发送垃圾邮件
垃圾邮件过滤器试图阻止它们
我认为有一些应用
将参加一场类似军备竞赛的情况,
AI团队构建防御系统的同时
攻击AI系统的群体也在 试图愚弄我们的防御系统
在我搭建AI系统的经历中
其中有一次经历让我觉得
我在和他人的进行一场全面的战争,
这个经历是当我领导
反欺诈组对抗其它力量
不幸的是,有很多
互联网欺诈的现象,
人们试图窃取
金钱和支付系统 或者制造虚假账户
我在反欺诈系统工作的时光是
为数不多的真的 让我觉得是一场零博弈,
即,有一个对手我们对其做防御,
然后他们做出反应。
他们会发送一个攻击, 我的团队必须回击。
有的时候甚至花费数小时去防御我们自己
所以,我认为接下来的几年,
即使随着AI技术的进化,
会有这样的垂直市场,比如垃圾邮件,
比如团队将会在欺诈中交战。
陷入像是跟对手的零博弈中。
尽管如此,我也不希望过度炒作
对抗性AI系统的潜在危害。
它对某些应用来说真的很重要。
但是也有许多的AI应用
不太可能受到对抗攻击的影响。
现在,除了对抗攻击,
不幸的是,AI也可以被用于
某些不利的或者负面的用例。
让我们在下一个视频中看看其中一些用例
也看看我们应该做些什么去解决它们
我们下一节再见
- #Adverse uses of AI
人工智非常强大
很多人在利用人工智能
改善公司,国家和社会
但是人工智能也会被不良地应用
我们来看看一些例子
并讨论该如何解决问题
AI 技术已被用来创造 DeepFakes (深度学习视频篡改技术)
这意味着可以合成虚假视频
里面的内容是人们从来 没有实际做过的行为
网站 buzzfeed, 创建了一个视频
展示美国前总统巴拉克·奥巴马
说一些他从来没有实际说过的话。
buzzfeed 是透明的
当他们发布视频时
这是很明显的, 因为它告诉
每个人这是一个假的视频。
但是, 如果这种类型的技术被用来针对
一个人, 让别人认为
他们说过或做过一些 他们从未实际做过的事情,
那么这些人可能会受到伤害, 他们必须保留
证据来反驳证明视频中是
他们从未真正做过的事情。
类似于垃圾邮件与反垃圾邮件的战争,
目前已可以使用 AI 技术来
检测视频是否为使用 DeepFake 制作。
但在当今社交媒体的世界里
一个谣言传播到世界各个角落
的速度比真相能赶上的要快
人们非常担心
DeepFake 是否会伤害到某个人。
还有一些使用 AI 技术的风险
如破坏民主和隐私
世界上许多政府 在历史的某个阶段
试图改善他们公民的生活
我尊重这些政府领导人
想要提升公民生活的愿望
但也存在一些压制人民的政权,
正对他们的公民做错误的事
从而可能寻求使用 AI 技术
对他们的公民进行压迫性监视。
虽然政府有合法的理由来
改善公共安全和减少犯罪,
也有一些对 AI 的使用, 只会使
公民更受压迫而不是生活得到提升。
与此紧密相关的是
人工智能可以产生的 虚假评论的兴起。
目前已可以使用 AI 技术来
生成虚假的评论。
无论是商业方面
对产品的虚假评论,
或者是政治讨论中
关于政治问题的虚假评论
在公民言论中,
虚假评论有时会
比真人类写的评论更有效,
所以, 侦查出这样的虚假评论, 并清除他们,
是一项重要的技术,用以维护
我们在网络中的相互信任。
类似于垃圾邮件与 反垃圾邮件之间的战争,
或者欺诈与反欺诈,
我认为对于所有这些问题,
可能会有一场比赛,
比赛双方会僵持相当长的一段时间,
还是类似于垃圾邮件 与反垃圾邮件的战争,
欺诈与反欺诈,
我还是乐观地认为 最终正义将会胜利。
因为如果你以垃圾邮件过滤器为例,
有越来越多的人
有动力确保垃圾邮件过滤器的正常工作,
反垃圾邮件的措施就这样诞生了。
然后会有越来越少的 垃圾邮件发送者试图
将此垃圾邮件进入您的收件箱。
正因为如此, 有更多的资源
会投入进反垃圾邮件的一面, 而不是垃圾邮件的一侧。
因为如果反垃圾邮件 和反欺诈功能好的话,
会使整个社会运作得更好
正因为如此, 即使
AI 社区仍然有很多
与这些不良使用的例子 进行斗争的工作,
因为如果我们能把 人工智能得当使用,
社会确实会变得更好,
我乐观地认为, 资源的平衡
这意味着善意的一面将占上风,
但这意味这在未来的许多年里,
AI社区仍然需要进行大量的工作
接下来, AI 还
对发展中经济体有重大影响
我们就在下一个视频中看看它是怎么工作的吧
- #AI and developing economies
往往在重大技术的颠覆时期
比如AI时代,
能给人类重新塑造世界的机会。
AI是一项非常先进的技术,
不仅仅影响发达国家
也会影响发展中国家。
那么, 我们如何能确保
所有国家都能从人工智能创造
的巨大财富中获益?让我们来看下,
现存已有一个可预期的路线图,
跟一个梯子一样,
很多发展中国家已经成功执行这一套路线图
主要是为了帮助
提高人民的科学技术能力
以及获得更多的财富。
所有的国家都开始于
低端的农业生产
比如出口粮食,之后就转向
低端纺织业制造,
比如服装制造。
随着人均GDP的提高,
生活方式的健康化,
国家的生产会转向低端零件制造业
比如成本较低的塑料配件
之后会向低端电子制造业转型,
接着再是高端电子制造业
可能是汽车产业诸如此类的。
这样一个爬梯步骤,
是众多发展中国家
希望国民获得的能力
从而进入发达国家行列。
AI可能会引发的一个问题是
部分比较低的台阶,
通过AI的手段,极大程度上能实现自动化,
例如,当工厂变得更加的自动化,
或者农业的自动化,
可能需求会减少,因此
对于这些发展中国家的
人来说,
工作机会会减少。
而这些国家想从梯子底部的产业
类型开始进行工业化的攀登。
因此,如果我们想淘汰一些
梯子底部的产业,
通过AI提供这些层级上的自动化能力,
那么我们有义务去
让AI 创建类似蹦床的机制
发展中国家能通过这个蹦床机制
的弹跳能力,
可以更快地
到达梯子的更高部分。
随着早期的技术浪潮,
很多经济体展现了,他们能
从发达国家跳到
更高科技的经济体。
比如,
在美国,大部分人都有固定电话,
以前通过电线连接的通信设备。
因为大部分人是有固定电话,
所以从固话转移到移动电话的时候
我们花了不少时间。
相比之下,许多发展中国家,
包括印度和中国,
不需要费心去铺设电话线
可以直接跳到移动手机。
因此,这是技术跨越的一个点
发展中国家可以直接跳过
早期的技术迭代,
不需要考虑
在每一户人家
铺设那么多物理电缆,
而是直接跳到手机。
我们也看到了类似的技术跨越
发生在移动支付上。很多发达国家
有成熟的信用卡体系
这也放缓
了他们转向
手机支付的进程,
跟部分发展中国家对比,
他们没有那么根深蒂固的信用卡产业。
我也看到了发展中国家
在线教育的迅速规模化。
在那些还没来得及
铺设国家所需线下学校和
大学的地方,
很多教育界的领导和政府
在更迅速地拥抱
在线教育,
相比已经有
完备的教育基础设施
的发达国家。
在发达国家积极响应
这些高新科技的同时,
发展中国家所拥有的优势是
他们没有根深蒂固的体系。
也许在某些领域,
他们可以走的更快。
现阶段,美国和中国处于领先地位,
英国和加拿大,以及其他几个国家
也有充满活力的 AI 社区。
但整个社区依旧不成熟
我觉得人工智社区还不成熟
这意味着尽管人工智能正在
创造巨大的经济价值
但大部分要创造的价值
在未来仍将消失
这给了每个国家 成为
一个重要角色的机会,
在这个价值还没被创造出来之前。
或者能够吃下其中的一块蛋糕。
所以, 我希望每个国家 可以找出如何
有效地利用 AI 来 鼓舞他的人民。
我对发展中经济体的建议是专注于人工智能
以增强一个国家的垂直产业
例如,当今大多数国家
不应该试图建立自己的网络搜索引擎
因为经过四十年的竞争
已经有很棒的网络搜索引擎了
相反,如果一个国家有一个
非常强大的垂直产业
比如咖啡豆制造
那么这个国家实际上是
唯一有资格从事人工智能
咖啡制造工作的国家
而建设人工智能
将进一步加强这个国家擅长的领域
所以, 与其 每个国家跟
美国和中国在通用的AI应用层面竞争
我会建议 大多数国家使用人工智能
去强化这个国家擅长的领域
和国家 想在未来做的事
另外要注意,公私合作
即政府和企业共同努力
能够真正帮助加速
垂直行业的人工智能发展
在高度监管的行业
从医疗保健到
无人驾驶汽车等交通运输行业,再到金融业
有一些我们想要的结果
也有一些我们不想要的结果
考虑制定衍生法规
以保护公民
同时使这些行业能够采用
人工智能解决方案的政府
将在本国看到更快的
地方经济增长和技术发展
最后,发展中经济体应该投资教育
因为人工智能还很不成熟
每个国家都有足够的空间去
学习更多关于人工智能的知识
甚至可能建立自己的人工智能劳动力
并以一种重要的方式
参与到人工智能驱动的世界中来
在技术颠覆的时刻来临时
领导力变得至关重要
我们曾经相信政府
能把人送上月球。
随着人工智能的兴起 它创造了一个空间
在一些国家 对AI领导力的需求,
不管是在政府,还是企业
或者教育层面,都需要帮助一个国家
进入AI 时代, 拥抱和
采用 AI技术来提高 提升其整体的科技化进程,
甚至可以继续
帮助 全世界范围的人。
在此视频中, 我们已经 简短地讨论了
人工智能和工作的问题。
这是个很重要的话题 且广泛
在许多 国家讨论着。
让我们继续下一个视频,
对人工智能和工作这个话题, 做一个更深入的观察。
- #AI and jobs
AI是自动化的进阶版,
在现代人工智能兴起之前,
自动化已经
对很多工作产生了巨大的影响
随着人工智能的兴起,
我们可以自动化的东西
比以前突然多了很多,
因此这也加快了对
各行各业工作的影响
将有多少工作岗位被取代?
将有多少个新职位会产生?
我认为还没有人能对这些
问题有一个确定的答案,
但让我们看看一些研究报告,
试图了解未来可能会是怎样
麦肯锡全球研究院,
做了一项研究,他们估计,
到2030年人工智能自动化
将取代4亿至8亿个工作岗位。
这是一个非常大的数字
另一方面,
这份报告也估计
AI创造的工作岗位数量可能更大。
除了麦肯锡全球研究所之外,
还有许多其他研究,
这些都是关于对会被取代的
工作岗位和新出现的岗位 的数量估计。
例如,就只看看美国,
这张幻灯片的数字是全球性的,
但若只关注美国,
普华永道估计到2030年将有 大约1600万个工作岗位被取代,
英格兰银行估计
到2035年将有8000万个 工作岗位被取代,
所以没有人可以准确地预测
2030年会发生什么,
但可以感觉到的是,
这对全球就业的影响将是巨大的。
我希望你和我一样 觉得这些是令人鼓舞的预计,
因为AI正在创造许多工作,
即便它正在取代一些工作。
我认为未来的许多工作,
虽然我们也许还不知道它们的名称,
这可能是无人机流量优化器工程师,
也可能是3D打印服装设计师, 也可能是医疗保健,
我们可能会有基于DNA 来定制个人化药物的设计师。
因此,尽管人们担心 人工智能取代工作岗位,
但也有许多新工作的希望,
未来可能会创造更多的新工作岗位。
现在你可能想知道,
我们如何估计
有多少工作可能被取代?
开展这些研究的
其中一种典型方式是
看一个工作, 然后思考哪些任务构成了这个工作。
例如,你可能会
查看放射科医师的任务
或查看出租车司机 所做的所有任务。
然后对于每项任务,
估计通过AI实现自动化的程度
如果一个工作主要包含
高度自动化的任务,
那么工作流失的风险将更高。
大多数人工智能工程师发现
将AI应用于任务 而不是人们的工作更有用。
但是这个框架允许
我们使用AI的能力来自动化任务
以估计可能有多少工作
被取代。
哪些是最有可能
或最不可能通过人工智能 和自动化取代的工作?
经济合作与发展组织是一个 备受尊重的政府间机构,
这个图估算哪些类型的工作
最可能或最不可能被自动化。
未来很难准确预测,
但也许并不令人惊奇的是,
许多包含
日常重复性任务的工作种类
将会更容易被自动化,
而许多重复性较低,
常规较少或涉及
与人们进行更多社交互动的任务
可能不易受自动化影响。
我们如何帮助公民和国家
应对人工智能对就业的影响?
这些是一些解决方案,
一,条件性基本收入保障。
你可能听说过普遍基本收入保障,
政府会向公民无条件发放一定的收入,
我认为人们应该有一个安全网,
对于失业了,但能够自主学习
的个人,
我认为更有效的版本可能是
有条件的基本收入,
这个机制提供安全保障, 但同时鼓励人们继续
学习并投资于自己的发展,
通过提供一个机制来
帮助那些可以自主学习的人,
这将增加这些人
重新进入劳动力,并且
为自己,为家庭,和社会 作出贡献的可能性
以及为纳税人作出贡献。
第二,建立一个提倡不断学习的社会,
由于你现在正在学习这门课程,
你可能已经成为
这个终身学习社会的一部分,
旧的教育模式是
你上四年大学,
然后在剩下的40年‘平行移动’ (不用学习新东西)
这将不再适用于
这个快速变化的世界。
通过政府,公司和个人
我们逐渐意识到 所有人都需要继续学习,
这将提高每个人都能
获得更好地位的可能性,
即便工作可能会被取代。
因此,也要学会利用新产生的工作。
在未来,即使在完成大学学业之后,
我认为大多数人应该
在一生中继续学习。
最后,还有一些政治解决方案
正在被关注。
从激励或帮助
创造新的就业机会,
到立法,以确保人们得到公平对待。
我希望社会能够找到
正确的政治解决方案
以应对人工智能对就业的影响。
有时人们会问一个问题,
如果你想在AI工作,你应该怎么做?
最近,一名放射科医生
在其职业生涯开始时
他问我
说:“嘿,安德鲁,
我听到很多关于AI
对放射学的影响。”
他说:“我是否应该放弃
自己的职业,去学习 人工智?”
我对他的回答是否定的。 当然,你可以这样做。
你其实可以放弃,
你正在做的任何事情,并从头开始学习AI,
这是完全可以的。
确实很多人都这样做了。
但也有另一个
替代方案,也就是说,
我对这位放射科医生说,
‘你考虑做AI加放射学的工作,
因为你对放射学的了解,
加上一些关于AI的知识,
你可能会比其他大多数人,
更加适合从事
放射学和人工智能的交叉点的工作。‘
因此,如果你想在 人工智能方面做更多工作,
那么在今天的世界里,
你完全可以通过在线课程和其他资源 从零开始学习人工智能。
但是如果你用已经掌握的知识,
然后学习一些人工智能, 并做你的领域和人工智能的工作,
那么你可能更有资格
去做非常有价值的工作,
因为你可以将AI应用到
你已经有专业知识的领域。
所以,我希望此视频可帮助你
了解AI即将对人们的 工作产生的影响。
让我们继续下个视频, 也是最后一个视频。
- #Conclusion
恭喜你到了 本課程的最後一段視頻。
人工智慧是一種超能力,
理解它可以讓你做 地球上很少有人能做到的事情
讓我們總結一下你的 在這個課程中看到的
在第一周, 你瞭解到 關於人工智慧技術, 什麼是人工智慧和
什麼是機器學習?
什麼是有監督的學習 即學習輸入、輸出或
A 到 B 映射。
以及什麼是資料符號, 以及如何 將資料輸入到所有這些技術?
重要的是, 您還看到了 AI 能做什麼, 不能做什麼。
在第二周, 你學會了 建立一個 AI 專案的感覺。
你看到了機器學習的工作流程 專案, 收集資料, 建設
系統和部署, 以及 資料科學專案的工作流程。
你還學會了 做出技術上的勤奮, 以確保
一個專案是可行的, 連同 商業勤奮, 以確保
該專案是有價值的, 在你提交 承擔一個特定的 AI 專案之前。
在第三周
你學會了這樣的 AI 專案如何能 適用您的公司的背景。
您看到了複雜 AI 產品的示例, 比如一個聰明的揚聲器
一輛自駕的汽車, 大型 AI 團隊的角色和職責。
你還看到了人工智慧的傳輸 劇本, 五步劇本
來幫助一間公司成為擅於的 ai 公司。
我希望這些材料貫穿于 這前三個星期可以幫助你
思考 AI 專案或
想想你可能想如何使用 AI 在您的公司或您的組織中。
在這周第四周 你瞭解了人工智慧和社會
你看到了人工智慧的一些局限性 不僅是技術上的限制, 而且
還瞭解了 AI 是如何影響 發展中經濟體和全球就業崗位。
在這四個星期裡你學到了很多東西 但人工智慧是一個複雜的話題。
所以我希望你能繼續學習
無論是通過額外的線上課程, 通過 Coursera 或
Deeplearning.ai, 書籍, 或博客, 或者只是和朋友聊天
如果你想嘗試 打造人工智慧技術,
它現在比從前更容易 學習編碼和
學習如何實現 AI 的技術。
如果你想繼續 接收有關 AI 的資訊,
您也可以註冊 我的郵件名單
通過deeplearning.ai網站和註冊
我偶爾會送出 有關 AI 的有用資訊
通過郵寄清單。
祝賀你完成了這門課程。
你現在明顯領先了 許多大公司的首席執行官在
你對人工智慧的理解和 你為人工智慧的崛起做計畫的能力。
所以我希望你能提供 對他人的領導作用
試圖駕馭這些問題。
最後, 我想對你說, 謝謝 你上這門課。
我知道你正忙著做你自己的事 工作或學校, 朋友和家人,
我很感激你花了這麼多時間與我和在這個課程學習
這些複雜的問題和相關的技術和人工智慧的影響。
所以非常感謝你的時間 以及你在這門課程中付出的努力。
1 个练习
Week 4 Quiz30分钟
所在平台: [Coursera]
课程类别: [计算机科学]
大学或机构: [CourseraNew]
其他
我从吴恩达 AI For Everyone 中学到的十个重要 AI 观
作者 | LeeMeng
整理 | NewBeeNLP
写在前面
在这个人机共存的年代,每个人都应该去尝试了解并运用人工智慧这个超能力,思考自己未来在这个变化快速的世界的定位
曾经领导Google Brain 的吴恩达教授公开的Coursera 课程:AI For Everyone[1]非常有意义。这堂课不谈技术术语,专注在与非技术人士以及企业经理人说明
- **何谓AI **
- **如何建立AI项目 **
- **如何在企业内部建立AI基础 **
- **AI与社会的关系 **
课程内容精要,总结了不少他多年在Google Brain、百度里领导AI 团队所累积的宝贵经验这堂课也提到了不少AI Transformation Playbook[2] 里头的内容。
虽然课程中很多时候是以CEO 或是企业管理者的角度说明AI 概念,但我认为每个人都可以用个人角度,从本课学到不少有用的建议以及思考框架。有了这些概念,可以帮助我们在这个变化快速的AI 潮流中掌握好自己手上的船舵并顺利航行
本文将列举出我认为本课中最值得记住的10个AI观,希望能让你学到些东西。
这篇不少概念是我自己的心得总结,而你在上完课后肯定会有其他重要见解。事实上,我会推荐你在阅读本文后就找时间实际去上这堂课,或是通过其他方式进一步了解AI
30秒AI大局观
以下就是10 个我认为AI For Everyone 这堂课传达的重要观念懒人包。如果你一秒钟几十万上下,可以只看这节就好:
- 讲到AI,我们通常是指狭义AI而非通用AI
- 多数AI应用是让机器学会一个对应关系
- 大数据、神经网络及运算能力是AI成功关键
- 只需花费你1秒的任务,大都可由AI自动化
- 对AI的态度不应过度乐观,但也不必太悲观
- AI偏见难解,但或许比消除人类偏见简单
- 拥抱AI的最好方法是将其与领域专业结合
- 机器学习和资料科学的产出分别是系统和洞见
- AI时代,你得思考未来自己想要扮演的角色
- 终身学习在这个年代前所未有的重要
是的,既然是AI For Everyone,自然没有什么特别深入的内容。但就像吴恩达教授在课程里头所说的,我相信这些基本的核心思想可以引导我们在这个AI 时代更有方向且顺利地前进。
本文接着会搭配课程PPT,针对上面提到的一些概念做点简单的补充说明,供你参考。
AI For Everyone
1、讲到AI,我们通常是指狭义AI而非通用AI
现在媒体整天报导的人工智能(Artifical Intelligence, AI)应用如:
- 智慧音响
- 自动驾驶
- 人脸辨识
- 图像分类
- 推荐系统
- 机器翻译
背后皆是狭义的AI(Artificial Narrow Intelligence, ANI)。
尽管很多AI 应用的表现甚至已经比人类还优秀,这些AI 基本上都专注在完成**「特定」的任务;这跟科幻电影如魔鬼终结者里头,能跟人类以一样的方式思考并做「任何」**事情的通用AI(Artificial General Intelligence, AGI)是有很大差异的。
尽管开发出AGI 是很多研究者的终极梦想,但事实上现行的科技离实现AGI 还有好一段距离。
2、多数AI应用是让机器学会一个对应关系
大部分的机器学习以及AI 应用本质上都是让电脑学会一个映射函数(Mapping Function),帮我们将输入的数据A 对应到理想的输出B:
- 邮件分类:电子邮件->是否为垃圾邮件
- 语音辨识:音讯档案->文本
- 机器翻译:英文文本->中文文本要实现这种AI应用,最常被使用的方法是监督式学习(Supervised Learning):给予机器大量的成对数据,告诉它什么样的A要对应到什么样的B,并让机器最后自己学会如何将任意的A转换成理想的B,达到自动化的目的。
3、大数据、神经网络及运算能力是AI成功关键
要实现能帮助人类做复杂判断的AI技术有很多种,但近年真正让AI大红大紫的是深度学习(Deep Learning)以及人工神经网络(Artifical Neural Network)
值得一提的是,你或许常听到**「神经网络跟人脑运作方式相同」的这种说法,但事实上如果你问相关人士对这种意见的看法的话,得到的答案常常是「两者天差地远」**。
尽管神经网络的运作方式跟我们神奇的大脑不完全一致,搭配大量数据以及前面提到的监督式学习,越大的神经网络通常可以在特定任务有越好的表现。
虽然这样的现象令人振奋,但别忘记
- 大型神经网络的运作
- 大量数据的处理
这两件事情都意味着需要更大量的电脑运算能力。而很多时候一般人是没有这样的运算资源的。
值得庆幸的是,很多以深度学习为基础的AI常常有个很好的特性:透过迁移学习(Transfer Learning),我们能将事先已经用大量计算资源做训练,并在任务A表现优异的AI做些简单修改,就能让修改过后的AI'能在相似的任务B也表现不错。这时候就算你只有少量数据以及不多的计算资源,也能利用AI完成以往难以想像的任务。
4、只需花费你1秒的任务,(未来)大都可由AI自动化
这项概念是吴恩达教授在课程里所提到的**「一秒原则」**,可以让你用来判断一个任务是否能用AI做自动化的准则。通过监督式学习以及大量成对A&B数据,我们可以让很多以往被认为非常复杂,但人脑仅需1秒钟就能解决的任务透过AI来自动化,让我们的生活更加轻松。
当然,这个简化的原则并不是放诸四海皆准,但可以做为一个不错的参考基准。
5、对AI的态度不应过度乐观,但也不必太悲观
尽管我们已经清楚现代AI 的威力,仍需注意AI 并不是万能药,无法(完美地)解决或自动化所有人类的问题。
比方说有研究尝试把自然语言转成SQL,但短期内一个数据科学家自己写SQL查询数据可能还是比较有效率。尽管AI不能(完美地)做到任何事情,我们也不该对AI失望,断定下一个AI冬天必定会到来。现在可以肯定的是AI已经,而且也会继续改变我们未来以及下一代的生活型态。
最重要的是理性地理解AI 能做到什么,在能活用的时候善加利用它,同时不抱着**「AI 能解决所有问题」**的不切实际幻想。
6、AI偏见难解,但或许比消除人类偏见简单
在利用监督式学习的方式训练AI 的时候,我们常常会使用现实世界的数据让机器学习。
好消息是因为现在数位化以及网际网络的发达,我们有非常多数据可以交给AI 学习;坏消息是这些数据时常反映了人类数十年甚至几个世纪的偏见。
用这些数据训练出来的AI 系统就像是面照妖镜,也会不可避免地学会这些偏见(Bias)。
知名的例子有:
- 以白人照片训练出来的人脸辨识系统在辨识深色肤色的人种时表现很差
- 自动化雇用的AI系统对女性存有偏见
- 银行的自动信用评比AI系统对某些族群产生偏见
以下则是另一个课堂中提出的例子:上例或许称不上歧视,但很明显是偏见,一种长久存在于人类社会的性别偏见。
因为很多时候这些AI 系统是学习一种统计关系,因此在此例中,AI 只是忠诚地呈现我们社会的用字习惯罢了。
要消除AI的这些偏见并不容易,但仔细想想,这可能比消除人们脑中数十年的偏见要来的简单,而且振奋人心。这件事情当然不简单,但却非常值得一试。
当然,你可以选择不思考这些AI伦理、偏见问题,相信建立AI系统的这些工程师们立意良善以及够细心,能帮我们将AI系统里的偏见移除,并让其做出最合适的判断。
尽管如此,意识到再厉害的AI系统内部也可能存在如同人类的偏见,进而导致各种不公平的社会问题这件事情也是很有帮助的。
7、拥抱AI的最好方法是将其与领域专业结合
想要学习AI,不需要打掉重练。虽然现在AI 相关领域十分热门,究其根本也就只是一种工具/技术。而且AI技术接下来会越来越平民化,上手的门槛会越来越低。
因此比起现在转行当AI 工程师,你要先做的应该是想办法利用自己工作累积的领域知识(Domain Knowledge)以及洞见(Insight),找出能应用AI 改善的地方,进而创造出专属于你或企业的竞争优势。
8、机器学习和数据科学的产出分别是系统和洞见
机器学习(Machine Learning, ML)以及数据科学(Data Science, DS)这两个词汇常常结伴出现,且依照不同企业其定义都有所不同。因此,不在这块领域里的人常常不知道两者的差异。
一般来说,在企业内的ML项目大都分为3 个阶段:
- 收集数据
- 训练模型
- 部署模型
而DS 项目的步骤则为:
- 收集数据
- 分析数据
- 建议行动/假说
两者皆需原始数据作为输入,且皆有机会使用AI / ML技术来解决、分析问题,但最终的产出形式时常不同。
总结来说,ML项目较注重在软件工程方面,且最终希望产出一个以AI为基础的线上系统;DS项目的结果则可能是一份帮助经营者做重大投资决策的PPT报告。
9、AI时代,你得思考未来自己想要扮演的角色
AI 目前正是显学,不少人决定进入这块领域,而现在跟AI 相关的职业就有好多种,比方说:
- 数据科学家
- 机器学习工程师
- 机器学习研究者
- 软件工程师
- 数据工程师
- AI项目管理者
等等。而且随着AI 的影响力持续扩大,未来可能还会出现新的相关职业。我们在这边不会一一列出每个职业的工作内容。
10、终身学习在这个年代前所未有重要
如同课程中吴恩达教授所说的,你并不需要取得一个AI master 才能开始进行AI 项目。很多时候利用线上课程或是网络上的深度学习资源就可以开始你的第一个AI项目了。
事实上,学习AI For Everyone 这堂课就是一个不错的开始。网络上也有很多优质的博客或教学文章等待你的探索。
AI 领域近年发展神速,要学习AI,用上一代**「读几年书,出来用一辈子」的概念是行不通的。台大电机系的李宏毅教授就曾说过:「在深度学习的领域,超过五年就是远古时代了」**!
因此如果你决定踏上学习AI 的这条路,就做好跟我一起终身学习的心理准备吧!
课程主页: https://www.coursera.org/learn/ai-for-everyone
讲师
授课教师评分4.82/5 (9,573 个评分)
[
InstructorFounder, DeepLearning.AI & Co-founder, Coursera
4,998,052 个学生
30 门课程
结语
看到这里,相信你已经了解AI For Everyone 里头10 个最重要的概念了,恭喜!
这些概念大多是我将课程里头撷取出的核心概念,佐以自己的心得感想。希望阅读完此文的你有学到点东西,或是获得些启发。
本文参考资料
[1]AI For Everyone: https://www.coursera.org/learn/ai-for-everyone
[2]AI Transformation Playbook: https://landing.ai/ai-transformation-playbook/