6.6-张亚勤 New Wave of Digital Transformation

日期

2020-6-6

11:00～12:00 BJT

梗概

Digitalization 3.0 : New wave of digitalization
2nd aspect of digital information: ABC Particularly AI
New architectural & infrastructural Revolution

6.6-李开复 AI赋能时代的创业

日期

2020-6-6

9:00～11:00 BJT

梗概

中国AI如何弯道超车
AI从“发明期”进入“应用期”
AI赋能时代的创业特点
给AI未来人才的建议

内容

中国AI如何弯道超车

perception AI: 如计算机视觉: 旷世,商汤, 无人驾驶,

现在AI现在进入了应用期, 深度学习与产业界结合刚刚开始,

AI对未来人才的建议

如何成为未来人才, 而不是做过去的工作

System2 聚焦于AI认知问题 (感知 -> 认知)

AI会自然融入各种公司, 让AI无所不在, 赋能到传统行业

图像–> 医疗, 无人驾驶, (数据非常重要), CV的应用才刚刚开始, 需要商业+技术

关于可解释性:

医疗,自动驾驶,金融: 需要有可解释性

创业

把用户当上帝

加入传统公司

互联网

金融公司

加入AI赋能公司

6.7-吴恩达 Full Cycle Machine Learning

http://wiki.deecamp.com:8090/pages/viewpage.action?pageId=1769942#page-metadata-start)

日期

2020-6-7

9:00～11:00 BJT

梗概

The Full Cycle Machine Learning is designed for ML practitioners (Data Scientists, MLEs, Data Engineers, Data Analysts), students of ML/AI as well as data software engineers with some background in ML/AI . This course bridges the gap between being able to develop a ML algorithm/model and being able to develop and deploy a robust ML system to production.

A lot of AI work focuses on building the model—such as the neural network needed to generate a specific X–>Y mapping. But to build practical production systems, many additional steps are needing, ranging from scoping the project, to deciding on the data collection methodology, to making sure the data is high quality, to strategies for model iteration, to practical deployment and monitoring.

课后资源补充：

Open positions of Landing and deeplearning.ai: https://landing.ai/careers/; https://www.deeplearning.ai/careers/
deeplearning.ai is also recruiting a senior full stack engineer in Beijing. You can send the resume to career@landing.ai
Here is the information of Stanford ML group: https://stanfordmlgroup.github.io/#contact
Machine Learning Yearning https://www.deeplearning.ai/machine-learning-yearning/

6.13-张潼神经网络模型设计和理论研究简介

2020-6-13

9:00～11:00（BJT）

梗概

当今深度学习的发展是以大数据和大计算力为基础的。这个模式在现阶段起到如下作用：设计更深更复杂的模型来提升效果，大模型预训练技术和表示学习取得广泛应用，自动化模型设计成为可能。虽然基于这个模式的深度学习研究有很多的成功案例，但是已经遇到了一系列技术瓶颈。为了进一步的技术突破，我们在现阶段需要建立更加完整的理论体系来指导今后研究。

在这个讲座，我围绕以上这几个问题简单介绍关于神经网络研究的一些近期进展，包括以下三个部分：

\1. 人工设计模型和预训练大模型简介

\2. 针对特定任务和硬件的自动化模型设计简介

\3. 神经网络的优化和过参数化理论简介

6.14-周志华机器学习的挑战

日期

2020-6-14

9:00～11:00

课程大纲：

关于深度模型
关于监督信息
关于任务环境

附件

机器学习的挑战_周志华.pdf

周志华老师讲课回忆—机器学习的挑战（未完，待更新）.pdf

机器学习的挑战 - 周志华2.pdf

周志华机器学习的挑战note.pdf

内容

Neuro Network development

M-P model 1943年出现, 2012年8层, 2015年152层, 2016年1207层.

为什么要deep?

Deep -> 增加嵌套迭代层数 → 更增加复杂度

Width → 增加函数个数

机器学习在做什么?

主要在避免过拟合 →所以要避免用复杂模型, 防止将训练集特性当做一般规律

如:

决策树 → 剪枝
SVM → 正则化
神经网络 → 早停

为何会过拟合?

数据量少+模型复杂

机器学习算法为了满足未知复杂度的任务 → 模型复杂度往往高于问题复杂度, 即有”在拟合出正确规则前提下,能进步一拟合噪声”的能力

网络越深: 抽象程度越高, 自由度越大

网络过深的缺点: https://zhuanlan.zhihu.com/p/44304391

梯度x消失, 梯度爆炸
过拟合
网络退化

残差网络一定程度解决这个问题

解决过拟合的方法有哪些?

知乎 - 解决过拟合方法 https://www.zhihu.com/question/59201590/answer/167392763

获取更多数据 → 最有效, 让模型看到更多特例
1. 从源头直接增加
2. 根据当前数据集,估计参数分布 → 生成数据 (但会引入抽样误差)
3. 数据增强(data argumentation)
  
  位置, 姿态, 尺度, 明暗度 → 平移, 翻转, 缩放, 切割
合适模型
1. 网络结构(simpler model structure) → 减少网络层数, 神经元个数
2. 训练时间(early stopping) → 早停, 限制网络能力
3. 限制权值(weight-decay), 也叫正则化(regularization) ?????
4. 增加噪声(Noice)
  1. 输入中
  2. 权值上
  3. 网络响应
**结合多种模型**(ensamble) → 训练多种模型, 以每个模型平均输出作为结果
1. Bagging(神经网络一般不用)
  
  类似分段函数概念
2. Boosting
  1. 训练简单神经网络, 加权平均输出
3. Dropout
4. 贝叶斯方法(Bayesian)??
5. utilize invariance?????