ML读书笔记（人工智能的热门应用）

A. 计算广告

转化率的数据很稀少，可以退而求其次，用二次跳转、加入购物车等，近似转化率；

CRT预估的公开数据集：Criteo(7天4000万条训练数据，1天600万条测试数据）

PC端广告点击率: 0.1%~1%; 样本严重不均衡，可以在负例样本集里采样；

评估：线下AUC和LogLoss; 线上A/B测试点击率（or+停留时长，转化率）

根据Query来召回：查询扩展（给出一个查询，扩展出多个同义近义查询），解决模糊匹配问题；

要对曝光率低的广告进行“探索”，使其有展示的机会才好统计点击率（探索和利用）（可使用强化学习）

合约广告：没有CTR预估；用M个广告和N类展示机会（每个广告映射到不同的几个展示机会），二分图匹配问题（带约束的最优化），最大化收益；

B. 游戏

AlphaGo Zero，揭示了有规则足够，数据可以机器自动生成；

扫描二维码关注公众号，回复： 7660621 查看本文章

明棋，对弈双方持有对称的信息，即“完美信息”，搜索+剪枝即可；(国际象棋、西洋陆琪等状态空间小，用MinMax树搜索；围棋状态空间大，用蒙特卡洛树搜索）

德州扑克等，暗牌，有隐藏信息，搜索空间非常大；AI必须要让自己的移动随机化，基于别人已有策略得到的新策略要尽可能地少被别人利用；

DeepMind的Q-Learning玩游戏；OpenAI的工具包Gym,评估和训练AI的平台Universe;

C. 自动驾驶

L0~L5; L5之前的都是限定场景的“自动驾驶”，都不靠谱儿；

两个技术分支：1.把路都标准化；2.把车变智能；

占据栅格：1.事先知道的，存储好坐标和大小的物体们；2.汽车传感器实时识别出来的周边物体；

不确定性锥：物体+移动速度，危险范围；（静止的消防栓，则是细锥；跑动的人，则是粗锥）（视线死角，要有锥，因为可能鬼探头）

D. 机器翻译

1. 基于规则：规则编写费时费力，规则之间可能有冲突；

2. 基于统计：使用双语平行语料库做训练；包括：A. 翻译模型（估算单词、短语之间互相翻译的概率），B.调序模型（对翻译后的语言片段排序进行建模），C.语言模型（计算生成的译文是否符合目标语言的表达习惯）；

3. 基于神经网络：RNN, Attention, Transformer

E. 人机交互

多模态，人性化（不一定要拟人化）

互动偏见：聊天机器人由于数据的影响，开始说脏话；

数据偏见：训练数据因素造成的，比如搜索医生出来的都是男性；

模型偏见：因数据缺失造成的，比如给女性推荐低薪工作；

黑盒化引起人们的不信任，要在“黑盒化”和“透明化”之间达成妥协；（推荐系统提供推荐解释，智能策略给出辅助信息供人来决策，智能策略更保守些）