Blog posts

2019

论文解读Real-time Personalization using Embeddings for Search Ranking at Airbnb

less than 1 minute read

Published: July 02, 2019

这篇文章是airbnb提出的一种构造item embedding的方式。该方法将应用领域的需求与算法高度结合。

论文解读Attention Is All You Need

1 minute read

Published: July 02, 2019

Google提出的语言模型Transformer，抛弃了传统的CNN和RNN，整个网络结构完全是由Attention机制组成。

机器学习中的样本量问题

1 minute read

Published: July 01, 2019

在机器学习业务中经常需要评估模型的效果。例如在流量划分实验A/B Test中，我们需要确定需要多少流量可以得出统计结论是模型A好还是模型B好。一个显而易见的结论是流量越多越好，但是流量切分试验做得越久，也就意味着更多损失。所以我们需要确定样本量来对流量实验进行统计检验。

机器学习业务评估统计方法

5 minute read

Published: July 01, 2019

工业界机器学习模型常需围绕业务展开，除了机器学习本身的模型评估指标外（如LogLoss、AUC、KL等），还需要针对业务目标进行相关统计信息评估，完成针对部分流量样本上线模型后的效果分析。例如，一个模型上线后因灰度测试考虑往往先分配较少流量，当讨论测试结果是否显著用以衡量新模型有效性时，就需要使用统计评估方法。本文汇总一些常用统计方法，用于分析统计量之间的关系。

Deep Reinforcement Learning: Pong from Pixels学习笔记

less than 1 minute read

Published: July 01, 2019

Deep Reinforcement Learning: Pong from Pixels是一篇很好的强化学习入门博文。其中详细介绍了DRL一种常用的方法：Policy Gradient。原文链接：http://karpathy.github.io/2016/05/31/rl/

Yang Lu (卢杨)

Blog posts

2019

论文解读Real-time Personalization using Embeddings for Search Ranking at Airbnb

论文解读Attention Is All You Need

机器学习中的样本量问题

机器学习业务评估统计方法

Deep Reinforcement Learning: Pong from Pixels学习笔记