Sitemap

A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.

Pages

深度学习

计算机科学系研究生选修课, 厦门大学, 2020-09

离散数学

计算机科学系本科生必修课, 厦门大学, 2020-09

Posts

论文解读Attention Is All You Need

1 minute read

Published:

Google提出的语言模型Transformer,抛弃了传统的CNN和RNN,整个网络结构完全是由Attention机制组成。

机器学习中的样本量问题

1 minute read

Published:

在机器学习业务中经常需要评估模型的效果。例如在流量划分实验A/B Test中,我们需要确定需要多少流量可以得出统计结论是模型A好还是模型B好。一个显而易见的结论是流量越多越好,但是流量切分试验做得越久,也就意味着更多损失。所以我们需要确定样本量来对流量实验进行统计检验。

机器学习业务评估统计方法

5 minute read

Published:

工业界机器学习模型常需围绕业务展开,除了机器学习本身的模型评估指标外(如LogLoss、AUC、KL等),还需要针对业务目标进行相关统计信息评估,完成针对部分流量样本上线模型后的效果分析。例如,一个模型上线后因灰度测试考虑往往先分配较少流量,当讨论测试结果是否显著用以衡量新模型有效性时,就需要使用统计评估方法。本文汇总一些常用统计方法,用于分析统计量之间的关系。

Deep Reinforcement Learning: Pong from Pixels学习笔记

less than 1 minute read

Published:

Deep Reinforcement Learning: Pong from Pixels是一篇很好的强化学习入门博文。其中详细介绍了DRL一种常用的方法:Policy Gradient。原文链接:http://karpathy.github.io/2016/05/31/rl/

portfolio

publications

talks

teaching

CST207 Design and Analysis of Algorithms

Undergraduate course of computer science and technology, Xiamen University Malaysia, 2020-04

This course covers introduction to algorithms, asymptotic analysis, analyzing algorithms, probabilistic analysis, recursive algorithm, divide-and-conquer algorithms, dynamic programming, greedy algorithms, NP-complete theory, backtracking, branch-and-bound, searching problems and approximation algorithms.

SWE404 Big Data Analytics

Undergraduate course of software engineering, Xiamen University Malaysia, 2020-04

We look at the details of the big data tools Hadoop, Spark and related tools that provide SQL-like access to unstructured data. Some more advanced techniques such as Spark Streaming and MLlib will also be introduced. Based on Python, we use PySpark as the main programming tool to implement big data applications. We also introduce some machine learning techniques such as classification, regresion, clustering and collaborative filtering and how to implement them to real applications using PySpark and MLlib API.

算法设计与分析

计算机科学系本科生必修课, 厦门大学, 2021-03

该课程为厦门大学计算机科学与技术系大二下学期必修课,是理论性与实践性都很强的学科,是计算机学科的重要专业课之一。本课程主要介绍算法的基础知识,包括抽象计算模型、算法基本概念、算法复杂性分析基础、算法设计的基本方法、以及算法复杂性理论基础。课程教学的基本要求是通过教学活动,使每一个学生较好地掌握课程的主要内容,同时具备对实际问题应用所学知识设计出有效算法并编程实现这些算法的能力。此外,配合实验课程的教学,学生应理论联系实际,理论指导实践,通过实验工作,借助程序设计语言,掌握运用数据结构、算法和程序解决一些实际问题的方法。

深度学习

计算机科学与技术系研究生选修课, 厦门大学, 2021-09

该课程为厦门大学计算机科学与技术系研究生选修课,以基于深度学习平台TensorFlow和PyTorch的编程实践为主,算法理论为辅,使学生能够领悟深度学习的基本原理以及适用场景,并且对使用深度学习方法来解决问题具有一定的动手能力,为学生今后开展科研工作和业界求职打下基础。

离散数学

计算机科学系本科生必修课, 厦门大学, 2021-09

该课程为厦门大学计算机科学系大二上学期必修课,是计算机和相关专业的专业基础课,为数据结构、算法设计与分析、操作系统、编译原理等后续课程的先修课。主要讲授数理逻辑、集合论、代数结构和图论的基本理论和方法,注重常用离散结构背景、算法和应用的讲述,引导学生应用离散数学的理论和方法解决实际问题。