斯坦福Machine Learning网课半程总结
我是干什么事都会半途而废的性子。不过这次也许不一样。
8月初的时候,文科体质内潜藏的理科好奇宝宝重新爆发,于是报名加入了斯坦福的《Machine Learning》网络课程。上课的教授是华裔,Andrew Ng。记得大学学过,Ng在粤语和福建话里都是吴姓,猜这位教授的祖辈跟香港或者福建大概有什么渊源。
机器学习,听上去似乎是个非常技术的概念,但只要做一些基础的了解,就会发现它并不神秘。从手机上每天用到的书写识别,到垃圾邮件识别,再到特斯拉的自动驾驶汽车,和它都有关系。简单说来,ML基于输入的一系列数据,利用不同算法,经过一层或多层计算,拟合出曲线,用于预测和输出结果。真正的挑战,在于设计算法网络。
我比较惊讶的,是早在20世纪50年代,数学家们就已经开始研究神经网络了。60年代末,反向传播算法(Back Propagation Algorithm)已经发明。而Ng教授在课堂上展示的自动驾驶片段来自80年代卡耐基梅隆大学的自动驾驶实验,画质感人。视频中,一辆迷彩越野车前额挂着摄像机等仪器,先由人驾驶一遍,再交由自动驾驶。可以看到,对于学习过的单行道驾驶,机器预测的方向十分准确,在小路上缓缓开过,而到了岔路口,路况不同,汽车似乎有点“傻眼”。
在编程作业里,我还体验了用机器学习识别手写数字。其实质是将一个手写数字当做一组像素组合,作为一个例子;用许多个不同的例子和对应的输出结果进行学习,从而让机器掌握“判断”手写数字的方法。
虽然结果酷炫,写代码的过程对我这个文科生来说非常痛苦。第二周开始有编程作业,三个小时的预计时间。将将做完来得及,可真正要消化,三个小时必然不够。报名之前我很审慎地读过要求:一定的编程基础和矩阵知识。编程基础我是没有的。矩阵在修经双的时候学过,倒是还能找回来。所以硬着头皮上了。
学习的过程是和公式定理打交道,幸而老师讲的深入浅出,经常来一句“这个公式没学过求导的同学们可能不太懂,不过没关系,咱不需要懂”,要么就是说“哎呀,学到这里,你们比硅谷那些靠ML吃饭的人懂得还多了”。总之,挺贴合美国本科数学教育水平的。
在课程刚开始的“打招呼”论坛上,助教提示可以讲讲自己想用ML做些什么。我写的是,想用ML来写诗。根据已经掌握的知识,这个想法说不定真的可以实现。只是,我要先学会用分词技术构建一个巨大的词汇库……
还有一点额外的小收获。在了解反向传播算法时,我发现曾对该算法作出贡献的华人数学家何毓琦教授,是民国将军何竞武之子。这位将军是我的浙江老乡,出生在诸暨,在海宁长大,和徐志摩是同窗好友,关系好到让自己女儿认了徐志摩和陆小曼做干爸干妈。不过,何竞武1948年赴台,何毓琦则于1949年前往香港,第二年被麻省理工录取,年仅16岁。
更神奇的是,以82岁高龄,何教授仍然在以一周一篇的平均速度写自己的博客,虽然都是英文,但内容亲民,很有意思。比如这种标题:“Science in the Age of Selfies”,和这种标题:“Donald Trump and a CIA officer walk into a room”。不过以上是转载,还有一些是教授自己写的文字。连阮一峰都在他的博文里写,“要是读大学时就能读懂这样的文章,我的人生也许就完全不一样了”。
课程一共11课,目前上到了第6课,刚好过半。继续努力咯。