最近在看《百面机器学习》,里面的大部分问题都要问 ChatGPT 才有思路。好奇问一下做 machine learning engineer 的各位,真的有人记得住那几十个算法吗?
举几个例子?
SVM, kNN, k-means, EM, GMM, LDA, 等等
原理肯定是得知道的 做多了就熟了。。。
常用的也就那么几个吧,最简单的logistic,树里面的DT,RF,Xgboost,Adaboost,GBDT,聚类的kmeans,knn,贝叶斯和拓展模型,再加上SVM和PCA,各类神经网络。比较麻烦的是试模型和结构设计(stacking/bagging)。不过现在有AutoML。
其实我感觉树和神经网络用的最多,在这些基础上再调就是了,用的多了就有经验了。(ps我不是mle,只是做相关的研究)
这可比学数学简单多了
你应该问的是“有人记不住吗”
就像码农有人记不住那几十个基本算法的吗?
我感觉有的算法数学挺难的,比如 Expectation-maximization 里面的各种 lower bound inference
还有其他挺多的,面试还可能遇到不同算法的变种
“用进废退”,不用的话会从脑海中慢慢消失
这些不是undergraduate intro level的内容吗
记住算法 当场写吗
取决于你面试还是工作用吧。
面试肯定都得知道+一些代码的实现+公式推导。
工作一般掉包 dl/llm会customize
这你都记不住那建议这行不适合你…
这可是基础内容,建议转行
你别说大厂MLE 疫情之后良莠不齐 经常需要我教育算法
不过2025新招的都基础很好,大概基础不好的面试真会挂
两门数学课下来能记得的只剩下SVM、kMeans、K-NN了
记到什么程度才是关键,光报菜名是不难的,从完全理解原理的角度讲,光lasso的oracle property的就够发多少AoS了…
这还行了,就那几个算法
我面过【大量国内岗(包括北美tt)和少量美国岗】都是项目focus,最多加1-2个leetcode,ML八股文很少考