草庐IT

保姆级人工智能学习成长路径

herosunly 2025-03-06 原文

文章目录

0. 前言

  最近有很多小伙伴想学习人工智能,其中不少同学渴望从事相关职业。虽然网上的资料很多,但是很多内容不够接地气,导致他们看不懂,所以很迷茫,不知何去何从。作为获得AI比赛Top名次的老司机,就给大家讲讲如何系统学习人工智能,最终达到一名合格的算法工程师。希望大家能够跟随我一步步迈进人工智能的殿堂,一起冲鸭~~~

  先简单说一下学习的最大误区就是一上来闷头看视频。看视频是非常低效的学习方式,相比于阅读来说,在同样的时间内看视频学习到的知识量是远远小于阅读的。当然,国内外著名大学的经典视频有时间也可以看看。所以在后续的每个阶段学习中,都会介绍重点的学习教材。

1. 第一阶段:编程语言学习

  在IT届,最让人朗朗上口的谚语是:Talk is cheap, show me the code。这也充分表明了在计算机领域中代码的重要性了。而人工智能作为计算机领域的分支,同样满足实践是检验真理唯一标准。推荐Python语言作为学习人工智能领域的入门语言。一来是因为Python简单易学,二来是因为在人工智能领域中,很多库和框架可以通过Python语言来调用。

  在这里推荐两个课程:简明Python教程Python官方教程,前者比较适合完全零基础的同学,后者更适合具有了一定基础的初学者。之所以推荐官方教程,是因为官网教程和论文都是最权威的一手资料。如果大家对于学习官网教程没有信心,可以学习我的专栏:Python新手快速入门。系统讲解了学习方法、官网教程的核心概念和重要内容,教你快速理解官网教程。以及最常用的几个机器学习库:Numpy、Pandas、re(正则表达式库)。

2. 第二阶段:机器学习基本理论

  学习完Python语言后,就需要进一步学习机器学习的基本理论。推荐的学习教材是李航老师的统计学习方法。其中的常用模型包括:

  • 朴素贝叶斯
  • 决策树
  • 支持向量机
  • 提升树
  • 其他模型

  作为一名老司机,先介绍初学者最容易犯的误区,仅仅关注于学习机器学习模型,而忽略了对机器学习核心概念和核心思想的理解,可以通过下列几个问题来进行大概的判断:

  • 如何有效划分数据集
  • 如何解决过拟合现象
  • 模型之间的关联和区别是什么
  • 规则和模型如何选择
  • 如何根据业务场景选择合适的算法

  如果课本内容已经学的很明白,建议同学可以阅读或者动手实现模型代码。大家对上述问题不是很清晰的话,如果反响热烈,后续也会通过系列专栏的形式来讲解这一部分。这部分内容大家可以学习李航老师的统计学习方法或者林轩田老师的机器学习基石。

3. 第三阶段:深度学习理论与实战

  学习完机器学习基本理论后,就需要进一步学习深度学习的理论与实战。这是由于在工业界中的数据集数量庞大,只有使用拟合能力更强的深度学习才能取得更好的效果。在此推荐邱锡鹏老师的神经网络与深度学习。在学习过程中重点把握不同神经网络的结构和适用场景。比如最常用的三种神经网络结构:

  • 前馈神经网络
  • 卷积神经网络
  • 循环神经网络

  与此同时,一定要动手使用深度学习框架来完成实践项目,比如使用深度学习框架(Tensorflow或者Pytorch)完成简单的分类或者回归的任务。然后再逐渐深入,从而加深对神经网络和深度学习的理解。

4. 第四阶段:细分领域深入学习

  再进一步就是选择细分领域进行学习了,相对主流的几大方向和细分方向分别是:

  • 计算机视觉(CV):图像分类、目标检测、关键点检测(如人体姿态估计)、图像分割、OCR等。主要提取的是颜色、形状和纹理等特征。

  • 自然语言处理(NLP):文本分类、命名实体识别、事件抽取、文本摘要、阅读理解等。主要提取的是词汇、语义等特征。

  • 推荐系统:热门推荐、Feed流、猜你喜欢等。推荐系统一般分为召回、粗排、精排、重排四个阶段。

  • 金融风控等:客户群体筛选、欺诈风险鉴别、信用评定等。近些年的金融风控也开始使用图神经网络。

  之前的几个阶段都可以通过教材的方式进行学习,而这一阶段的学习方式为工作或者比赛。如果没有合适的工作机会,但也想拿到进入人工智能领域的入场券,最简单直接的方式就是打比赛拿到top名次。

  本篇文章为机器学习入门之工具篇专栏中的指引性的文章。本专栏包含了Python基础、Numpy、Pandas、Linux和Git常用命令、TensoFflow、Pytorch的入门教程以及最常用的软件和网站。希望能对初学机器学习以及入门AI比赛的同学有所帮助。

  如果已经掌握了基础,也可以进一步学习个人精心打磨的另一个专栏: Al比赛教程。分享各类Al比赛(阿里云天池、科大讯飞等)前几名队伍的成功经验,包括NLP,CV、语音、时序预测、信息安全等方向。其中也包括自己取得的阿里云第一名的经验分享。也包括打比赛提分的一些实用tricks ,从而更好的帮助新手入门数据科学竞赛。

5. 第五阶段:集大成者

  如果我们想成为人工智能领域的大佬,就不能局限于某个细分领域了。因为很多领域之间其实是互相借鉴,互相成就的。举两个例子,一个是在NLP大杀四方的Transformer模型也被迁移到了CV领域,同样实现了佛挡杀佛。另外一个是先在CV领域中实现效果较好的simCLR(对比学习),后面被NLP领域借鉴实现了simCSE,也取得了极佳的效果。

  除此之外,也需要长期坚持对新事物的不断学习与探索,比如在2023年年初爆火的ChatGPT,不管是哪个细分领域的从业者,一定要多花时间学习和了解。刚好我也开了一个专栏:ChatGPT使用技巧和论文解读,更新频率为一周一到两更,感兴趣的同学可以订阅学习,订阅人数超过50将会涨价。

  最后再简单介绍下需要长期培养的几大能力,祝大家早日实现自己的梦想:

  • 实际业务建模
  • 论文阅读与复现
  • 代码阅读与优化

有关保姆级人工智能学习成长路径的更多相关文章

  1. ruby-on-rails - Rails - 使用/自定义 URL : '/dashboard' 指定根路径 - 2

    如何使此根路径转到:“/dashboard”而不仅仅是http://example.com?root:to=>'dashboard#index',:constraints=>lambda{|req|!req.session[:user_id].blank?} 最佳答案 您可以通过以下方式实现:root:to=>redirect('/dashboard')match'/dashboard',:to=>"dashboard#index",:constraints=>lambda{|req|!req.session[:user_id].b

  2. LC滤波器设计学习笔记(一)滤波电路入门 - 2

    目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》,侵权删。前言最近需要学习放大电路和滤波电路,但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放,所以也是相当从零开始学习了。滤波电路科普主要分类滤波器:主要是从不同频率的成分中提取出特定频率的信号。有源滤波器:由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波,最普通易于采用的无源滤波器结构是将电感与电容串联,可对主要次谐波(3、5、7)构成低阻抗旁路。无源滤波器:无源滤波器,又称

  3. CAN协议的学习与理解 - 2

    最近在学习CAN,记录一下,也供大家参考交流。推荐几个我觉得很好的CAN学习,本文也是在看了他们的好文之后做的笔记首先是瑞萨的CAN入门,真的通透;秀!靠这篇我竟然2天理解了CAN协议!实战STM32F4CAN!原文链接:https://blog.csdn.net/XiaoXiaoPengBo/article/details/116206252CAN详解(小白教程)原文链接:https://blog.csdn.net/xwwwj/article/details/105372234一篇易懂的CAN通讯协议指南1一篇易懂的CAN通讯协议指南1-知乎(zhihu.com)视频推荐CAN总线个人知识总

  4. 深度学习部署:Windows安装pycocotools报错解决方法 - 2

    深度学习部署:Windows安装pycocotools报错解决方法1.pycocotools库的简介2.pycocotools安装的坑3.解决办法更多Ai资讯:公主号AiCharm本系列是作者在跑一些深度学习实例时,遇到的各种各样的问题及解决办法,希望能够帮助到大家。ERROR:Commanderroredoutwithexitstatus1:'D:\Anaconda3\python.exe'-u-c'importsys,setuptools,tokenize;sys.argv[0]='"'"'C:\\Users\\46653\\AppData\\Local\\Temp\\pip-instal

  5. hadoop安装之保姆级教程(二)之YARN的配置 - 2

    1.1.1 YARN的介绍 为克服Hadoop1.0中HDFS和MapReduce存在的各种问题⽽提出的,针对Hadoop1.0中的MapReduce在扩展性和多框架⽀持⽅⾯的不⾜,提出了全新的资源管理框架YARN. ApacheYARN(YetanotherResourceNegotiator的缩写)是Hadoop集群的资源管理系统,负责为计算程序提供服务器计算资源,相当于⼀个分布式的操作系统平台,⽽MapReduce等计算程序则相当于运⾏于操作系统之上的应⽤程序。 YARN被引⼊Hadoop2,最初是为了改善MapReduce的实现,但是因为具有⾜够的通⽤性,同样可以⽀持其他的分布式计算模

  6. ruby - 如何根据长度将路径数组转换为嵌套数组或散列 - 2

    我需要根据字符串路径的长度将字符串路径数组转换为符号、哈希和数组的数组给定以下数组:array=["info","services","about/company","about/history/part1","about/history/part2"]我想生成以下输出,对不同级别进行分组,根据级别的结构混合使用符号和对象。产生以下输出:[:info,:services,about:[:company,history:[:part1,:part2]]]#altsyntax[:info,:services,{:about=>[:company,{:history=>[:part1,:pa

  7. ruby - 我正在学习编程并选择了 Ruby。我应该升级到 Ruby 1.9 吗? - 2

    我完全不是程序员,正在学习使用Ruby和Rails框架进行编程。我目前正在使用Ruby1.8.7和Rails3.0.3,但我想知道我是否应该升级到Ruby1.9,因为我真的没有任何升级的“遗留”成本。缺点是什么?我是否会遇到与普通gem的兼容性问题,或者甚至其他我不太了解甚至无法预料的问题? 最佳答案 你应该升级。不要坚持从1.8.7开始。如果您发现不支持1.9.2的gem,请避免使用它们(因为它们很可能不被维护)。如果您对gem是否兼容1.9.2有任何疑问,您可以在以下位置查看:http://www.railsplugins.or

  8. ruby-on-rails - 如何播种图像的路径? - 2

    Organization和Image具有一对一的关系。Image有一个名为filename的列,它存储文件的路径。我在Assets管道中包含这样一个文件:app/assets/other/image.jpg。播种时如何包含此文件的路径?我已经在我的种子文件中尝试过:@organization=...@organization.image.create!(filename:File.open('app/assets/other/image.jpg'))#Ialsotried:#@organization.image.create!(filename:'app/assets/other/i

  9. ruby - 我如何学习 ruby​​ 的正则表达式? - 2

    如何学习ruby​​的正则表达式?(对于假人) 最佳答案 http://www.rubular.com/在Ruby中使用正则表达式时是一个很棒的工具,因为它可以立即将结果可视化。 关于ruby-我如何学习ruby​​的正则表达式?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1881231/

  10. Ruby 和指南针路径与 yeoman 项目 - 2

    我安装了ruby​​、yeoman,当我运行我的项目时,出现了这个错误:Warning:Running"compass:dist"(compass)taskWarning:YouneedtohaveRubyandCompassinstalledthistasktowork.Moreinfo:https://github.com/gruUse--forcetocontinue.Use--forcetocontinue.我有进入可变session目标的路径,但它不起作用。谁能帮帮我? 最佳答案 我必须运行这个:geminstallcom

随机推荐