V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cqcn1991
V2EX  ›  分享发现

Harvard CS109 Data Science 课程介绍(1)

  •  
  •   cqcn1991 · 2015-05-15 22:51:17 +08:00 · 3897 次点击
    这是一个创建于 3485 天前的主题,其中的信息可能已经有所发展或是发生改变。

    之前因为对Data Science好奇,想学一下
    于是就找到了Harvard CS 109 Data Science的课程
    这门课在网上的评价相当高,但是国内似乎无人问津
    http://www.quora.com/What-is-it-like-to-take-CS-109-Statistics-121-Data-Science-at-Harvard

    本打算完全学完,再进行评价
    但是无奈时间有限(我就51的时候花了几天看完的),等我真正把所有都学好,可能是很久之后了
    所以先写一些介绍,以后有机会再继续

    其他Data Science课程选择:
    Coursera的课程 https://www.coursera.org/specialization/jhudatascience/1
    如果专注于Machine Learning的话,还有https://www.coursera.org/learn/machine-learning
    不过我没有上过,没法比较。

    Alt text
    1.内容介绍
    课程主页: http://cs109.github.io/2014/ (现在好像很难打开了……)
    视频,作业(包括详细的答案)等等内容,在上面都可以找到
    每节课的具体内容: http://cs109.github.io/2014/pages/schedule.html

    2.难度,适合什么样的人?
    全英文授课,无字幕
    作业是写程序(python),对数据进行分析
    开课是给本科生上的,各个专业的都有。但也有不少研究生。
    (我个人觉得相当于大二的概率论,只是以编程作为工具,更为实用)

    说说我想学的原因
    ①对数据分析比较感兴趣
    ②这门课是Python教的,能顺带学一下Python
    ③读研的方向,可能和数据分析相关,所以有可能有帮助(不过现在看来基本上没用)

    这样子说比较抽象,数据分析有意思,比如
    ①怎么通过民意调查,来预测美国大选的最终结果?
    ②怎么通过对整体棒球员的各项数据统计,来预测一个球员下赛季的表现?
    ③怎么通过红酒的各项指标,来预测其酒的品质?

    Alt text
    前两个,都是上课讲的例子,当然老师也会提到Nate Silver和Moneyball了。 最后一个是第5次作业的内容。
    另外插一句,上课的老师一个是印度人,一个是德国人。当然有口音,不过听起来完全没问题

    所以
    英语水平:可以先看看视频,看自己的英语水平能不能听懂;
    编程:用Matlab写过作业,或者有基本的开发经验即可(任何语言)
    这个要求很低,因为作业都有参考答案,可以先看参考答案来学习写程序的方法。而程序看得多了,自然就会写了

    所以,如果想学,直接看视频即可
    看看内容是不是感兴趣,是不是听得懂,就行了
    如果你参加过数学建模,倒是大概不用学了,可能很多内容你们都熟悉

    3.资源
    视频地址: http://cm.dce.harvard.edu/2015/01/14328/publicationListing.shtml
    下载用IDM,最好不要断点续传,否则可能下下来的视频中间有问题,那样子重新下一遍就好
    土豆上传了部分,供预览: http://www.tudou.com/programs/view/8LP4kh-DAKI
    百度云: http://pan.baidu.com/s/1qWmg7EG
    (之所以只上传部分,是因为我知道绝大多数人都不会看完上述的这几集,那再多的上传也就没有必要了)

    Alt text
    课程表: http://cs109.github.io/2014/pages/schedule.html
    L1-2 课程介绍
    L3-6 Data Visualization,也就是怎么用图表来说明、研究数据
    L7-10 为传统的概率模型数据分析,比如回归分析,正态分布
    L11-22 开始为Machine Learning,即大数据、机器学习
    也有一些前面的条件概率(贝叶斯公式)穿插着讲,涉及到决策树, SVM, 等等

    Section/Lab是补充性内容
    主要是结合Python讲解上课的内容,包括Python的入门,和与作业相关的数据分析方法
    Alt text

    第 1 条附言  ·  2015-05-16 08:36:45 +08:00
    4 条回复    2018-09-09 17:54:22 +08:00
    cqcn1991
        1
    cqcn1991  
    OP
       2015-05-16 08:32:57 +08:00
    汗,豆瓣的图不能外链么
    手机上图全挂了
    aREMbosAl
        2
    aREMbosAl  
       2015-09-09 22:17:36 +08:00
    楼主能不能再 update 一下视频和其他材料。。谢谢
    cqcn1991
        3
    cqcn1991  
    OP
       2015-09-09 22:27:02 +08:00
    @vincentzlt 视频用 IDM 自己下吧...其他资料网上都有吧?还缺什么?
    而且貌似最近要出新了,建议跟新学期的课~
    wizardforcel
        4
    wizardforcel  
       2018-09-09 17:54:22 +08:00
    UCB DS100 了解一下。。

    https://www.ds100.org/
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3059 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 14:51 · PVG 22:51 · LAX 06:51 · JFK 09:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.