• 在线课程

    Learning is changing

  • 数据挖掘:理论与算法

    袁博,清华大学

  •  

    课程作业

    作业要求

    请观看国家精品课程《数据挖掘:理论与算法》(袁博,清华大学)的以下内容并完成课后作业。

    第一次作业

    • 第一章第五节:分类问题
    • 第一章第六节:聚类及其他数据挖掘问题
    • 第二章第一节:数据清洗

    第二次作业

    • 第二章第三节:类型转换与采样
    • 第二章第四节:数据描述与可视

    第三次作业

    • 第二章第七节:线性判别分析1
    • 第二章第八节:线性判别分析2
  • 课程介绍

    最有趣的理论+最有用的算法=不得不学的数据科学!
    本课程完整覆盖数据挖掘领域的各项核心技术,包括数据预处理、分类、聚类、回归、关联、推荐、集成学习、进化计算等。强调在知识的广度、深度和趣味性之间寻找最佳平衡点,在生动幽默中讲述数据挖掘的核心思想、关键技术以及一些在其它相关课程和教科书中少有涉及的重要知识点。本课程适合对大数据和数据科学感兴趣的各专业学生以及工程技术人员学习,不追求纯粹的理论推导,而是把理论与实践有机结合,让学生学到活的知识、有用的知识和真正属于自己的知识,特别是数据分析领域的研究方法和思维方式。
     
    主讲人:袁博,清华大学深圳国际研究生院
    澳大利亚昆士兰大学计算机科学博士,清华大学深圳国际研究生院培养处副处长,博士生导师,国家精品在线开放课程负责人,深圳市优秀教师。荣获清华大学青年教师教学优秀奖、清华大学青年教师教学大赛一等奖、清华大学年度教学优秀奖、清华大学教学成果一等奖、教育部在线教育研究中心 "智慧教学之星" 称号、北京高校青年教师教学基本功比赛最佳教案奖和最受学生欢迎奖。研究领域为数据挖掘、进化计算及并行计算,发表学术论文近百篇,获国内发明专利四项。现为中国图像图形学学会视觉认知与计算专业委员会委员、IEEE 计算智能协会新兴技术委员会委员、IEEE Access 期刊编委、悉尼科技大学客座研究员。
     
    :本网页只列出与《信用评分》课程相关的章节视频,其他更多内容或需要完整修完《数据挖掘:理论与算法》的同学请自行前往“学堂在线”平台学习。

  • 课程内容

    点击图标跳转学习视频

    博大精深,美不胜收

    第一节 整装待发

    第二节 学而不思则罔

    第三节 知行合一

    第四节 从数据到知识

    第五节 分类问题

    第六节 聚类及其他数据挖掘问题

    第七节 隐私保护与并行计算

    第八节 迷雾重重

    学习第二章

    抽丝剥茧,去伪存真

    第一节 数据清洗

    第二节 异常值与重复数据检测

    第三节 类型转换与采样

    第四节 数据描述与可视化

    第五节 特征选择

    第六节 主成分分析

    第七节 线性判别分析1

    第八节 线性判别分析2

    学习第三章

    意料之外,情理之中

    第一节 贝叶斯奇幻之旅

    第二节 朴素是一种美德

    第三节 数据、规则与树

    第四节 植树造林学问大

  • 学习资源

    有需要在线学习证书,或进一步学习其他章节的同学

    可选择学堂在线或B站网页免费在线学习

    学堂在线

    学堂在线

    B站

    Bilibili