跳到主要内容
 统计 & 数据科学

统计 & 数据科学

统计 & 数据科学(SDS)项目将整个学院有兴趣从数据中学习东西的教师和学生联系起来. 在澳门葡京博彩软件,学生们通过 doing课堂时间强调解决问题和与数据的实际接触. 许多课程采用学生驱动的项目,让学生在经济学等领域追求自己的兴趣, 心理学, 政治科学, sociology, 工程, biology, 环境科学, 神经科学和地质学.

部门更新

即将到来的会谈 & Lectures

统计 & 数据科学项目定期举办讲座 & 免费向公众开放的讲座. 假定没有事先接触过统计数据. 敬请关注 我们的活动页面 精彩的演讲即将到来!

断断续续的事件

请参阅 西方大众统计与数据科学会议 查看其他活动.

重复事件

亲自出席

这与澳门葡京博彩软件的核心身份和使命是一致的, 住宿学院, SDS确认学院政策(根据学院教务长和院长),学生将亲自上课. SDS课程不提供远程出勤选项. 被无障碍资源中心确定需要远程出勤住宿的学生将是此政策的唯一例外. 和其他美国残疾人法的规定一样, 请在上课的第一周通知你的老师,讨论我们如何满足你的住宿要求.

需求 & Courses

统计与数据科学专业目标

  • 识别和使用各种数据类型(包括, 但不限于, 分类, numerical, text, 空间和时间)和格式(例如.g. CSV, XML, JSON,关系数据库,音频,视频等.). 
  • 从具有各种大小和格式的数据集中提取有意义的信息.
  • 拟合和解释统计模型,包括但不限于线性回归模型. 使用模型进行预测, 评估这些模型的有效性和预测的准确性.
  • 了解不同研究方法的优势和局限性, 分析和解释数据. 能够为各种目的设计研究.
  • 注意并解释不确定性在推论统计程序中的作用.
  • 阅读和理解研究报告中使用的数据分析. 在至少一门应用学科的研究项目中参与数据分析部分.
  • 使用至少一种高级编程语言的数据进行计算, 分析复杂数据集的能力证明了这一点.
  • 在多种语言和计算环境下工作.
  • 以书面形式传达定量信息, 对技术和非技术受众进行口头和图形形式的交流.
  • 评估基于数据的研究对社会的伦理影响, analyses, 以一种知情的方式使用技术. 使用资源, 比如专业指南, 院校评审委员会, 发表的研究, 告知道德责任.

统计与数据科学专业

需求

外加十门课程 SDS 100 

  1. SDS 100
  2. 五门基础及核心课程: 
    1. CSC 110 or CSC 120
    2. SDS 192
    3. MTH 211
    4. SDS 220 or SDS 201
    5. SDS 291
  3. 一门编程深度课程: SDS 270, SDS 271CSC 210, or CSC 294
  4. 一、统计学深度课程: SDS 290SDS 293MTH 320/ SDS 320 或SDS 390的主题
  5. 一个数据背景课程: SDS 109/ CSC 109FYS 189CSC 235/ SDS 235SDS 236 or SDS 237
  6. 一门应用领域课程. 学生和他们的指导老师应该尽早确定潜在的应用领域, 因为许多合适的课程都有先决条件. Normally, 这应在第四学期或专业申报时进行, 先到者为准. 一门课程是否满足要求将由学生的专业指导老师决定. 该要求通常由下列其中一项来满足:
    1. SDS 300的一个主题
    2. 研究研讨会(通常为300级)或至少两个学分的特殊研究. 通常,该领域将在数学、统计学和计算机科学之外.
    3. 另一专业的部门荣誉论文(通常不是MTH或CSC).
  7. 一个顶点课程: SDS 410
  8. 选修课(为满足10门课程的要求):前提是满足上述要求, 以上所列的任何一门课程都可以算作选修课,以达到10门课程的要求. 统计学和计算机科学的五门大学课程可以作为选修课. 此外,任何课程 与SDS交叉切片 可以算进专业的结业吗.
额外的指导方针 
  • 除了… SDS 192, SDS 201, SDS 220, SDS 291, and SDS 410 (或任何强制性的S/U课程), 学生可以将任何一门SDS课程从分级课程转到S/U课程. 如果学生在参加了S/U评分选项的核心课程后,从SDS辅修转为SDS主修, 该课程将被视为该学生主修的一门S/U课程.
  • SDS 201 AP统计考试可能会被4分或5分取代吗. 用AP课程代替并不会减少主修或辅修课程的总课程数.
  • MTH 211 在特殊情况下可否以呈请取代.
  • 任何一个 ECO 220, GOV 203, PSY 201 or SOC 204 可以直接代替 SDS 220 不需要再选一门课,无论是主修还是辅修. Note that SDS 220 and ECO 220 需要微积分.
  • 请注意,应用领域课程的非100级先决条件将计入主要学分. 
  • 在课程许可的情况下,五所大学的同等学历可以代替.

数理统计专业

有关跨部门数理统计专业的信息可在 数学科学 目录页.

统计与数据科学辅修

需求

外加六门课程 SDS 100

  1. SDS 100
  2. 四门基础及核心课程: 
    1. CSC 110 or CSC 120
    2. SDS 192
    3. SDS 220 or SDS 201
    4. SDS 291
  3. 一门编程深度课程: SDS 270, SDS 271CSC 210, or CSC 294
  4. 一个数据背景课程: CSC 109/ SDS 109, FYS 189, CSC 235/ SDS 235, SDS 236 or SDS 237
  • 这三个要求是否应该少于六门课程来满足, SDS或CSC中任何算作主修课程的课程都可以算作辅修课程.
  • 一般情况下,辅修科目不超过一门S/U成绩课程. 
  • 如果学生在参加了S/U评分选项的核心课程后,从SDS辅修转为SDS主修, 该S/U将被视为该学生该专业的唯一S/U. 

应用统计学

应用统计学的跨部门辅修课程为学生提供了一个在学生感兴趣的应用领域中学习统计学的机会. 辅修课程的设计具有足够的灵活性,允许学生在许多可能的应用领域中进行选择.

需求

外加五门课程 SDS 100

  1. SDS 100
  2. 一门统计学入门课程: SDS 201SDS 220PSY 201ECO 220SOC 204 or GOV 203
  3. SDS 290 and SDS 291
  4. 两个应用领域课程. 学生和他们的指导老师应该尽早确定潜在的应用领域, 因为许多合适的课程都有先决条件. 课程是否满足要求将由学生的辅修导师决定. 该要求通常由以下两项来满足:
    1. SDS 300的一个主题
    2. 研究研讨会(通常为300级)或至少两个学分的特殊研究. 通常,该领域将在数学、统计学和计算机科学之外.
    3. 另一专业的部门荣誉论文(通常不是MTH或CSC).
  • 在满足学生专业要求的课程中, 辅修科目最多可选两门课程.
  • 只有一门统计学入门课程可以算在辅修课程中.
  • 一般情况下,辅修科目不超过一门S/U成绩课程.
  • 如果学生在参加了S/U评分选项的核心课程后,从SDS辅修转为SDS主修, 该S/U将被视为该学生该专业的唯一S/U. 
  • 在高中修过AP统计,AP统计考试成绩达到4或5分的学生, 或者在统计学方面有其他同等的准备, 不需要重复统计学入门课程, 但是他们必须完成五门课程.

Courses

SDS 100实验室:可重复科学计算与数据(1学分)

数据科学的实践依赖于培养负责任的数据使用和可重复的科学调查的计算环境. 本课程培养学生运用现代工作流程从事数据科学工作的能力, 开源工具和道德实践. 学生将学习如何用轻量级标记语言编写科学报告.g.,降价),包括代码(e.g., R),数据,图形,文本和其他媒体. 学生还将学习对数据科学中的道德实践进行推理. S/U only. 在下列任何一项需要同时注册: SDS 192, SDS 201, SDS 220, SDS 290 or SDS 291. 限制:已完成以下任何一项的学生不开放: SDS 192, SDS 201, SDS 220, SDS 290 or SDS 291. 报名人数限30人. 未注册必修课程的学生将不经通知而被退学.

秋天,春天

SDS 109/ CSC 109与数据通信(4学分)

Offered as SDS 109 and CSC 109. 世界越来越依赖于收集和分析信息来帮助人们做出决策. 正因为如此, 就数据进行有效沟通的能力是几乎所有学科未来就业前景的重要组成部分. 在本课程中, 学生将学习信息可视化的基础知识,并提高他们使用数据进行交流的技能. 本课程探讨决策的概念, 人类的感知, 色彩理论和讲故事在数据驱动的交流中的应用. 本课程帮助学生在如何与人谈论数据方面打下坚实的基础, 对于有抱负的数据科学家和想要学习新的信息呈现方式的学生. {M}

秋天,春天

SDS 192数据科学入门(4学分)

使用Python, R和SQL介绍数据科学. 学生们学习如何刮痧, process and clean data from the web; manipulate data in a variety of formats; contextualize variation in data; construct 点和区间估计 using resampling techniques; visualize multidimensional data; design accurate, clear and appropriate data graphics; create data maps and perform basic spatial analysis; and query large relational databases. 前提条件:并发注册 SDS 100 要求以前没有完成的学生 SDS 201, SDS 220, SDS 290 or SDS 291. {M}

秋天,春天

SDS - 201本科生统计方法(4学分)

(原MTH 201/ PSY 201). 概述本科研究所需的统计方法, 强调数据收集的方法, 数据描述和统计推断, 包括对研究设计的介绍, 置信区间, 测试假说, 方差分析和回归分析. 讨论了定量数据和分类数据的分析技术. 强调应用程序,学生使用R进行数据分析. 本课程满足心理学专业的基本要求. 参加过 MTH 111 或者同等的 SDS 220,这也满足了基本要求. 前提条件:并发注册 SDS 100 需要学生谁还没有完成 SDS 192, SDS 220, SDS 290 or SDS 291. 限制:学生通常只能修一门以上的课程: ECO 220, GOV 203, MTH 220; PSY 201, SDS 201, SDS 220 or SOC 204. 名额限制:40人. {M}

秋天,春天

SDS 220概论概率与统计(4学分)

(原MTH 220/SDS 220). 面向应用的现代统计推断导论:研究设计, 描述性统计, 随机变量, 概率和抽样分布, 点和区间估计, 假设测试, 重采样过程, 多元回归. 广泛应用于自然科学和社会科学. 本课程满足生物科学的基本要求, 工程, 环境科学, 神经科学, 和心理学. 先决条件: MTH 111,或同等; SDS 100 必须同时修读尚未修毕的 SDS 192, SDS 201, SDS 290 or SDS 291. 限制:学生通常只能修一门以上的课程: ECO 220, GOV 203, MTH 220; PSY 201, SDS 201, SDS 220 or SOC 204. 名额限制:40人. {M}

秋天,春天

SDS 235/ CSC 235视觉分析(4学分)

Offered as CSC 235 and SDS 235. 可视化分析技术可以帮助人们从海量数据中获得洞察力, dynamic, 模棱两可且经常相互矛盾的数据. 在本课程中, 学生学习新兴的基础知识, 视觉分析的多学科领域,并将这些技术应用于个人兴趣领域的重点研究问题. 选择将本课程作为编程强化课程的学生应该之前学习过CSC 212. 在这个轨道上, 学生学习使用R, Python和HTML5/JavaScript开发自定义可视化分析工具. 喜欢非编程密集课程的学生可以选择使用现有的可视化分析软件, 例如Tableau或Plotly. 名称:理论,编程. 先决条件: CSC 120 或同等. {M}

秋天,春天,变化无常

SDS 236数据新闻(4学分)

数据新闻是用数据讲述故事的实践. 本课程将侧重于新闻实践, 将数据作为来源进行访谈, 并在上下文中解释结果. 我们将讨论在新闻语境中观众的重要性, 并将着重于变异和偏差的统计概念. 本课程将包括数据的实际操作, 使用适当的计算工具,如R, Python, 和数据api. 此外,我们将探索使用可视化和讲故事的工具,如Tableau,情节.ly, and D3. 不需要编程或新闻方面的经验. 先决条件:统计学入门课程(包括 SDS 220, SOC 204, GOV 203, ECO 220, PSY 201). 报名人数限20人. WI {M}

秋天,春天,变化无常

SDS 237数据人种学(4学分)

本课程介绍数据人种学的理论与实践, 演示如何使用定性数据收集和分析来研究数据设置和工件. 学生将学习野外笔记写作技巧, 参与观察, 深入的采访, 文献分析和档案研究,以及如何将它们用于数据集的文化基础背景化. 学生将学习如何在R中以突出其社会政治来源的方式可视化数据集. 学生还将学习如何利用民族志方法来改进数据记录和交流. 本课程将介绍有关技术科学实地考察的政治辩论. 推荐的先决条件: SDS 192. 名额限制:40人. {S}

秋天,春天

SDS 238社区数据科学(4学分)

本课程介绍以人为本的设计和设计公正的概念, 考虑如何将他们的原则应用于基于社区的数据科学工作. 学生们学习如何定义社会问题, 与利益相关者, 设计数据科学解决方案, 评估社会影响. 学生还将学习协作数据科学项目规划和执行的技术, 采用最佳实践(例如.g. 版本控制和代码审查)在基于社区的数据科学项目的背景下. 有效沟通项目方法的策略, outcomes, 影响将贯穿整个课程. 报名人数限24人.

秋天,春天,隔年

SDS 270数据科学编程(4学分)

这门课不是关于数据分析的,而是, 学生将深入学习R编程语言. 主题可能包括数据结构, 控制流, 正则表达式, functions, 环境, 函数式编程, 面向对象编程, debugging, testing, 版本控制, 文档, 文学编程, 代码审查和包开发. 本课程的主要目标是为一个可行的, 协作, 开源, 可发布的R包. 先决条件: SDS 192 and CSC 110,或同等. 名额限制:40人. {M}

秋天,春天

SDS 271数据科学Python编程(4学分)

本课程涵盖了处理所需的技能和工具, 使用Python分析和可视化数据,并在协作项目中工作. 主题包括Python中的函数式和面向对象编程, Pandas中的数据争用, 可视化在Matplotlib在seaborn, 以及创建可重现的工作流:调试, 测试和记录程序, 有效地使用版本控制. 本课程的主要目标是创建一个可行的, 像Python包索引(PyPI)中的那些开源Python包. 先决条件: SDS 192 and CSC 110. 名额限制:40人. (E) {M}

秋天,春天,变化无常

SDS 290研究设计与分析(4学分)

(原m /SDS 290). 对科学研究所需的统计方法的调查, 包括规划数据收集和数据分析,为研究假设提供证据. 这门课程可以包括方差分析的内容, 的相互作用, contrasts, 多重比较, 多元回归, 因子分析, 观察性和随机研究的因果推理以及显示数据的图形方法. 特别注意分析学生项目的数据,如论文和专题研究. 统计软件用于数据分析. 前提条件:下列之一: PSY 201, SDS 201, GOV 203, ECO 220, SDS 220 or a score of 4 or 5 on the AP 统计数据 examination or the equivalent; concurrent registration in SDS 100 需要学生谁还没有完成 SDS 192, SDS 201, SDS 220 or SDS 291. 名额限制:40人. {M}

秋天,春天

SDS 291多元回归(4学分)

(原MTH 291/ SDS 291). 回归技术的理论和应用:线性和非线性多元回归模型, 残差及影响分析, 相关, 协方差分析, 指标变量与时间序列分析. 本课程包括选择方法, fitting, 评估和比较统计模型,并分析取自自然的数据集, 物理与社会科学. 先决条件: SDS 201, PSY 201, GOV 203, SDS 220, ECO 220 或同等 or a score of 4 or 5 on the AP 统计数据 examination; concurrent registration in SDS 100 需要学生谁还没有完成 SDS 192, 201, 220 or 290. 名额限制:40人. {M}{N}

秋天,春天

SDS 293机器学习建模(4学分)

在“大数据”时代,统计模型变得越来越复杂. 本课程从线性回归模型开始,向学生介绍从数据中学习的各种技术, 以及评估和比较模型的原则方法. 主题包括偏方差权衡, 重新采样和交叉验证, 线性模型选择和正则化, 分类和回归树, bagging, boosting, 随机森林, 支持向量机, 广义加性模型, 主成分分析, 无监督学习和k-means聚类. 重点放在统计计算的高级语言(如.g. R或Python). 先决条件: SDS 291 and MTH 211 (MTH 211 可能并发). 名额限制:40人. {M}

秋天,春天,每年

SDS 300di研讨会:统计和数据科学应用的主题-残疾包容和数据分析(4学分)

学生将学习残疾的社会模式和批判性残疾理论,以及研究的设计和过程, 并参与一个研究项目,分析残疾包容的公共数据. 本课程涵盖的统计方法可能包括逻辑回归, 多变量分析, 因子分析, etc. 学生需要向期刊提交他们的期末项目, 在学期结束前参加会议或比赛. 先决条件: SDS 201, SDS 220 or ECO 220. 限制:仅限大三和大四学生. 报名人数限15人. 需要教练许可. {M}

秋天,春天,变化无常

SDS 300fs研讨会:统计学和数据科学的应用-通过参与数据了解食品系统(4学分)

本课程探讨全球粮食系统, 以美国为重点, 通过对既定数据的检验,用于研究系统并提出食品政策建议. 在美国, 美国农业部(USDA)监管着大部分食品系统, 促进食品和调节健康影响. In general, 这些系统的运行会产生大量的数据, 其中大部分是在大型开放或半开放的在线数据库中. 研究人员和政策制定者利用这些数据库来帮助他们做出决策. 本课程旨在使学生熟悉数据及其用途. 先决条件: SDS 201 or SDS 220. 限制:仅限大三和大四学生. 报名人数限15人. 需要教练许可. {M}{S}

秋天,春天,隔年

SDS 320/ MTH 320数理统计(4学分)

Offered as MTH 320 and SDS 320. 介绍统计学的数学理论以及该理论在现实世界中的应用. 讨论包括随机变量的函数, 估计, 似然和贝叶斯方法, 假设检验和线性模型. 先决条件:统计学入门课程; MTH 212 and MTH 246,或同等. 报名人数限20人. {M}

Spring

SDS 338/ GOV 338政治网络研究研讨会(4学分)

Offered as GOV 338 and SDS 338. 一个国家、政治家或利益集团的行为如何影响他人的行为? 马萨诸塞州将娱乐用大麻合法化的决定会影响佛蒙特州的大麻政策吗? 从宣战到决定谁是国会议员的投票联盟, 社会科学家越来越多地通过政治网络来认识世界的相互联系. 本课程介绍社会网络分析的基本要素,以及如何将其应用于美国政治. 先决条件: SDS 220 或者同等的统计学入门课程. 限制:仅限大三和大四学生. 报名人数限12人. 需要教练许可. {S}

秋天,春天,隔年

SDS 364/ PSY 364研究研讨会:群体间关系(4学分)

Offered as PSY 364 and SDS 364. 研究群体间关系,探索用于研究混合人际互动的理论和统计模型. 研究项目的例子包括检查性物化对女性和男性的影响, 种族间互动中的同理心准确性与家庭劳动中的性别不平等. 各种技能包括, 但不限于, 文献综述, 研究设计, 数据收集, 测量评价, 先进的数据分析和科学写作的发展. 先决条件: PSY 201, SDS 201, SDS 220 或同等; and PSY 202. 限制:仅限大三和大四学生. 报名人数限12人. 需要教练许可. {M}{N}{S}

秋天,春天,隔年

SDS 390be统计与数据科学主题-生物统计学和流行病学方法(4学分)

流行病学涉及人群中疾病的分布和决定因素, 而生物统计学侧重于统计方法的发展和应用,以广泛的主题在生物学, 医学和公共卫生. 本课程着重于流行病学的基本概念, 包括关联措施和常见流行病学研究设计, 以及公共卫生数据的统计方法. 讨论包括分类数据分析(列联表分析), 多项式回归, 序数回归和泊松回归)和生存分析(Kaplan-Meier估计和Cox比例风险模型). 不需要生物学背景. 先决条件: SDS 291 and [MTH 112 or (MTH 111 and MTH 153)]. 限制:SDS 390可参加3次不同主题的考试. 报名人数限30人. {M}

秋天,春天,变化无常

统计与数据科学主题-分类数据分析(4学分)

分类数据分析统计方法的理论与应用. 本课程概述了分析离散数据(包括二进制数据)的统计方法, 多项和计数响应变量. 考虑了标称和序数响应. 讨论可能包括列联表和卡方分析, logistic, 泊松和负二项回归模型. 使用R统计软件. 先决条件: SDS 291 or SDS 290 或同等. 限制:SDS 390可参加3次不同主题的考试. 报名人数限30人.

秋天,春天,变化无常

SDS 400特殊研究(1-4学分)

通常是大三和大四的学生. 需要教练许可.

秋天,春天

SDS 410统计学顶点 & 数据科学(4学分)

这一学期的课程利用学生以前的课程来解决现实世界的数据分析问题. 学生在由学术界、政府或工业界赞助的项目中进行团队合作. 发展的专业技能包括:道德, 项目管理, 协同软件开发, 文档和咨询. 定期团队会议, 每周进度报告, 中期及最终报告, 并且需要多次演示. 仅对统计和数据科学专业开放. 先决条件: SDS 192, SDS 291 和CSC 111. 限制:仅限统计和数据科学专业. 报名人数限20人. 需要教练许可. {M}

秋天,春天

SDS 430D荣誉论文(4学分)

需要部门许可.

秋天,春天

Crosslisted课程 

CSC 235/ SDS 235视觉分析(4学分)

Offered as CSC 235 and SDS 235. 可视化分析技术可以帮助人们从海量数据中获得洞察力, dynamic, 模棱两可且经常相互矛盾的数据. 在本课程中, 学生学习新兴的基础知识, 视觉分析的多学科领域,并将这些技术应用于个人兴趣领域的重点研究问题. 选择将本课程作为编程强化课程的学生应该之前学习过CSC 212. 在这个轨道上, 学生学习使用R, Python和HTML5/JavaScript开发自定义可视化分析工具. 喜欢非编程密集课程的学生可以选择使用现有的可视化分析软件, 例如Tableau或Plotly. 名称:理论,编程. 先决条件: CSC 120 或同等. {M}

秋天,春天,变化无常

CSC 252算法(4学分)

涵盖算法设计技术(“分而治之”),动态规划, “贪心”算法, etc.), 分析技术(包括大0符号), 递推关系), 有用的数据结构(包括堆), 搜索树, 邻接列表), 各种问题的有效算法和np完备性. 名称:理论. 先决条件: CSC 210, MTH 111 and MTH 153. 报名人数限30人. {M}

秋天,春天,隔年

计算机器学习(4学分)

从编程角度介绍机器学习. 培养学生对基本机器学习概念(包括欠拟合/过拟合)的理解, 模型复杂性的度量, 训练/测试集分割和交叉验证), 但明确关注机器学习系统设计(包括评估算法复杂性和编程架构的开发)和大规模机器学习. 通过包括决策树在内的一系列机器学习方法,演示了监督学习和无监督学习的原理, 再邻居, 集成方法和神经网络/深度学习, 以及降维, 聚类和推荐系统. 学生实现经典的机器学习技术,包括梯度下降. 名称:理论,编程. 先决条件: CSC 210, CSC 250, (MTH 112 or MTH 211),以及Python知识. 名额限制:40人. {M}

秋天,春天,每年

CSC 325研讨会:负责任的计算(4学分)

什么时候颠覆是好的? 谁负责确保一项创新产生积极的影响? 这些影响是否被公平地分享? 如果存在偏见,如何从算法中消除呢? 谁能对自己开发的技术做出什么保证呢? 职业道德的局限性是什么? 这个研讨会探讨了道德含义(例如.e.(伦理学、正义、政治哲学)计算和自动化. 参与者探索如何负责任地设计技术,同时为进步和增长做出贡献. Discussions include: intellectual property; privacy, security and freedom of information; automation; globalization; access to technology; artificial intelligence; mass society; and emerging issues. 先决条件: CSC 210. 限制:仅限大三和大四学生. 报名人数限12人. 需要教练许可. {S}

秋天,春天,变化无常

ECO 220统计与计量经济学概论(5学分)

总结,解释和分析经验数据. 注意描述性统计和统计推断. 主题包括基本抽样, 概率, 抽样分布, 估计, 假设检验与回归. 作业包括使用统计软件分析劳动力市场和其他经济数据. 先决条件: ECO 150 or ECO 153. 限制:学生通常只能修一门以上的课程: ECO 220, GOV 203, MTH 220; PSY 201, SDS 201, SDS 220 or SOC 204. 报名人数限55人. {M}{S}

秋天,春天,每年

ECO 240计量经济学(4学分)

本课程介绍计量经济学的基本原理以及用于呈现和分析经济数据的方法. 统计方法的知识对于理解和批判性地评估许多关于经济和社会政策的文章是必不可少的. 本课程的主要目标是让您将其作为实证研究的知情和关键消费者,并具有进行自己原创实证研究的基本技能. 先决条件: ECO 150, ECO 153, MTH 111 ,要么 ECO 220, SDS 220 or SDS 291. {M}{S}

秋天,春天,每年

FYS 189数据与社会正义(4学分)

学生们研究影响可用性的社会政治力量, 关于各种社会正义问题的数据结构和治理. 学生将学习数据呈现技术,使数据生产的背景更加突出,并对不同的社区负责. 关于卫生公平的数据集, 住房正义, 研究了环境正义和刑事正义, 分析和可视化. 学生识别参与数据生产的机构和利益相关者, 解开激活数据语义的既得利益, 考虑在数据结构中删除了哪些人和哪些问题,并评估数据科学家在计划数据表示时所面临的道德权衡. Restrictions: First years only; students are limited to one first-year seminar. 报名人数限16人. WI {S}

秋天,春天,变化无常

政治学的实证方法(5学分)

总结、解释和分析经验数据的基本问题. 讨论包括研究设计和测量, 描述性统计, sampling, 测试的意义, 相关与回归. 特别注意调查数据和使用计算机软件进行数据分析. 限制:学生通常只能修一门以上的课程: ECO 220, GOV 203, MTH 220; PSY 201, SDS 201, SDS 220 or SOC 204. 名额限制:75人. {M}{S}

Spring

GOV 338/ SDS 338政治网络研究研讨会(4学分)

Offered as GOV 338 and SDS 338. 一个国家、政治家或利益集团的行为如何影响他人的行为? 马萨诸塞州将娱乐用大麻合法化的决定会影响佛蒙特州的大麻政策吗? 从宣战到决定谁是国会议员的投票联盟, 社会科学家越来越多地通过政治网络来认识世界的相互联系. 本课程介绍社会网络分析的基本要素,以及如何将其应用于美国政治. 先决条件: SDS 220 或者同等的统计学入门课程. 限制:仅限大三和大四学生. 报名人数限12人. 需要教练许可. {S}

秋天,春天,隔年

MTH 246概率(4学分)

概率论, 包括组合概率, 随机变量, 离散和连续分布. 先决条件: MTH 153 and MTH 212 (可同时修读)或同等学历. {M}

Fall

MTH 320/ SDS 320数理统计(4学分)

Offered as MTH 320 and SDS 320. 介绍统计学的数学理论以及该理论在现实世界中的应用. 讨论包括随机变量的函数, 估计, 似然和贝叶斯方法, 假设检验和线性模型. 先决条件:统计学入门课程; MTH 212 and MTH 246,或同等. 报名人数限20人. {M}

Spring

深度学习数学(4学分)

人工智能(AI)的发展与整个社会对人类体验的前所未有的重塑息息相关, 影响艺术, literature, science, politics, commerce, law, education, etc. 尽管有这些后果,但对人工智能的理解大多是经验性的. 最近,深度学习的知识状态被比作炼金术之类的伪科学. 这方面的进展依赖于真正的跨学科方法,这些方法同样来自数学, 计算机科学, 统计与数据科学. 课程目标是:(1)理解深度学习的数学基础, (2)熟练运用数学工具分析深度学习算法, (3)应用数学概念实现深度学习的实际应用. 不推荐给一年级学生. 先决条件: MTH 211 and MTH 212. 报名人数限12人. {M}

秋天,春天,变化无常

本科研究统计方法(5学分)

概述本科研究所需的统计方法,强调数据收集的方法, 数据描述和统计推断,包括研究设计的介绍, 置信区间, 测试假说, 方差分析和回归分析. 讨论了定量数据和分类数据的分析技术. 强调应用,学生使用R和其他统计软件进行数据分析. 本课程满足心理学专业的基础要求. 参加过 MTH 111 或同等学历或修过AP STAT的学生都应该修 SDS 220,也符合专业要求. 限制:学生通常只能修一门以上的课程: ECO 220, GOV 203, MTH 220; PSY 201, SDS 201, SDS 220 or SOC 204. 名额限制:40人. {M}

秋天,春天,变化无常

PSY 364/ SDS 364研究研讨会:群体间关系(4学分)

Offered as PSY 364 and SDS 364. 研究群体间关系,探索用于研究混合人际互动的理论和统计模型. 研究项目的例子包括检查性物化对女性和男性的影响, 种族间互动中的同理心准确性与家庭劳动中的性别不平等. 各种技能包括, 但不限于, 文献综述, 研究设计, 数据收集, 测量评价, 先进的数据分析和科学写作的发展. 先决条件: PSY 201, SDS 201, SDS 220 或同等; and PSY 202. 限制:仅限大三和大四学生. 报名人数限12人. 需要教练许可. {M}{N}{S}

秋天,春天,隔年

SOC 204社会学统计与定量研究方法(5学分)

这门基于项目的课程涵盖了社会学数据分析的统计学研究,以及更广泛的社会学定量研究方法的研究. 统计学的主题包括描述性统计, 概率论, 相关, 演绎与归纳, 误差和偏差, 置信区间和简单线性回归. 研究方法的主题包括实证主义, 研究设计, 测量, 抽样方法和调查设计. 所有学生都参加了一个强调使用计算机软件分析真实数据的实验室. 学生在本学期的课程中设计并完成一项调查研究项目. 先决条件: SOC 101. 限制:学生通常只能修一门以上的课程: ECO 220, GOV 203, MTH 220; PSY 201, SDS 201, SDS 220 or SOC 204. 名额限制:40人. {M}{S}

Fall

其他节目信息

澳门葡京博彩软件的学生有可能在五年内获得马萨诸塞大学阿默斯特分校的统计学硕士学位(四年在澳门葡京博彩软件,一年在马萨诸塞大学)。, 通过 统计学硕士课程第5年. 感兴趣的学生应咨询项目主任.

有兴趣从事统计或数据科学研究生工作的学生应该咨询他们的主要顾问,以计划适当的课程学习. 无论哪种情况, 扎实的数学基础(微积分), II, and III, 以及线性代数)是必不可少的.

统计学研究生课程

ASA维持 一些研究生项目的列表 在统计数据中,可以帮助你找到适合你需要的选项.

数据科学研究生课程

作为一门较新的学科,数据科学项目仍处于起步阶段. ASA维护一个列表 “大数据”研究生课程尽管这不应该与数据科学混为一谈. A more 数据科学学位课程的综合列表 是由数据科学维护的吗.community.

Advisers

Benjamin Baumer, Shiya Cao, 凯特林的厨师, 兰迪加西亚, Albert Y. Kim, 凯瑟琳金奈尔德, 斯科特拉康姆猪, 林赛地方. 

选择你的顾问

如果您希望申报SDS专业或辅修专业并需要指导老师,请填写以下表格 SDS主要/次要顾问申请表.

对统计学博士课程感兴趣的学生应该考虑 数理统计专业 由SDS和MTH联合运营.

我们最近送学生去的项目已经满足了主要要求:

  1. 爱丁堡大学 

  2. 伦敦经济学院

  3. 奥克兰大学

  4. 说哥本哈根

  5. PRESHCO (Programa de studios Hispánicos en Córdoba)
    语言要求-西班牙语

MST专业:

  1. CIMAT-墨西哥瓜纳华托的数学和统计学课程
    英语授课课程

  2. 布达佩斯数学学期

有关留学的更多信息,请参阅澳门葡京博彩软件 留学页面 或联系SDS留学顾问, 斯科特拉康姆猪.

在AP统计考试中获得4或5分的学生应该参加SDS 290(研究设计和分析)或SDS 291(多元回归)。.

其他课程信息

请参阅 在线课程目录的SDS部分 获取最新信息.

选择第一门统计学课程

希望学习统计学的学生可以根据以下指导方针来安排自己.

在大学里学过微积分或离散数学的学生应该从概率论开始 & 统计学(SDS 220或SDS 201, 5学分). 这是生物科学专业推荐的统计学课程, 满足工程基础要求, 环境科学, 神经科学和心理学. 这也是没有参加AP统计学考试的学生的推荐课程, 或成绩在3分或以下. ECO 220也是这一通用水平的课程.

有四年高中数学(但很少或没有微积分)的学生应该选择SDS 201或PSY 201(本科生统计方法)。. SDS - 201也满足心理学的基础要求. 这个级别的其他入门课程包括GOV 203和SOC 201.

准备较少的学生应选择SDS 107(统计思维)或SDS 109(与数据沟通).

在AP统计考试中获得4或5分的学生应该参加SDS 290(研究设计和分析)或SDS 291(回归分析)。.

统计数据消失(EGR专业)

请参阅 Picker工程专业指导方针.

通过该计划提供的课程

  • SDS 107:统计思维
  • CSC/SDS 109:与数据通信
  • FYS 189:数据与社会正义
  • SDS 192:数据科学导论
  • SDS 201:本科生统计方法
  • SDS 220:概率论和统计学
  • CSC/SDS 235:可视化分析
  • SDS 236:数据新闻
  • SDS 237:数据人种学
  • SDS 270: R数据科学编程
  • SDS 271: Python数据科学编程
  • SDS 290:研究设计和分析
  • SDS 291:多元回归
  • SDS 293:机器学习建模
  • SDS 300:统计学应用 & 数据科学
  • MTH/SDS 320:数理统计
  • GOV/SDS 338:政治网络研究讨论会
  • CSC/SDS 352:并行和分布式计算
  • CSC/SDS 354:研讨会:音乐信息检索
  • PSY/SDS 364:研究小组间关系研讨会
  • SDS 390:统计学主题 & 数据科学
  • SDS 400:特殊研究
  • SDS 430D:荣誉论文
  • SDS 410:顶点

其它课程

  • CSC 111:通过编程介绍计算机科学
  • CSC/MTH 205:科学建模
  • 第211课:线性代数
  • MTH 246:概率
  • ast200:天文数据科学
  • CSC 212:数据结构编程
  • CSC 230:数据库系统概论
  • CSC 252:算法
  • CSC 256:智能用户界面
  • CSC 290:人工智能
  • CSC 294:计算机器学习
  • CSC 330:数据库系统
  • CSC 390:人工智能研讨会

本页旨在提供帮助 EGR技术专业 和他们的顾问在其他大学寻找合适的课程,以满足EGR专业的统计学要求. 它补充了2017年2月20日发给EGR教员的备忘录. 正如备忘录中所指出的,“在其他地方学习的课程的等效性是由...[a] SDS计划的合格成员.” Herein, 我们描述了用于确定等效性的标准,以提高透明度并确保所有人的统一体验.

本署采用下列准则,以核实为符合废气排放规例专业的统计要求而修读的课程(以下简称“课程”)是否符合要求:

  • 严格性:课程必须达到或高于 rigor SDS 220. 这是主要的标准.
  • 统计推理:课程必须包括 统计 比如假设检验、置信区间和回归——不仅仅是 概率 比如随机变量、分布和期望值.

例外:在AP统计考试中获得4或5分的学生可以免除这些要求. 他们可以通过学习概率或统计学的非入门课程来满足他们的统计学要求.g.、MTH 246、SDS 290、SDS 291、SDS 293等.).

SDS教师将使用以下问题来指导他们对课程是否符合上述标准的思考. 通常,替代课程将满足所有或几乎所有这些问题.

  • 课程是否涵盖SDS 220描述中列出的大部分或全部主题?
    • 面向应用的现代统计推断导论:研究设计, 描述性统计; 随机变量; 概率和抽样分布; 点和区间估计; 假设测试, 重采样程序和多元回归.
  • 课程是否包括线性回归作为教学大纲的主题?
  • 当然课程是否使用综合教材?
  • 课程是否包括任何先决条件.g.(微积分)表明数学的成熟?
  • 课程是统计实践(如SDS 220),而不仅仅是统计概念(如SDS 107)吗??
  • COURSE是否明确提到使用像R这样的统计计算环境, SPSS, Stata, JMP或SAS(即, Excel或TI计算器之外的东西)?
  • 课程名称或教科书中是否包含“商业”一词? 澳门葡京博彩软件不给商业课程加分.

EGR专业的学生应该首先查阅这个页面, 然后把教学大纲(最好是电子版的)交给 SDS留学顾问. 虽然SDS 220是一门5学分的课程,但学分的多少并不是决定因素.

曾获批准的课程一览表

我们提供了一份以前批准的课程列表,仅供参考. 课程会随着时间的推移而变化,也会因讲师的不同而不同——学生应该明白,仅仅因为一门课程在过去被批准过,并不保证它在未来也会被批准.

以前批准

先前未获批准

  • STAT 240, UMass
    • 本课程被认为等同于SDS 201,后者是 NOT 满足EGR的统计要求. 还要注意STAT 240只有3个学分,而SDS 220是5个学分. 
  • ECE 214:概论概率和随机过程,马萨诸塞大学
    • 本课程将被视为相当于MTH 246. 注意Calc III要求.

Fall 2023

  • SDS 100: Reproducible Scientific Computing with Data (Casey Baumer; 将料斗; Nic Schwab)
  • FYS 189:数据与社会正义(林赛地方)
  • SDS 192:数据科学导论 (Shiya Cao; Jared Joseph; Jared Joseph)
  • SDS 201:入门统计(将料斗)
  • SDS 220:概率论和统计学 (丽贝卡Kurtz-Garcia; 丽贝卡Kurtz-Garcia; 斯科特拉康姆猪)
  • SDS 237:数据人种学(林赛地方)
  • MTH 246:概率(凯特琳·库克)
  • SDS 270:数据科学高级编程(Jared Joseph)
  • SDS 271: Python数据科学编程(Casey Berger)
  • SDS 291:多元回归 (凯特林的厨师; 将料斗)
  • SDS 300:残疾包容和数据分析(曹诗雅)
  • PSY/SDS 364:研究研讨会:组间关系(兰迪加西亚)
  • SDS 390:生态预测(Albert Y. Kim)
  • SDS 400:特殊研究
  • SDS 404:荣誉论文
  • SDS 410:凯普斯通(Albert Y. Kim)

2024年春季

  • SDS 100: Reproducible Scientific Computing with Data (Justin Baumann; 凯瑟琳金奈尔德; Nic Schwab)
  • SDS 192:数据科学导论 (Shiya Cao; Jared Joseph)
  • SDS 201:本科生统计方法(将料斗)
  • SDS 220:概率论和统计学(Albert Y. Kim; Albert Y. Kim; 丽贝卡Kurtz-Garcia)
  • SDS 270: R数据科学编程(Jared Joseph)
  • SDS 290:研究设计和分析(兰迪加西亚)
  • SDS 291:多元回归 (将料斗; 凯特林的厨师)
  • SDS 293:机器学习建模(凯瑟琳金奈尔德)
  • SDS 300:珊瑚礁保护的数据科学(Justin Baumann)
  • MTH/SDS 320:数理统计(丽贝卡Kurtz-Garcia)
  • SDS 390:生物统计学和流行病学方法(凯特林的厨师)
  • SDS 400:特殊研究
  • SDS 404:荣誉论文
  • SDS 410:顶点 (Shiya Cao)
从2012年到2022年,统计人员的就业预计将增长27%, 比所有职业的平均水平快得多. 预计增长将源于更广泛地使用统计分析来进行知情的业务, 医疗保健, 以及政策决定.
劳工统计局

Faculty

Shiya Cao

统计 & 数据科学

MassMutual统计与数据科学助理教授

将料斗

统计 & 数据科学

统计学讲师 & 数据科学

图像占位符

Ab Mosca

统计 & 数据科学

计算机科学与统计学客座助理教授 & 数据科学

林赛地方

统计 & 数据科学

统计学助理教授 & 数据科学

洁具王

统计 & 数据科学

统计学讲师 & 数据科学

Emeriti

凯瑟琳Halvorsen
数学与统计学名誉教授

研究助理

尼古拉斯•霍顿
统计研究助理 & 数据科学

项目委员会

香农Audley 
教育学副教授 & 儿童研究 

R. 乔丹·克劳斯 
计算机科学副教授 

格伦·埃利斯 
工程学教授 

Howard J. Gold
政府管理教授

Suzanne Z. Gottschang)
人类学及东亚研究教授

玛丽·哈林顿
生命科学Tippit教授(心理学)
 

媚兰卡洛琳
人类学副教授

Philip K. Peake
心理学教授 

科妮莉亚Pearsall
英语教授 & 文学

Marney普拉特
生物科学实验室讲师

苏珊·塞尔
经济学副教授

Vis Taraz
经济学助理教授

Terry-Ann克雷吉
经济学副教授
 

Resources

认为统计学就是计算事物? 再想想. 

统计学和数据科学领域的发展异常迅速. 随着科技不断重塑我们的世界, 越来越多的数据被收集到各种各样的主题上. 决策者们越来越相信这些数据是有用的. 然而,将数据转化为可操作信息的过程具有挑战性.

分析现代数据流, 政府机构, 非营利组织(ngo)和私营企业寻求具有技术技能(编程能力)的数据分析师。, 对数据和不确定性进行定量推理的能力, 较强的书面沟通能力, 口头和视觉形式). 拥有这些技能的人需求量很大.

统计学家 运用他们对数学和概率论的深刻理解来推理数据中的变化和不确定性. 例如, 如果一种药物在临床试验中被观察到对病人的预后有积极的影响, 考虑到样本量和数据收集方式的假设,这种影响是否足够大,足以证明这种药物确实有效? 统计学家建立、验证和解释模型. 他们设计实验,并与各行各业的科学家合作,对未知的数量做出精确的估计.

数据科学是一个结合数学元素的新兴领域, 统计学和计算机科学从数据中提取意义. 数据科学家处理大量、复杂、混乱和实时的数据源. 经常处理没有明确定义的问题, 数据科学家利用他们的创造力和技术能力深入挖掘“大数据”.“他们建立模型,做出预测,并开发静态和动态的方法来可视化数据.

澳门葡京博彩软件,统计学学生创造了 创新课堂活动,撰写了获奖论文,开发了复杂的统计软件,并为 制度研究处. 毕业生们找到了实习机会 美国国家标准与技术研究院 and the 纽约大都会队,雇用… Google麻省理工学院林肯实验室, and MassMutual的数据科学发展计划. 学生们也去读了研究生 加州大学伯克利分校, 哈佛大学公共卫生学院, 俄亥俄州立大学, and the 马萨诸塞大学.

Awards

统计 & 数据科学研究奖

该项目每年为在澳门葡京博彩软件大学期间进行杰出研究的SDS专业学生颁发奖项. 该学院每年春季开会,审查他们监督的研究项目,并选出获奖者, 谁会在毕业典礼前一天的年度颁奖典礼上得到通知.

Awardees

  • 2024:西尔维娅·宋24
  • 2023年:Quinn Alrise White '23
  • 2019年:Julianna Alvord '19
  • 2018:李文聪(Priscilla)
  • 2017:维嘉(织女星)张17
五项学院统计奖

The 五项大学统计 该奖项由五所学院自行决定,每所学院颁发一名学生. 该奖项可以颁发给符合以下任何一项标准的学生(基于该机构的教师投票):

  • 在统计学方面有杰出的独立研究、论文或顶点课程项目
  • 在校园(或跨校园)统计方面的杰出服务
  • 出色地利用了五所学院的统计资源
  • 在统计学方面继续深造的优秀非大四学生

Awardees

  • 2024: Christy Yang和Vicky Xu 
  • 2023:李世平 & Aushanae Haller, 23岁 
  • 2019年:邝玥19、李子贤19、刘静怡19(优秀高年级顶点项目)
  • 2018年:佩吉·帕特里克AC和鲁腾多·马齐沃19年(对统计的杰出贡献)
  • 2017: Abby Doctor ' 17(优秀高年级顶点项目)
  • 2016年:朱一文、艾玛·比彻姆(优秀论文)
  • 2015:维嘉(维嘉)张18(优秀非大四)
部门的荣誉

2019

2018

2017

比赛

五所大学的数据测试

DataFest 每年春天在马萨诸塞大学举办全国大学生数据分析竞赛吗, 在这个项目中,学生以五人为一组,从一个综合体中提取见解, 周末收集的数据颇具挑战性.

Smith最近的获奖作品

2023

  • 最佳小组(B组) 性感数据科学家:Sarah Branch’24, Yaretsy Castro, 25岁, 卡米拉·马尔多纳多,24岁, 苏丹塔尼24岁, 索尼娅·帕雷德斯23岁

2018

  • B组最佳:A-super-NOVA
    21岁的奥黛丽·伯廷,18岁的莱利·波斯,20岁的艾玛·利文斯顿,20岁的克拉拉·罗森伯格,20岁的卡拉·凡·艾伦

2017

  • 最佳展示:DataBest
    Zainab Aqdas Rizvi ' 18, subbashini Sridhar ' 18J, Ji Young Yun ' 18, Ji Wong Chung 18届和Van Nguyen 18届
  • 最佳统计解释:正态分布
    李子贤(19届),丁安琪(17届),艾比博士(17届),福田惠里娜(18届)和阿兰(19届)
  • 最佳商业洞察力:标准占卜
    20岁的伊莎贝拉·朱,19岁的卡斯·斯威尼,20岁的莎拉·阿伯维茨和20岁的加西亚·孙
大学生统计学专题竞赛 (USCLAP)

班级专题竞赛是为在入门或中级统计课程中进行专题研究的本科生而设. 提交给USCLAP竞赛的大多数项目都涉及使用现有统计技术分析真实数据. 学生可以选择进行研究的任何主题,学生可以使用现有数据或收集自己的数据.

Smith最近的获奖作品

2017

  • 第二名(入门统计): Erina Fukuda’18:影响电子游戏销售的因素
  • 第一名(中级统计)Angelica Estrada ' 18pb, 杰西卡·维特,18岁, Oumayma Koulouh ' 19:帮助红十字会预测多哥的洪水
  • 第二名(统计学第一课程): Ngoc (Angie) Dinh ' 17, Van Nguyen ' 18, Abby Doctor ' 17, Christine Yee ' 17:“What Are Your Odds ??:可视化健康结果的交互式Web应用程序
  • 第三名(统计学第二课程): Ji Won Chung ' 18, Zainab Rizvi, 18岁, subbashini Sridhar ' 18J, Ji Young Yun ' 18:一个商业机会:通过分析和预测模型瞄准Expedia的旅游套餐利基市场

2016

本科生科研项目竞赛 (USRESP)

研究项目竞赛是针对本科生进行的研究项目,这些研究项目来自于暑期研究项目等活动, 高级顶点课程研究项目, 独立研究项目(如.g.(独立研究),荣誉学院的研究项目,或班级研究项目的延伸. 一些提交给USRESP的是应用研究项目,使用现有的统计/分析技术来解决现实世界的问题, 哪些其他的涉及方法研究,包括统计应用或模拟研究评估不同的技术. 学生可以收集自己的数据或使用现有的数据,学生可以选择任何主题来学习.

Smith最近的获奖作品

2015

  • 2nd PlaceSara Stoudt ' 15: 美国大陆铀空间分布的地质统计模型

 是由国家统计荣誉协会和美国统计协会波士顿分会负责监管的 提名 每年春天从澳门葡京博彩软件那里. 我们还维护了 收件人的完整存档

最近加入澳门葡京博彩软件的学生包括:

  • O ' meara阿比盖尔
  • Amber Liu 
  • 奥黛丽金 
  • Betty Pu 
  • 布丽安娜马特奥 
  • 卡米拉·马尔多纳多·弗兰科 
  • Chi Qiu 
  • 鱼费舍尔 
  • 优雅的条
  • 格雷西亚Bareti
  • 杰克Brandano 
  • Jenny Ding 
  • Julia Ting 
  • 梅芙·泰勒·佩妮
  • 米歇尔Ruiz-Fuentes 
  • 尼娜埃尔南德斯 
  • Parunjodhi Munisamy 
  • 索菲娅Silovsky 
  • Tint that Ra Wun 
  • Zihe Tian 
  • 莫莉Zelloe 
  • My My Tran 
  • 奎因Chamblin 
  • 妮可Tresvalles 
  • 诺亚Gittelman-Egan 
  • 郁金香Daaboul 
  • Charavee Basnet Chettri 
  • Anaan Choudhury 
  • 贝亚特Knecht 
  • 个徐 
  • 阿比盖尔Paharsingh 
  • Hanna Lee 
  • Jeniah佛朗哥 
  • 苏丹塔尼 
  • 凯蒂·卡明斯

统计处联络处 & 数据科学

赖特厅226
澳门葡京博彩软件
北安普顿,MA 01063

Phone: 413-585-3520 Email: kdunphy@yingaf.com

此人名叫凯利丹菲 
管理协调员

Randi L. Garcia 
统计学项目主席 & 数据科学