解码DeepSeek“破圈”之力
探索人工智能技术明日世界
近日,DeepSeek风靡全球,其对算法、模型和系统等进行的系统级协同创新,通过众智和众力相互叠加成就了精彩成果,为迈向通用人工智能(AGI)的技术突破与挑战带来无限遐想,以开源开放加快了迈向全社会分享的普遍智能的步伐。为了让大家更好地理解DeepSeek在技术、应用与伦理交织演进下的革新性探索,深入了解DeepSeek的“破圈”与“扎根”,特推出DeepSeek系列专题线上公开课。
本期主题:DeepSeek模型优势:算力、成本角度解读
报告嘉宾:王则可研究员
浙江大学“百人计划”研究员,隶属于浙江大学计算机与科学技术学院人工智能研究所、人工智能协同创新中心。创建浙江大学 RC4ML实验室,主要研究方向是使用异构硬件搭建低成本、高性能人工智能大模型系统LoHan,曾获得2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖、华为火花奖、2023年度国际超算比赛IndySCC第一名。
报告摘要
随着DeepSeek等先进人工智能大模型的不断涌现,其在逻辑推理、数学计算、复杂问答任务等类人能力方面展现出了强大的潜力。然而,随之而来的算力成本问题,已成为制约人工智能大模型技术进步与商业化落地的核心瓶颈。本报告将深入解析算力的基本概念,梳理大模型对算力需求的特征,探讨DeepSeek在面对算力被卡脖子的国情下,如何与人工智能系统进行优化配合,并对未来发展趋势进行前瞻性展望。