DeepSeek那些事儿大模型与DeepSeek的技术原理及其应用

  • 科研动态
  • 2025年03月07日
  • DeepSeek那些事儿大模型与DeepSeek的技术原理及其应用 直播时间:2025年2月27日(周四)20:00 直播平台: 科学网APP https://weibo.com/l/wblive/p/show/1022:2321325138245112692744 (科学网微博直播间链接) 科学网微博 科学网视频号 【直播简介】 这些天,推理大模型DeepSeek

DeepSeek那些事儿大模型与DeepSeek的技术原理及其应用

DeepSeek那些事儿大模型与DeepSeek的技术原理及其应用

直播时间:2025年2月27日(周四)20:00

直播平台:

科学网APP

https://weibo.com/l/wblive/p/show/1022:2321325138245112692744

(科学网微博直播间链接)

科学网微博

科学网视频号

【直播简介】

这些天,推理大模型DeepSeek R1因其技术创新突破、超低训练成本、中文场景优化、开源生态赋能等优势,形成了现象级传播效应,火爆出圈,震惊中外。

本周,DeepSeek宣布要连续开源5个项目!再一次引发AI圈震动!

我们已经举办了两期DeepSeek系列讲座,受到了大家的热烈欢迎!本周四,DeepSeek系列讲座第三期来了,我们邀请了北京航空航天大学计算机学院长聘教授、博士生导师李舟军教授为我们带来《DeepSeek那些事--大模型与DeepSeek的技术原理及其应用》。

本次讲座将重点介绍了DeepSeek的技术原理,通用模型与推理模型的差异。然后介绍李教授团队在大模型应用及场景落地方面的一些实践工作。

同时,iCANX发起人,北京大学教授张海霞将于讲座后和李舟军教授展开对谈。

【李舟军教授简介】

北京航空航天大学计算机学院长聘教授,博士生导师,信息安全系主任,智能信息处理研究所副所长。学位委员会首届网络空间安全学科评议组成员,中国人工智能学会语言智能专委会副主任委员。

长期从事自然语言处理与人工智能、网络与信息安全等领域的研究工作,在包括SCI期刊和AAAI、IJCAI、ACL等国际会议上发表500余学术论文,得到国际同行专家的高度关注和大量引用(H-index54,总引用数12380,单篇最高引用637)。获ECIR2010最佳论文奖。先后获国内计算机软件界具重要影响的中创软件人才奖、军队院校育才银奖、全国优秀博士学位论文提名,2017年获北京市科学技术奖二等奖,2019年获吴文俊人工智能科学技术奖科技进步一等奖。并连续入选2023、2024年斯坦福大学发布的第六版全球前2%顶尖科学家年度科学影响力排行榜。

在人工智能、自然语言处理、文档智能、大模型及其应用等方面取得一系列重要研究成果,研制的相关系统已在相关部门与企业投入实际应用,社会与经济效益显著。

猜你喜欢