经典大模型公开课第二季
- 【01】绪论|大模型技术与交叉应用
- 【02】神经网络与大模型基础(上)
- 【03】神经网络与大模型基础(下)
- 【04】大模型学习方法
- 【05】大模型前沿架构(上)
- 【06】大模型前沿架构(下)
- 【07】Hugging Face 生态
- 【08】大模型实战指导
- 【09】人类反馈强化学习
- 【10】多模态智能
- 【11】自主智能体(上)
- 【12】自主智能体(下)
- 【13】人工智能与安全伦理对齐
- 【14】人工智能与交叉学科(上)
- 【15】人工智能与交叉学科(下)
- 【16】大模型企业家访谈
时间 | 议程 | 回放链接 |
---|---|---|
2024.10.06 | SGLang Q4 planning Deepseek MLA 关于批处理和专家并行性的讨论 |
https://hcqnc.xetlk.com/s/3oOTt |
2024.09.22 | SGLang Q4 planning Double Sparsity for Fast Attention |
https://hcqnc.xetlk.com/s/xkK7Z |
直播时间 | 主讲人 | 主题 | 直播/回放观看链接 |
---|---|---|---|
2024.11.05 | 中科院自动化所和香港城市大学联合培养博士生林浩坤 | DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化 | https://hcqnc.xetlk.com/sl/2pnEgg |
2024.10.17 | 香港科技大学在读博士高深远 | GenAD & Vista:构建通用可泛化的自动驾驶世界模型 | https://hcqnc.xetlk.com/sl/1Cb2XV |
2024.10.14 | 南京大学智能科学与技术学院研究员、助理教授傅朝友 | VITA:开源交互式多模态基础大模型 | https://hcqnc.xetlk.com/sl/MRlyd |
2024.10.11 | 商汤科技算法实习生、香港科技大学准博士生黄雨石 | LLMC:大语言模型的量化基准 | https://hcqnc.xetlk.com/sl/4xORVG |
2024.09.26 | Eigent AI Founding Engineer、CAMEL AI开源多智能体框架核心贡献者范文栋 | 使用 CAMEL Agents 构建 GraphRAG 及应用实践 | https://hcqnc.xetlk.com/sl/2LsSi2 |
2024.09.23 | 智谱AI算法工程师,CogVideoX作者之一 张昱轩 | CogVideoX 视频生成开源模型上手实践 | https://hcqnc.xetlk.com/sl/1dh7nj |
2024.09.10 | 阿里巴巴通义实验室高级算法工程师、华东师范大学博士叶加博 | mPLUG-Owl3:探索长序列模型架构的通用多模态大模型 | https://hcqnc.xetlk.com/sl/1Rzc3o |
2024.09.03 | Databricks Mosaic Research研究科学家,斯坦福大学博士盛颖 | SGLang v0.2:面向 LLM 和 VLM 的快速、高效通用服务引擎 | https://hcqnc.xetlk.com/sl/3cwRoQ |
2024.08.26 | UC Berkeley 博士生曹诗怡 | S-LoRA:实现多 LoRA 大模型的高效并行化推理 | https://hcqnc.xetlk.com/sl/3QsnQA |
2024.08.14 | 麻省理工学院准博士生唐嘉铭 | AWQ:激活值感知的LLM低位权重量化 | https://hcqnc.xetlk.com/sl/ivCj5 |
2024.08.06 | 香港中文大学博士后王文海 | InternVL 2.0:通过渐进式策略扩展开源多模态大模型的性能边界 | https://hcqnc.xetlk.com/sl/221tNT |
2024.07.30 | 香港科技大学(广州)人工智能方向博士研究生杨帅 | SEED-Story:生成长篇图文故事的多模态大型语言模型 | https://hcqnc.xetlk.com/sl/3xzywr |
2024.07.23 | 华中科技大学博士生程天恒 | YOLO-World:基于视觉语言模型的实时开放词汇物体检测 | https://hcqnc.xetlk.com/sl/12dD2S |
2024.07.15 | 清华大学自然语言处理实验室博士生余天予 | MiniCPM-V:端侧可用的 GPT-4V 级多模态大模型 | https://hcqnc.xetlk.com/sl/30sK4y |
2024.07.11 | 阿里通义实验室高级算法专家徐海洋 | Mobile-Agent:基于多模态Agent架构的手机智能体 | https://hcqnc.xetlk.com/sl/34N5vR |
2024.07.08 | 北京航空航天大学博士生郑耀威 | LLaMA Factory:从预训练到RLHF,大模型高效训练框架 | https://hcqnc.xetlk.com/sl/4xFmvV |
2024.06.27 | 浙江大学硕士研究生董玉博 | VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架 | https://hcqnc.xetlk.com/sl/4z6PWd |
2024.06.17 | 香港大学MMLAB在读博士吴成岳 | LLaMA Pro:扩展Transformer块优化的大型语言模型继续预训练 | https://hcqnc.xetlk.com/sl/XKqHx |
2024.06.13 | 北京大学在读博士孟繁续 | PiSSA:收敛快、误差小的大模型参数高效微调方法 | https://hcqnc.xetlk.com/sl/1HYPXz |
2024.06.06 | 上海人工智能实验室青年研究员、OpenDriveLab具身智能方向负责人曾嘉博士 | 具身多模态大模型的视觉表征预训练研究 | https://hcqnc.xetlk.com/sl/2k4HMq |
2024.05.29 | 南洋理工大学 MMLab 实验室在读博士姜瑜铭 | VideoBooth:文本和图像提示共同驱动的视频生成 | https://hcqnc.xetlk.com/sl/1ogzQ4 |
2024.05.24 | 新加坡国立大学Research Fellow倪瑾杰 | Alchemy:混合评测数据集来拟合大语言模型的人类评估 | https://hcqnc.xetlk.com/sl/gFc4 |
2024.05.21 | 华南理工大学集合感知与智能实验室博士梁智灏 | 实时渲染 3DGS 中的反走样及逆渲染应用 | https://hcqnc.xetlk.com/sl/3qpJ8a |
2024.05.10 | 3D-VLA第一作者甄昊宇 | 3D-VLA:构建生成式三维具身世界模型 | https://hcqnc.xetlk.com/sl/3axJCI |
2024.04.24 | 香港中文大学在读博士李彦玮 | Mini-Gemini:挖掘多模态视觉语言大模型的潜力 | https://hcqnc.xetlk.com/sl/4aYFHd |
2024.04.19 | 加州大学洛杉矶分校在读博士洪逸宁 | 从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建 | https://hcqnc.xetlk.com/sl/28OAx8 |
2024.04.15 | 清华大学自然语言处理实验室(THUNLP)博士后钱忱 | ChatDev——大语言模型驱动的多智能体协作与演化 | https://hcqnc.xetlk.com/sl/dsPB6 |
2024.04.10 | 慕尼黑工业大学视觉计算实验室博士陈振宇 | SceneTex:高质量三维室内场景纹理图生成 | https://hcqnc.xetlk.com/sl/FD3Yf |
2024.03.02 | DeepFaceLab(累计60,000 +⭐️)作者小黑兔 InstantID(huggingface space周榜第一)作者王浩帆 剑桥大学计算机系在读博士Andi Zhang VBench 第一作者、南洋理工大学MMLab在读博士黄子琪 |
Sora迷思,AIGC的微积分时刻? | https://hcqnc.xetlk.com/sl/3aRykI |